摘" 要:文章运用科学知识图谱可视化分析的方法,对2016—2023年期间智能合约的研究成果进行量化分析,发现智能合约的发文数量持续增长,研究者的群体规模在不断扩大,该主题的社会关注度和重要性在不断地提高。研究主题主要分布在区块链、漏洞检测、以太坊、访问控制、演化博弈、合同制度、代码漏洞、去中心化等探究热点。
关键词:智能合约;谱聚类分析;关键词共现;研究热点
中图分类号:TP301" 文献标识码:A" 文章编号:2096-4706(2024)11-0163-04
Hotspot Analysis of Smart Contract Keywords Clustering Based on CiteSpace
HE Feng
(Information School of Yunnan University of Finance and Economics, Kunming" 650224, China)
Abstract: This paper uses the method of scientific Knowledge Graph visualization analysis, analyzes quantitatively the research outcomes of smart contract from 2016 to 2023. It finds that the number of smart contract papers continues to grow, the group size of researchers continues to expand, and the social attention and importance of this topic is constantly increasing. The research topics are mainly distributed in blockchain, vulnerability detection, Ethereum, access control, evolutionary games, contract systems, code vulnerabilities, decentralization, and other research hotspots.
Keywords: smart contract; spectral clustering analysis; keywords co-occurrence; research hotspot
0" 引" 言
智能合约作为区块链当中的重要组成部分,在金融支付、证券交易、商业物流、医疗卫生、政务服务和博彩娱乐等各个领域起到了越来越重要的作用。它是一种自动化的合同,可以自动执行代码,并在区块链上记录每个操作。而这种自动执行和去中心化的特性,使得智能合约成为实现各种业务流程的理想工具。
智能合约(smart contract)作为一种两方或多方缔结并且具有法律效力的可执行计算机协议,于1994年被计算机学家和法学家Szabo [1]首次提出,他指出:“智能合约就是执行合约条款的可计算交易协议”,并且他认为计算机代码可以代替手工操作,从而进行自动化的复杂数字财产交易。但是,由于当时缺乏可信的执行环境,智能合约这一概念一直没有得到广泛地应用。直到区块链技术的出现,为智能合约提供了一个天然的去中心化、可信任且不可篡改的合约执行平台。因此,随着区块链技术的不断发展,也让智能合约拥有了更加广阔的发展空间。
1" 智能合约的特点
智能合约是一段可以在区块链平台上自动运行的代码,用于描述并且自动执行一份合约。而区块链的去中心化和数据的防篡改,决定了智能合约更加适合于在区块链上来实现。例如,在一个公平的游戏合约中,一旦参与者满足了合约中设置的获胜条件,合约便会自动地向参与者账户发放奖励。整个合约执行的过程不需要依赖于对任何第三方的信任,也不存在抵赖(不执行合约)或者欺骗(错误执行合约)的问题[2]。
相对于传统的纸质合约或者合同来言,智能合约作为一种在满足条件后自动履行承诺的合同,是通过程序代码手段来强制保证的。因此,在合同中的条件满足之后,相应的合同条款就会被强制缔结并自动执行,其缔结过程是:第一步,参与缔约的双方或多方用户商定后将共同合意制定成一份智能合约;第二步,该智能合约通过区块链网络向全球各个区块链的支点广播并存储;第三步,构建成功的智能合约等待条件达成后自动执行合约内容。
由于智能合约在区块链技术的发展中,不断发挥着重要的作用。因此,本文通过中国知网CNKI,以“篇名:智能合约(精确)”进行检索,并结合CiteSpace进行可视化分析,对智能合约研究热点和其未来研究趋势进行梳理,为智能合约的科学发展提供理论依据和合理参考。
2" 智能合约发展的基本格局
文献是进行科学研究的重要载体和交流平台,可以从中国知网CNKI上的文献发表量、核心作者和高产机构可以总体上把握智能合约发展的基本格局。
本文采取的是高级检索方式,以篇名:智能合约(精确)为主题定制检索,获取文献819篇,文献的时间跨度为2016年2月10日至2023年10月12日,然后分批导出这些文献,再导入到CiteSpace 6.2.R4(64-bit)Basic中进行分析。其中,2016—2022年期间,智能合约相关篇名研究的发文总量达668篇,发文数量持续增长,如图1所示。
在图1中可以得出,2016—2017年是智能合约研究的萌芽期,这时的发文量较少,但到了2017—2020这三年,是智能合约研究的高速期,这时的发文量呈现出逐年翻倍增长的势头,这表明了在区块链技术实践发展的过程中,出现了一系列的热点或问题,使得对智能合约研究有了越来越多的参与者。而到了2021—2023年,随着区域链应用的范围越来越广,无论是在法律上,还是在技术上和安全上,需要关注和考虑的因素也会更多,这使得对智能合约研究始终会保持在稳中有升的上涨势头中,这也反映出智能合约研究者的群体规模在不断扩大,该主题的社会关注度和重要性在不断地提高。
3" 核心作者群与高产机构
3.1" 谱聚类算法的含义
核心作者群与高产机构的产生需要使用聚类算法来实现。聚类(Clustering)是一种无监督学习的数据挖掘算法,它能将数据集划分为若干相似对象组成的多个组(group)或簇(cluster),从而使得同一组中对象间的相似度最大化,不同组中对象间的相似度最小化。也就是说,聚类能够很好地衡量不同数据源之间的相似性,自动把各个数据分类到不同的簇中。这也是人们常说的“物以类聚,人以群分”。
从形式化的角度来说,聚类是指假定样本集D = {x1,x2,…,xm}包含m个标记样本,每个样本xi(xi1;xi2;…;xin)是一个n维特征向量,则聚类算法将样本集D划分为k个不相交的簇{Cl l = 1,2,…,k},其中Cl′ ∩ l′≠1 Cl = ∅且 。相应地,我们用λj ∈ {1,2,…,k}表示样本xj的“簇标记”(cluster label),即xj ∈ Cλj。于是,聚类的结果就可以用包含m个元素的簇标记向量λ = (λ1;λ2;…;λm)来表示[3]。
聚类算法在其使用中,有其优缺点。其优点在于:
1)无监督学习:不需要对训练数据进行标注,这比较适用于无标签的数据集;2)灵活性:适用于各种数据类型和问题领域;3)可解释性:聚类结果可以帮助我们理解数据的内在结构和关系。4)原理较为简单,容易实现。比较适用于探索性数据分析;5)收敛速度较快。
其缺点在于:
1)初始参数敏感:聚类算法对初始参数的选择和数据的初始化敏感,初始值影响较大,对数据有一定的要求;2)聚类结果不确定:不一定总是能够反映出数据的真实分类,结果会时好时坏;3)聚类的结果在很大程度上取决于事先设定的参数(如类别,初始点等);4)对超参数比较敏感;5)在高维空间中,对距离度量和聚类结果的解释就会变得困难起来。
总之,聚类算法作为一种广泛使用的数据挖掘算法,有许多种不同的算法和计算方式,其性能也各有优劣。在这里,为了更好地解决高维数据的降维问题,使用的是谱聚类算法。
谱聚类作为一种聚类算法,它是基于图论的链接关系进行分析的,这使得它与传统的聚类算法(比如说K-means算法、EM数据迭代优化算法等)不同,因为后者只有在样本空间为凸时才有效,而谱聚类算法却可以解决样本空间不为凸的情况。
谱聚类中最重要的数学工具是拉普拉斯矩阵。
要实现谱聚类,就需要使用拉普拉斯矩阵把一个带权无向图分为两个或多个子图,并让子图最优化,使子图内部的内容尽量相似,子图之间的间距尽量更远,从而能够识别任意形状的样本空间且收敛于全局最解。谱聚类在利用样本数据的相似矩阵(即:拉普拉斯矩阵)进行特征分解后,对得到的特征向量进行了很好的聚类。因此,它就比较适用于CiteSpace中的共线图谱生成。
3.2" CiteSpace的谱聚类应用
CiteSpace自动聚类的实现是依据谱聚类算法。CiteSpace中的谱聚类算法有三种使用方式,分别是:title terms clusters(主题聚类)、indexing terms clusters(关键词聚类)和 abstract terms clusters(摘要聚类)。在这里,点击“All in One:clustering.optimizing layout and style”按钮,让CiteSpace自动进行优化选择,在三种聚类方式中优化选择一种,进行聚类分析,产生分布格局图。CiteSpace中的聚类是按共线图谱来进行调整的,只有在共线的基础上做深度研究,才能产生相应的聚类[4-10]。
通过分析机构、作者、机构和作者合作等情况,可以获知该领域中研究力量的分布格局,如图2和3所示。电子科技大学、北京邮电大学和兰州大学三所高校分别在2019年和2020年大量产出关于智能合约的学术论文,成为智能合约领域的高产机构,这也可以从图1中看出,2019—2020年是高速产出的阶段。而在核心作者群方面,则是胡凯-北京航空航天大学计算机学院、刘国伟-北京市经济和信息化局、朱岩-北京科技大学计算机与通信工程学院、李洁-北京物资学院信息学院、周润-国浩律师(重庆)事务所。这说明,多数核心作者主要是计算机行业和法律界的研究人员。
4" 智能合约研究的主题分布
为了对智能合约的主题分析进行深入的研究,可使用关键词共现来实现。因为它可以更好地预测和判断研究的发展方向和动态。通常,在共现图谱中,某关键词与其他关键词如果同时出现的频度和概率越高,就说明该关键词的中心性越强,就越是该阶段的研究热点。
而通过谱聚类算法所产生的高频关键词,产生自动的聚类后,形成以此为准的聚类分析视图,则可更好地研究该领域的知识结构,因为通过视图,能够形象地呈现出文献的分类情况和标签的顺序。
在这里,按2016—2020年和2011—2023年分为两个阶段,以Keywords进行节点聚类分析,效果如图4和5所示。
从图4中可以看出,在2016—2020年,所产生的关键词共现网络图谱,有224个节点和565条连线。由聚类节点图可以发现,节点最大的是“智能合约”。此外,部分聚类序号与聚类大小也有一定的关系,序号在前的聚类有些会大一些。相较于其他关键词,还有几个关键词的节点也较大:“区块链”“以太坊”“超级账本”“物联网”“去中心化”“法律规制”“数据共享”等。表明在这期间,这几个领域是智能合约探究的热点。
而从图5来看,在2021—2023年,所产生的关键词共现网络图谱,有248个节点和610条连线。由聚类节点图可以发现,节点最大的还是“智能合约”。此外,部分聚类序号与聚类大小也有一定的关系,序号在前的聚类有些会大一些。相较于其他关键词,还有几个关键词的节点也较大:“区块链”“漏洞检测”“以太坊”“访问控制”“演化博弈”“合同制度”“代码漏洞”“去中心化”等。表明在这期间,这几个领域是智能合约当前的探究热点。
通过对比2016—2020年和2021—2023年的关键词节点,由CiteSpace中Keywords节点生成的列表,选择Count前十的Keywords进行比较,如表1所示,可以进一步地发现:
1)“智能合约”“区块链”和“以太坊”这三个概念始终未变;2)2016—2020年,由于区块链才开始逐渐兴起,所以比较重视概念层面,因此“去中心化”和“合同法”是研究的热点,而2021—2023年,由于前期区块链在应用过程出现的一系列问题,一次又一次的智能合约安全漏洞攻击事件表明了,智能合约的安全形势十分严峻,因此,对于智能合约安全漏洞的研究也十分迫切,越来越多的研究工作开始关注于智能合约的安全漏洞问题,因此研究的热点开始走向“漏洞检测”和“访问控制”这样的技术层面了,这也说明信息技术在区块链的不断发展中彰显出越来越重要的作用了;3)在区块链的发展和研究中,“隐私保护”和“法律规制”始终是不变的研究热点,这说明重视安全,遵守法律,是现代社会人人都时刻意识的话题。
5" 结" 论
通过中国知网CNKI的文献检索与 CiteSpace 的可视化数据分析,本文系统分析了2016—2023年智能合约所涉及领域的科研论文,同时利用知识图谱的聚类分析总结了智能合约当前的热门主题,得出了智能合约在区块链的应用研究中起到了举足轻重的作用,其发文量在不断地增长,电子信息类的高校和高产作者居多,并且其研究热点开始不断地关注信息安全方面,这对国家经济的发展和国家网络安全的保护将会起到重要的作用。
参考文献:
[1] SZABO N. Formalizing and Securing Relationships on Public Networks [J/OL].First Monday,1997,2(9):(1997-09-01).https://doi.org/10.5210/fm.v2i9.548.
[2] 倪远东,张超,殷婷婷.智能合约安全漏洞研究综述 [J].信息安全学报,2020,5(3):78-99.
[3] 周志华.机器学习 [M].北京.清华大学出版社,2016:197.
[4] 孟博,刘加兵,刘琴,等.智能合约安全综述 [J].网络与信息安全学报,2020(3):1-13.
[5] 胡甜媛,李泽成,李必信,等.智能合约的合约安全和隐私安全研究综述 [J].计算机学报,2021,44(12):2485-2514.
[6] 汪永菊,杜秀娟,陈浩章.区块链智能合约技术研究综述 [J].计算机仿真,2023(40):1-4+65.
[7] 张文博,陈思敏,魏立斐,等.基于形式化方法的智能合约验证研究综述 [J].网络与信息安全学报,2022,8(4):12-28.
[8] 李栋旭.区块链智能合约的合同法适用 [D].长春:吉林大学,2020.
[9] 张天宇.智能合约的构造与风险防治问题研究 [D].兰州:兰州大学,2020.
[10] 李晓宇.以太坊代币智能合约形式化验证技术研究 [D].合肥:中国科学技术大学,2020.
作者简介:何锋(1973—),男,白族,云南鹤庆人,副教授,硕士,主要研究方向:数据挖掘、信息安全、区块链和编译原理。
收稿日期:2023-11-02