姚宁宁,董春丽,陈兴荣,韩慧霞
(1.滁州学院 数学与金融学院,安徽 滁州 239000;2.中国地质大学 数学与物理学院,湖北 武汉 430074)
由于具备过程可信和去中心化两大特点,区块链能够在多利益主体参与的场景下以低成本的方式构建信任基础,旨在重塑社会信用体系[1]。伴随着以太坊等开源区块链平台的诞生以及大量去中心化应用的落地,区块链技术在更多的行业中得到了应用。
中国政府近年来也积极部署区块链技术研究与应用创新,不断提升区块链研究定位。2019年习近平总书记在主持中共中央政治局第十八次学习时强调:“要把区块链作为核心技术自主创新的重要突破口,加快推动区块链技术和产业创新发展”。2020年区块链产业政策迎来井喷式增长。截至2021年,中央、各部委及各地方政府发布区块链相关政策至少700部,较2019年上涨近8倍。在中央号召下,各地积极响应纷纷出台区块链相关政策,扶持区块链产业发展。
学术界对区块链的研究也在开展,以中国知网期刊数据库为例,2015年前发表的区块链相关文献不足百篇, 而近三年呈现指数级增长。作为新兴研究领域,了解当前研究进程、剖析未来研究趋势尤为重要。以往针对区块链文献进行梳理,其研究大致可以分为两类:一是综述类技术原理研究,该类文献一般从定性分析的角度,论述区块链的概念原理、核心技术、研究现状、现存问题和未来趋势。如袁勇区块链技术研究综述:原理、进展与应用[2];曾诗钦等设计了一个层次化区块链技术体系,将现有针对区块链的研究纳入该体系中[1]。二技术原理应用研究,区块链技术的应用已经从最初数字货币延伸到金融领域,并逐步发展壮大扩展到情报科学、教育、医疗、征信、政府管理等社会生活中[3-7]。应用型研究文献是从某一方面入手,研究区块链技术在该领域的初步应用,难以直观了解区块链研究框架、热点主题和未来趋势,当然国内外也有学者通过文献计量来研究,通过对现有文献的可视化计量工具如Citeplace、Bicomb、Ucinet等从文献时间序列、主要研究机构、学科分布、热点主题挖掘的视角进行论述[8-12]。但以上文献主体研究内容大体都是基于文献基本特征→基于关键词词频和共现的热点分析→未来展望思路展开。该类研究能够在一定程度上揭示区块链研究概貌,但以关键词的词频或中心度表征的研究热度只能代表研究者的关注点,却并不能完全有效聚焦凝练研究主题,为此,本文在以上研究的基础上,创新地增加了从文献共被引视角对国内区块链领域共被引文献进行分析,从而挖掘当前的研究热点主题。
期刊以“时间性强,报道及时,内容广泛,观点新颖”著称,因此为保证分析结果的可信度,在中国知网期刊数据库中进行文献检索,期刊来源类别设定为“核心期刊”,经过预分析比较,选择主题为“区块链”为检索词进行准确检索[12],检索最新时间是2021年,共检索出2 774篇相关文献.剔除与主题无关或者存在撤稿的文献,最终获得2 567条有效文献,检索到的文献记录下载并以“完整记录及引用文献”的格式保存为一个纯文本文件,作为本论文分析数据的样本文献。
CiteSpace 软件系统是由美国华人学者陈超美(Chaomei Chen)博士开发,应用于科学和技术领域[13],通过直观的知识图谱,识别并展现该领域的热点关键词、研究进展和前沿方向的一款知识可视化软件。本文将中国知网期刊数据库和中国科学引文数据库中检索区块链主题文献进行分时动态的可视化图谱分析,主要包括被引文献以及关键词等分析科学展示知识的宏观结构及其发展脉络。
1973年, 美国情报学家Small首次提出了文献共被引(Co-citation)的概念, 作为测度文献间关系程度的一种研究方法。后经不断发展,文献共被引正式定义为两篇(或多篇论文)同时被后来一篇或多篇论文所引证,则称这两篇论文构成共被引关系[14]。通过文献共被引分析,既可以得到高被引文献,也可以得到联系紧密文献(即经常一起出现在后来发表的多篇文献中),则这些共同被引用的文献一定在内容上具有相似性,共被引越强大说明两者在内容上越相似。利用CiteSpace聚类功能进行文献共被引的聚类分析,挖掘相似文献的共同主题,这些主题便能反映一定时期该领域的研究热点。考虑到中国知网期刊数据库中进行文献检索的文献,缺少参考文献部分,故本部分样本文献摘自中国知网文献“CSSCI”文献类别。
为了挖掘区块链研究热点,在文献共现图基础上,根据CiteSpace聚类算法log-likelihood-ratio(LLR)绘制成文献共被引聚类图谱如图1所示,网络中共有360个节点,971条连线,图中每个节点代表一个被引文献,节点的大小显示共被引频率(图中显示被引文献频率阈值为80)。节点越大,共被引频率越大;线条代表着被引之间的联系,表示一起出现在后来发表的多篇文献中,中心度反映该被引文献所起的桥梁作用,关键词中心性越大,表示与其它关键词联系越紧密,也就越重要。另外Modularity被用来评价图谱网络模块化指标,其值介于0至1之间,大于0.3表示网络聚类社团效果显著[15],图1中为0.74,表示聚类效果很好。
图1 文献共被引聚类图谱
系统初始聚类事每个类别中包含的成员样本至少是10个以上,否则该类别实际意义,为更精确地对样本分析,本文将类中包含的成员样本增加到17个,聚类结果显示共有11个类别,用不同颜色表示,其中轮廓图(Silhouette)系数都在0.8以上,表示聚类成员内部之间比较紧簇,聚类效果较好,具体信息可从软件导出,整理成表1。
表1 聚类主要信息表
聚类结果显示共有11个类别,在图中用不同的颜色表示。结合关键词聚类结果分析,发现区块链领域的研究热点几乎集中在“法定数字货币”“著作权”“供应链金融”“技术风险”“国家治理”“互联网金融”和“精准扶贫”等,具体体现在以下三个方面:第一,区块链加速与实体经济结合,多场景赋能产业链迭代升级;第二,区块链商业模式更加成熟,中心化与去中心化的界限趋于模糊;第三, 区块链被纳入法治框架,相关标准体系更加健全。
突发事件检测是一种用于检测一定时期内的重要信息的分析工具[16],为了更深层次挖掘区块链典型研究热点,进行引用文献突现分析,高强度爆发的文献可以从反映当前该领域的个别极大热点。图2显示了前12名CiteSpace在2016年至2020年期间检测到最强参考蓝色部分表示时间间隔,红色部分表示时间间隔引用发生的时间段。图2突发检测可以分为两个阶段,在第一阶段期(引用时间段2017-2018年),图中前7篇引文都是在该时间段爆发的,共持续了一年,是此期间的研究热点文献。其中最大引文爆发强度4.29来自袁勇2016年在自动化学报发表的一篇论文,该论文提出了区块链系统的基础架构, 在此基础上阐述了区块链基本原理,技术与应用现状,最后介绍了基于区块链的平行社会发展趋势[2]。在第二阶段期(引用时间段2018-2020年),即图2靠后的5篇被引文献,其中爆发强度较大是谭小荷2018年在新闻界发表关于区块链驱动下的新闻商业模式创新[17]和聂静2017年基于区块链的数字出版版权保护的研究等[18-19],此阶段突现文献主要体现在区块链涉及多媒体行业如新闻业、数字出版等迅速发展,一直持续到2020年且可能持续更久,此阶段爆发的文献可以反映当前该领域的研究热点。
图2 最大引文爆发强度(前12)
知识可视化软件 CiteSpace有两种显示共现网络图谱的视图方式,分别为聚类视图和时区视图。时区视图的显示突出共现网络节点随时间变化的结构关系[14],表示某一领域研究主题主要研究内容随时间变化关系,用来反映某一时间段内的研究前沿。
运行 CiteSpace软件得到区块链关键词共现网络节点的时区视图,如图 3所示,图中共有 272个节点,377 条连线,图中最底部对应的时间表示该关键词是在分析的数据集中首次出现年份,最左边对应是2014年,最右边对应是2022年,共9个年份区间。
通过图3显示,区块链节点是所有节点中最大的,在2015年国内首次出现,之后随着时间相继衍生出多个主题。由于2016-2018年国内相关核心期刊发文量较少,而在2019年区块链相关论文实现大爆发,首次出现多个主题的相关关键词如智能合约、共识机制、去中心化、人工智能、大数据、物联网、联盟链、数字货币、隐私保护、供应链金融、数字经济、金融科技等高频关键词,这些表示2019年出现的新兴前沿主题。到2020年涉及的主题高频关键词如共识算法、以太坊、供应链、图书馆、访问控制,加密货币、金融监管、技术赋能等。结合图3整理出 2021-2022年新兴前沿主题统计可以反映当前区块链研究新兴趋势,如表2。
表2 2021-2022年新兴前沿主题统计
图3 区块链关键词主题时区图(2014-2022年)
从2021年首次出现的相对高频关键词如非对称加密、社交网络、密码学、智能媒体、融资模式、私人数字货币、数字人民币等可以看出,随着区块链技术和要素融合趋势的加强,数据和资产、数据和信用的融合将成为新的方向,区块链开始“脱虚向实”,区块链的金融属性也逐渐向产业属性转化,在“智能合约+平台”的基础上实现规模化、网络化落地。在2022年首次出现的关键词有区块链模型、协同分工、农机设计、创业孵化、数字化设计等。谷晓婷在农机数字化设计平台上引入了创业孵化区块链模型,对于提升农机产品的设计和研发效率具有重要意义[20]; 汤尚提出基于区块链的图书馆数字阅读推广技术框架[21], 通过面向数字阅读的区块链共识机制激励策略促进用户积极阅读与创作,形成一个良性循环的阅读生态圈。这在某种程度上证实了区块链领域从理论转变为满足市民的生活需求实际场景和应用的重要研究趋势。
借助文献计量方法研究分析了截至2021年中国知网期刊数据库关于区块链的有效期刊论文,自2017年以来,区块链方面的出版物数量呈快速增长趋势,目前处于欣欣向荣阶段。在文献共现图基础上,对区块链领域研究热点挖掘,根据LLR聚类算法绘制成文献共被引聚类图谱,聚类结果显示共有11个类别,按大小排序分别是法定数字货币、著作权、供应链金融、智能合约、金融风险、技术风险、国家治理、互联网金融、精准扶贫、真实性、有价证券,反映了区块链当前领域的研究热点。为了更深层次挖掘区块链典型研究热点,进行引用文献突现分析,高强度爆发的文献可以从反映当前该领域的个别极大热点,结果表明,在当前时期在爆发强度较大的突现文献主要涉及多媒体行业如新闻业、数字出版等,较大爆发强度从2018年持续到2020年且可能持续更久,此阶段爆发的文献可以反映当前该领域的研究热点。
从关键词时区视图视角探析区块链领域研究前沿,运行 CiteSpace软件得到区块链关键词共现网络节点的时区视图,在2021年、2022年首次出现的高频关键词表明随着区块链技术和要素融合趋势的加强,数据和资产、数据和信用的融合将成为新的方向,区块链开始“脱虚向实”,区块链的金融属性也逐渐向产业属性转化,在“智能合约+平台”的基础上实现规模化、网络化落地,进一步证实了区块链领域从理论转变为满足市民的生活需求实际场景和应用的重要研究趋势。
尽管本文确定了主要的研究热点和前沿,但对于每个研究主题,如安全性、区块链标准与最新技术的比较以及区块链技术的全球商业影响等,仍需要更深入的信息。需要指出的是,CiteSpace已被用于许多文献计量研究,其分析结果稳定可靠,几乎不受主观经验的影响。