基于知识图谱的建筑领域神经网络可视化分析

2023-11-10 08:11王梦琦
河南城建学院学报 2023年5期
关键词:图谱聚类神经网络

王梦琦,陈 东

(安徽建筑大学 土木工程学院,安徽 合肥 230601)

Intel公司估算从人类社会产生开始至2003年,整个人类社会产生了5 EB的数据资料,在此后的将近十年间数据量增长至2.72 ZB,是2003年数据量的500倍,并且Intel公司预估此后每两年数据量便成倍增长。随着数据量的高速增长,人工处理数据变得越来越困难,人工智能成为处理数据的高效率手段。人工神经网络随着人工智能的兴起逐渐成为研究热点,其在结构上模仿人脑的神经元网络行为特征,具有强大的自主学习能力、寻找最优解的能力和存储功能,能够解决许多复杂的非线性映射问题,被广泛应用于多个领域[1]。神经网络最早被应用于建筑结构损伤识别,之后逐渐被用在建筑结构中。谢金豪等[2]将单一的BP神经网络预测模型与经过GAP优化后的神经网络预测模型运用于工程造价中。杨铄等[3]将神经网络应用于建筑结构损伤识别中。刘媛媛等[4]将数值模拟与BP神经网络相结合,提出了一种新思路。林申正等[5]通过BIM技术测算的结果输入神经网络,建立了建筑成本控制模型。NEIRA P[6]等将神经网络应用于混凝土抗压强度预测中。目前国内外学者将神经网络广泛应用于实验研究中,但缺乏对整个学科研究进程和研究前景的总结和归纳,而传统的文献归纳法有效率低、倾向性强、缺乏系统性等缺点。现代化的文献分析和归纳对各个学科的发展至关重要。本文通过CiteSpace6.1R2可视化分析软件对2009—2022年的Web of Science(WOS)数据库文献和中国知网(CNKI)数据库文献进行统计分析。分别对其作者合作网络、关键词和时区图进行可视化分析,旨在梳理国内外神经网络在建筑领域内的研究进展和趋势,以期为相关领域研究提供参考。

1 数据来源及研究方法

1.1 数据来源

应用CiteSpace软件对WOS和CNKI中的核心期刊进行检索。在WOS中以“neural network”为主题进行检索,之后对文献进行筛选、去重处理,最终得到1 843篇关于神经网络在建筑领域的有效文献。在CNKI中,以“神经网络”为关键词进行搜索,去掉除建筑科学与工程学科的其他文献,去掉学位论文、专利、报纸、会议等,得到1 643篇核心期刊相关文献。将所得文献进行去重处理,最终得到1 621篇有效文献。

表1 数据来源

1.2 研究方法

通过文献计量学的方法分析神经网络在建筑领域的研究现状。文献计量学是以文献为研究对象,集数学、统计学和文献学为一体,研究某学术领域的发展历程、研究热点以及未来的研究趋势[7]。先将WOS数据库和CNKI数据库里面的相关文献分别保存为纯文本格式和Refworks格式,然后运用CiteSpace软件对保存的文献进行数据转换处理以及可视化分析[8],最后通过可视化分析得到5个知识图谱(见图1)。本文在知识图谱的基础上分析神经网络在建筑领域的研究现状以及未来的研究趋势。

图1 研究方法流程图

2 数据分析

2.1 文献量时序分布分析

对WOS和CNKI数据库中近13年的相关文献发文量进行分析,可以反映出该学科领域在这一时间段的研究热点(见图2)。

图2 建筑领域的神经网络研究发文量

由图2可知,国内外关于建筑领域的神经网络的相关文献在2009—2022年整体呈现上升趋势。其中,国外相关文献在2009—2017年呈稳定增长趋势,2020—2021年发文量从287篇增长到450篇,呈大幅增长趋势。国内相关文献整体呈稳定增长趋势。由此可以看出近几年神经网络在建筑领域内的发展受到了广大学者的关注,成为研究热点之一。

2.2 作者共现分析

作者共现网络能够反映该研究领域内作者的交流合作情况。网络密度能够反映作者的合作情况,网络密度越高,作者间的合作越密切[9]。国内作者共现分析图谱、国外作者共现分析图谱分别如图3、图4所示。在CNKI作者共现分析图谱中,“N=467,E=203”,说明该图谱中共有467个节点,203条网络连接。节点的大小与作者的发文量相对应,发文量越多,节点越大。节点间连接线的粗细表示作者间合作强度的大小。203条网络连接则表示203个作者之间存在合作关系,但是网络密度只有0.001 9,说明作者在神经网络研究中合作总体较少,但是周世玉、刘晓平、周玉成、杜光月、曹正彬之间有较多研究领域的合作,其研究合作主要集中于利用神经网络的预测算法,对木质地板的蓄热性能提供依据[10-11]。李琦在图中是较大的橙色节点,但是节点附近没有边线,说明李琦发表的研究成果较多但合作较为分散,不够密切。在WOS作者共现分析图谱中共有520个节点,596条网络链接,网络密度为0.004 4。说明596个作者之间存在合作关系,并且比国内作者合作更加紧密,很少有独立发表的研究成果。

图3 CNKI作者共现分析图谱

图4 WOS作者共现分析图谱

2.3 国家及机构合作网络分析

国家和机构在该领域文献的发表在一定程度上可以反映一个国家和机构在该研究领域的重要性和影响力,国家之间的相互交流可以促进大规模的科技创新和突破[12]。本文对相关文献发文的国家和机构进行统计和可视化分析,得到图5、图6以及表2。由表2可以看出中国和美国的发文量明显高于其他国家,但中国发文的中心性很低,说明发表的文章影响力不大[13]。其他国家按发文量依次递减(见表2)。

图5 国家合作网络

图6 国外机构合作网络

表2 排名前十的发文国家和发文机构中心性分布表

在合作机构方面,发文量最多的是代尔夫特理工大学(Delft Univ Technol),中心性最强的是南洋理工大学(Nanyang Technol Univ)和伊朗科技大学(Iran Univ Sci &Technol)。机构合作网络图谱整体的合作密度为0.003 5,合作程度较低,总体呈现以代尔夫特理工大学、南洋理工大学、同济大学、东南大学等几个综合实力较强的单位为中心的合作关系,其中以同济大学为中心的合作网络的次节点为武汉大学、诺森比亚大学等知名大学。

2.4 关键词分析

2.4.1 关键词共现分析

关键词是一篇论文的核心概况。关键词共现的频次能说明该文献集所代表的学科中各主题之间的联系[14]。利用CiteSpace软件对选中的文献进行关键词共现、聚类分析,能够有效地了解到该领域的研究热点。绘制关键词共现图谱和关键词聚类图谱分别如图7和图8所示。

图7 CNKI关键词共现图谱

图8 WOS关键词共现图谱

在CNKI关键词共现图谱中,共有473个节点,400条网络链接,密度为0.003 6。

在WOS关键词共现图谱中,共有608个节点、960条网络链接,密度为0.005 2。国内大多将神经网络用于识别建筑的损伤,国外却较少。总的来说,国内外建筑领域的神经网络研究大体相似。

2.4.2 关键词聚类分析

对国内外建筑领域关于神经网络的文献进行聚类[9]。选择显示前8个聚类,聚类编号越小说明聚类的效果越好,中心性越强[14]。国内关键词聚类图谱见图9,国外关键词聚类图谱见图10。

图9 CNKI关键词聚类分析图谱

图10 WOS关键词聚类分析图谱

在CNKI关键词聚类图谱中,共有473个节点、400条网络链接,密度为0.003 6。聚类模块值Q=0.874 1,Q>0.3说明该聚类可视化较好;轮廓性指标S=0.969 8,S>0.5说明该聚类是合理的;若S>0.7说明该聚类是高效率并且令人信服的[14]。前8个聚类依次是“神经网络”“遗传算法”“变形预测”“预测”“仿真”“时间序列”“BP网络”“目标检测”,结合聚类信息和图谱可以看出国内神经网络在建筑中发挥的作用主要是预测和检测,例如预测建筑能耗模型、预测施工进度模型等以及检测混凝土裂缝和孔洞、检测钢筋混凝土的腐蚀程度等。

在WOS关键词聚类图谱中,共有608个节点,960条网络链接,密度为0.005 2。聚类模块值Q=0.809 2,平均轮廓S=0.923 4,与国内文献相比,Q值和S值较小,但Q值仍大于0.32,S值大于0.7,表明聚类结果可信。前8个聚类依次是“structural health monitoring”“machine learning”“artificial intelligence”“wave overtopping”“system”“rainfall-runoff modeling”“reinforcement intelligence”“artificial neural networks”。可以看出国外建筑领域的神经网络通常用于结构的健康监测、结构的损伤识别以及流域降雨径流、城市雨水径流和河水径流等。

2.4.3 研究前沿分析

通过CiteSpace中的“Burst Terms”对国内外文献进行关键词突发性算法分析,得到了国内外关键词突现图。国内关键词突现如图11所示,国外关键词突现如图12所示。由图11可以看出,2009年国内将神经网络多用于预测[15]和边坡[16]方面;2018年“机器学习”开始突现,强度为6.59;2019年“深度学习”开始突现,强度为19.73,增长了将近3倍。“机器学习”和“深度学习”成为国内建筑领域神经网络发展的转折点。在这之前,神经网络主要用于预测、识别结构损伤、对工程结构进行健康监测以及对工程的造价进行预测等[17]。“机器学习”开始突现于2018年,至今尚未结束,是突现时间最长的词,说明机器学习在近年来一直受到广泛的关注。由图12可以看出2009年国外就已经出现了神经网络,比国内出现早。早期国外多将神经网络用于识别、预测降雨径流、河流流量和桥墩周围的局部冲刷。中后期强度较大的关键词是“genetic algorithm”,是国外建筑领域神经网络发展的转折点。在这之后,神经网络的研究开始倾向于遗传算法[18]、粒子群算法[19]、全局优化[20]、海岸建筑[21]等方面。

图11 CNKI关键词突现图

图12 WOS关键词突现图

3 结论

基于CiteSpace计量分析软件,通过对2009—2022年CNKI和WOS中收录的3 464篇文献的年发文量、作者的合作关系、研究现状、研究热点和研究趋势进行计量分析,可以得出:

(1)2009—2022年国内外在建筑领域内以神经网络为主题的相关文献发文量总体呈上升趋势,并且国外近三年增幅巨大,说明目前该研究领域在国外受到广泛关注。国内该领域的研究学者虽然较多,但是各个学者之间的合作较少,而国外研究学者之间有较密切的合作关系,并且发文量也较多。未来国内研究学者应该进一步加强团队间的合作。

(2)各国的相关学者对于神经网络的研究和发展都做出了重大的贡献,其中美国、中国、英国等国学者的研究成果最丰富。在国际交流方面,国外在神经网络研究领域的合作与交流较为密切,而我国与其他国家的交流相对较少,还需要加强国际合作与交流。

(3)神经网络、预测、遗传算法等关键词出现频率较高,说明当前研究热点主要集中在这些方面。通过关键词突现分析可以看出,近几年国内外的研究主要集中在人工智能方向,这些研究方向可能仍然是未来的研究重点。

猜你喜欢
图谱聚类神经网络
绘一张成长图谱
神经网络抑制无线通信干扰探究
基于DBSACN聚类算法的XML文档聚类
补肾强身片UPLC指纹图谱
基于高斯混合聚类的阵列干涉SAR三维成像
主动对接你思维的知识图谱
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定
一种层次初始的聚类个数自适应的聚类方法研究