一种智能建造领域研究热点及合作团体分析方法

2024-12-15 00:00:00王冬瑞
电脑知识与技术 2024年34期
关键词:词频团体次数

摘要:本文基于CNKI数据库,采用g指数对智能建造领域文献关键词进行统计分析,识别研究热点并利用共现指数分析作者合作关系,识别主要合作团体。

关键词:智能建造;g指数;共现指数;合作团体;研究热点

中图分类号:TP311文献标识码:A

文章编号:1009-3044(2024)34-0063-03开放科学(资源服务)标识码(OSID):

0引言

研究热点的识别对于指导智能建造领域的理论研究和实际应用至关重要,然而,传统的基于关键词统计的研究方法往往忽略了文献质量,可能遗漏重要的新颖文献,因为这些文献的关键词频率可能较低[1]。为解决这一问题,本文采用g指数方法[2-3],综合考虑文献质量和关键词频率,以便更准确地识别智能建造领域的研究热点。

此外,本文采用共现指数[2]分析智能建造领域的作者合作关系。与仅关注发文量的传统方法不同,共现指数能够识别作者在合作网络中的地位,从而识别团体内的领军人物。

1数据来源及方法

1.1数据来源

智能建造作为新一代信息技术与建筑行业深度融合的新型建造模式,近年来发展迅速,受到学者们的广泛关注,相关研究成果持续增长(如图1所示)。

然而,现有的智能建造文献分析大多缺乏对关键词重要程度的考量。为弥补这一不足,本文采用g指数方法对智能建造领域的研究热点进行定量分析。本研究选取CNKI数据库中2020年1月至2024年4月发表的智能建造相关文献作为数据来源,检索式为“主题=‘智能建造’”,数据类型限定为“学术期刊”。经筛选,最终得到1372篇有效文献,用于后续分析。

1.2关键词g指数计算方法

g指数(g-index)是由比利时哈塞尔特大学教授、JournalofInformetrics主编LeoEgghe于2006年提出的,是评价学者学术影响力的重要指标之一。与h指数相比,g指数引入了论文被引次数,能更好地反映高被引论文的影响力。

关键词g指数[4]定义如下:包含该关键词的论文集合中,被引次数最高的g篇论文的总被引次数不小于g2次引用。g指数的计算方法为:将论文按照被引次数由高到低排序,分别计算序号的平方和累计被引次数。当序号的平方等于或小于对应的累计被引次数时,该序号对应的论文数量即为g指数。简言之,g指数是满足“被引次数最高的g篇论文的总被引次数不小于g2这一条件的最大论文数量。本文将g指数应用于关键词和作者分析,以识别重要的关键词和作者。计算过程如下:

步骤1:选择数据源,处理数据,统计关键词频和作者词频;

步骤2:利用g指数的计算方法,筛选出高频关键词和作者;

步骤3:获取包含关键词的主题论文的被引用次数;

步骤4:结合关键词词频、作者词频和文章被引次数计算出关键词、作者的g指数。以此作为热点以及重点研究人员筛选依据。

2关键词分析

2.1数据处理

对1372篇有效文献的关键词进行提取、同义词合并(例如,将“BIM”和“BIM技术”合并为“BIM”,将“建筑业”和“建筑行业”合并为“建筑行业”)和规范化处理后[5],共得到547个关键词。本文选取词频排名前20位的关键词,并计算其g指数(见表1)。

由表1可以看出,关键词词频和g指数的排序结果基本一致,但也存在个别差异。例如,“协同发展”的词频高于“高质量发展”,但其g指数却低于后者,这表明“高质量发展”在智能建造领域的重要性可能高于“协同发展”。图2展示了关键词词频和g指数的对比。

2.2共词分析

内容分析的一个重要的方法就是共词分析方法[6],通过一个领域涉及的文献所有关键词对的分析,能够帮助揭示这个网络背后的一些复杂关系和规律。但是对所有关键词分析,会有大量的无用的边缘关键词,对结果形成干扰而且不清晰,所以本文基于2.1小节中得到的高频关键词来进行共词分析。利用Py⁃thon语言计算出20个高频关键词之间的两两共现次数,同时利用Excel得到高频关键词共现矩阵,然后再利用Ucinet软件将上步骤得到的高频关键词共现矩阵转化为后缀名为.##的文件,利用Netdraw软件绘制关键词共词图谱[7],如图3所示。

从图3可以看出,“智能制造”“BIM”“建筑机器人”“建筑工业化”“装配式建筑”“数字化转型”等关键词处于网络的核心位置,表明这些是智能建造领域的核心研究方向。值得注意的是,“生命周期”一词虽然词频较高,但在共现网络中相对孤立,说明其与其他关键词的关联性较弱。这表明,仅依靠词频分析可能会忽略一些重要的研究方向,而结合共现网络分析能够更全面地识别领域热点。

3合作团体分析

3.1高产作者分析

体现一个作者在一个领域的影响力的方法,比较典型的两个指标就是发文量和h指数[8],但是这样的指标仅仅能反映高产作者的影响力,并不能体现出作者之间的合作网络关系,也发现不了高产作者在团体中的重要关系,所以本文引入共现指数的方法,来分析作者在研究网络中的重要关系[2]。

共现指数的计算方法如下,假设我们一共筛选出来了n个关键词,那么对于关键词i与其他关键词共现的关系可以表示为[ai1,ai2,…,aij,…,ain],其中若i与j存在连接值为1,否则为0。用[bi1,bi2,…,bij,…,bin]来表示关键词i与其他关键词的共现次数。那么共现指数可以表示为:

对1372篇有效文献的作者进行统计分析,共得到2092位作者。本文选取发文量≥5的作者作为研究对象,计算其共现指数,结果如表2所示。

从表2可以看出,高产作者的共现指数并不一定高。例如,“袁烽”“丁烈云”等作者的共现指数仅为1,表明他们与其他作者的合作较为有限。“黎晓茜”“马智亮”等作者的共现指数为0,说明他们主要进行独立研究。总体而言,智能建造领域作者之间的合作关系尚不密切,这可能是因为该领域在我国仍处于发展初期。

3.2合作关系可视化

本文选取与高产作者相关的348位作者,构建作者合作网络,并利用Ucinet和Netdraw软件进行可视化(见图4)。

剔除掉单独节点后,由图3可以得出,4个合作团体,其中以刘占省、史国梁、杜修力为核心著者的团体人数最多,通过统计他们发表的论文关键词发现,这个团体主要的研究方向是BIM、人才培养。其次是袁烽、丁烈云为核心著者的团体,这个团体的核心著者丁烈云共现指数只有1,通过统计论文发现,丁烈云大部分的论文都是个人发表,这说明在这个领域丁烈云与其他作者合作关系比较弱。

4结束语

本文首先给出了g指数的计算以及筛选关键词的过程,并且利用该方法选取了智能建造领域排名前20的关键词作为研究对象,同时利用社会网络分析的方法,得到了智能建造领域比较重要的几个相关研究方向,如BIM、建筑机器人、建筑工业化、装配式建筑、数字化转型。同时利用共现指数和发文量结合的方法对智能建造领域的合作团体进行了研究,结果表明近五年来智能建造领域发文量≥5的作者共有35位,但是发现该领域共现指数和发文量趋势并没有明显关系,智能建造领域作者之间合作较为松散,未来须加强合作。

参考文献:

[1]YIH,XIZ.TrendsofDDTresearchduringtheperiodof1991to2005[J].Scientometrics,2008,75(1):111-122.

[2]汤强,王亚民,赵艳.基于g指数和共现指数的研究热点及合作团体分析[J].情报杂志,2014,33(9):72-75.

[3]EGGHEL.Theoryandpractiseoftheg-index[J].Scientometrics,2006,69(1):131-152.

[4]赵星,高小强,郭吉安,等.基于关键词频和g指数的研究热点分析方法[J].图书情报工作,2009,53(2):59-61.

[5]张存刚,李明,陆德梅.社会网络分析:一种重要的社会学研究方法[J].甘肃社会科学,2004(2):109-111.

[6]CALLONM,COURTIALJP,TURNERWA,etal.Fromtransla⁃tionstoproblematicnetworks:anintroductiontoco-wordanaly⁃sis[J].SocialScienceInformation,1983,22(2):191-235.

[7]储节旺,郭春侠.共词分析法的基本原理及EXCEL实现[J].情报科学,2011,29(6):931-934.

[8]邱均平,周春雷.发文量和h指数结合的高影响力作者评选方法研究:以图书情报学为例的实证分析[J].图书馆论坛,2008,28(6):44-49.

【通联编辑:梁书】

猜你喜欢
词频团体次数
中国队获第63届IMO团体总分第一名
中等数学(2022年8期)2022-10-24 02:06:56
机场航站楼年雷击次数计算
基于词频分析法的社区公园归属感营建要素研究
园林科技(2021年3期)2022-01-19 03:17:48
2020年,我国汽车召回次数同比减少10.8%,召回数量同比增长3.9%
商用汽车(2021年4期)2021-10-13 07:16:02
一类无界算子的二次数值域和谱
依据“次数”求概率
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
团体无偿献血难成主流
中国卫生(2015年9期)2015-01-22 03:09:00
以关键词词频法透视《大学图书馆学报》学术研究特色
图书馆论坛(2014年8期)2014-03-11 18:47:59