金 飞, 谢 勰, 郑 亮, 雎 悦, 王 浩
(1. 江苏金智教育信息技术有限公司, 江苏 南京 211100; 2. 西安邮电大学 通信与信息工程学院, 陕西 西安 710121)
基于物理关联的学术期刊引用网络影响力分析
金 飞1, 谢 勰2, 郑 亮2, 雎 悦2, 王 浩2
(1. 江苏金智教育信息技术有限公司, 江苏 南京 211100; 2. 西安邮电大学 通信与信息工程学院, 陕西 西安 710121)
从网络科学的视角分析学术期刊的影响力。针对传统方案忽视网络结构紧密度的缺陷,以物理关联作为期刊选择的依据。利用期刊之间的引用关系建立引用网络,基于顶点强度进行统计分析以评估期刊的影响力情况。引入顶点权重因子改进影响力度量,并以地缘性比较紧密的若干高校学报为例进行测算评估。数据分析表明引用网络方案可以较好地进行学术期刊影响力评估,特别是具备同一物理属性的期刊群。
网络科学;引用网络;学术期刊;影响力分析
网络科学[1-2]是目前的热门研究领域,它发现并解决了很多问题,也因此变得越发重要和流行。学术研究的影响力评估是一个古老但一直困扰学界的难题,而网络科学为其提供了一些非常好的解决方案[3]。
网络科学应用于学术期刊的影响力分析其原因是现代学术合作越来越密切,而学术期刊正是联系学者的重要媒介,由此形成的网络结构研究非常丰富[3]。简单来说,期刊中论文的被引用情况直接表明了该期刊的影响力水平,期刊被引用论文的次数越多,说明它的学术影响力越大,期刊质量越高。而期刊之间连接关系形成网络结构,因此使用网络科学评估研究对象的影响力分析是一个非常合适的方案。
基于网络结构评价影响力的问题则是有些学术期刊的结构关系非常松散,单从形式上选取的一组期刊难以获得较好的影响力评估。为此可引入期刊之间的物理关联,基于此给出新的期刊选取策略,从而更好的进行学术期刊影响力评估。
可以将所有要评价的对象看作是在一个图(或网络)中的顶点,顶点之间用边相连接。这些对象可以是若干学者,或若干论文。对象所组成的图形称为影响力图,并通过函数来计算所有对象的影响力的值。在我们的模型中,顶点v的影响力值不再仅由其自身决定,而是与网络中的其他顶点相互之间有影响,尤其是那些直接与v连接的顶点。首先,我们构建影响力网络模型,然后,通过对象之间的关联关系建立影响力网络,并从中获得影响力最大的个体。
对于一群相互关联的对象,我们使用图作为模型来评估其中每个对象的影响力。设图G为(V,E),其中对象的集合构成顶点集V,而对象之间的关系构成边集E。对于每一个v∈V,有自权重R(v),每一条边e=(u,v)∈E,有边权重W(u,v)。
为简单起见,先定义初始顶点强度为
(1)
考虑到每个顶点有其自身的权重,可将顶点强度S(v)改进为
(2)
其中最具影响力顶点v*的获得可通过公式
v*=argmaxQ(v)。
(3)
为了衡量各个期刊之间的影响力关系,可考察期刊中发表的论文。通过论文的引用关系来决定期刊之间的关系,根据引用度量值的累加计算期刊之间的权值,并最终获得所有期刊的影响力图GJ。
首先建立论文的引用关系网络。需要明确论文与论文之间的引用关系,通过检索相关期刊文献数据库,可以得到所有论文的引用情况。且由于论文之间可能存在相互引用关系,故该引用关系网络图为有向图中的双向图。假定所有的论文构成了顶点集V,对于任意的论文u和v,若论文u引用了论文v,则它们之间存在一条有向边(u, v),并定义边的初始权重W(u, v) = 1,否则它们之间不存在边。
考虑期刊的影响力图。设有期刊{J1,J2,…,Jt},由此定义了V的一个划分为{V1, V2, …, Vt},其中Vi中所有论文发自同一期刊Ji(1≤ i≤t),因此它们满足
Vi∩Vj=∅ (1≤i,j≤t),
(4)
于是期刊{J1,J2, …,Jt}形成了GJ= (VJ,EJ),可将Jp与Jq之间的边权重定义为
(5)
可以基于顶点强度[4-6]来计算期刊的影响力,对于期刊Jp(1≤p≤t),定义其影响力S为
(6)
于是即可得到所有期刊的影响力度量。
还可以对上述模型进行改进,检索每个期刊的论文总数n,并用它的倒数作为期刊的自权重R(Jp)(1≤p≤t)的值,即R(Jp) = 1/n,再与相应期刊的边权重进行运算,得到其影响力Q为
(7)
学术期刊的物理关联性可以有多种选择,传统上研究人员通常选择专业性较紧密的期刊形成网络,但实际上地缘性等物理指标更为适合。例如某地区的高校学报是该地区高校学术交流的一种体现方式,由于物理关联紧密,高校研究人员相互关联较强,从而让对应的高校学报的网络结构更为紧密,因此可以此为准则选择期刊并评估其影响力。
从某地区高校中选取15所具有代表性的理工类高校,并通过查阅中国期刊全文数据库中对应高校学报J1到J15,分别将2011-2013年各学报引用其他学报的情况进行统计(表1),在统计过程中不考虑自引的情况。表1中横向表示所选取的15所高校学报,纵向表示被引用的高校学报,矩阵数据表示三年内横向高校学报引用纵向高校学报中论文的总次数。
表1 某地区理工类高校学报2011-2013年总引用情况
使用Pajek软件[7]将表1中的数据绘成引用关系网络图(图1),图中的顶点代表所选的15所高校学报,顶点上的数据表明入度和出度之和,顶点越大表明数据值越大,相同的数据顶点大小相同,箭头指向的是被引用的学报所在高校。由此也可以看出,J4所在顶点最大,即具有最高的影响力其次依次是J7,J5,J1等,说明这些高校学报具有较高的影响力,其论文具有较高的参考价值。
图1 某地区理工类高校学报论文引用网络
计算这些期刊的影响力S和Q,并对比传统的复合影响因子[8],具体统计数据如表2所示。由于本方案更强调网络结构的关联性,因此比传统的单纯强调影响因子的评价更贴近实际。
表2 期刊影响力评分排名
根据物理关联性合理选取了学术期刊,并对其进行影响力评估,相比于传统的评估方案更为合理。具有较强物理关联的期刊之间能形成较紧密的网络结构,这有助于合理评估学术影响力。
未来需要对物理关联性指标进一步量化,并纳入较多的因素以改善模型的合理性。例如有些学报被一些特定学报引用次数相对较多,其主要原因是由于这些学校之间专业对口性稍强,这需要对模型进一步修正。
[1]LewisTG.NetworkScience:TheoryandApplications[M].NewJersey:Wiley, 2009: 1-22.
[2]EasleyDA,KleinbergJM.Networks,Crowds,andMarkets:ReasoningAboutaHighlyConnectedWorld[M].NewYork:CambridgeUniversityPress, 2010: 1-20.
[3]LiEY,LiaoCH,YenHR.Co-authorshipnetworksandresearchimpact:Asocialcapitalperspective[J].ResearchPolicy, 2013, 42(9): 1515-1530.
[4] 谭跃进, 吴俊, 邓宏钟.复杂网络中节点重要度评估的节点收缩方法[J]. 系统工程理论与实践, 2006, 26(11): 79-83.
[5] 周璇, 张凤鸣, 李克武, 等.利用重要度评价矩阵确定复杂网络关键节点[J]. 物理学报, 2012, 61(5): 1-7.
[6] 张琨, 李配配, 朱保平, 等.基于PageRank的有向加权复杂网络节点重要性评估方法[J]. 南京航空航天大学学报, 2013, 45(3): 429-434.
[7]BatageljV,MrvarA.Pajek:ProgramforLargeNetworkAnalysis[CP/OL].(2014-03-04)[2014-03-15].http://pajek.imfm.si/doku.php?id=pajek.
[8] 中国知网.期刊复合影响因子[DB/OL].(2008-01-12)[2014-03-15].http://cpas.cnki.net/OldCore/.
[责任编辑:王辉]
Influence citation network analysis of academic journals based on physical relations
JIN Fei1, XIE Xie2, ZHENG Liang2, JU Yue2, WANG Hao2
(1. Jiangsu Wisedu Information Technology Co., Ltd, Nanjing 211100, China;2. School of Communication and Information Engineering, Xi’an University of Posts and Telecommunications, Xi’an 710121, China)
Influence of academic journals is analysed in the perspective of network science. Journals are chosen based on their physical relations to fix the problem of omitting network structure connection strength in traditional methods. The citation network of journals is established by the citation relationship between them, and the citation statics of the journals is obtained based on the vertexes strength, which is used to evaluate the influence of journals. The weight of vertexes is introduced to improve the measurement of influence, and university journals with closely geopolitical relation are taken as an example to measure influence. Data analyses show that the citation network method can evaluate the journal influence effectively, especially for the journal group with the same physical attribute.
network science, cictation network, academic journals, influence analysis
10.13682/j.issn.2095-6533.2014.05.022
2014-03-15
陕西省教育厅专项科研计划基金资助项目(2013JK1131)
金飞(1979-),男,硕士研究生,工程师,从事大数据处理研究。E-mail:kimfly@163.com 谢勰(1981-),男,副教授,从事算法设计与分析研究。E-mail:xiexiexx@xupt.edu.cn
TP393
A
2095-6533(2014)05-0112-04