陶文倩 潘云涛 王海燕
关键词:高被引论文;主题演化;动态情境;模式探索;影响力
科技论文是科学知识、科学问题的重要载体之一,是科研人员活动的一种重要产出成果。高被引论文对科学知识发展、科研活动有显著影响作用,被学术界和同行高度关注、重视以及认可,是科技创新活动向前更迭和发展的源泉与基石。
国家的科技政策以及科研环境的变化对学术论文影响力的提升提出了更高的要求。我国《国家“十三五”时期文化发展改革规划纲要》指出“增强中国国际话语权”。学术话语权是国家话语权的重要组成部分,是国家软实力和国家综合实力的重要标志。2020年12月15日,教育部等三部委联合印发《“双一流”建设成效评价办法(试行)》,强调“要突出原始创新与重大突破,不唯数量、不唯论文、不唯奖项,实行代表作评价,强调成果的创新质量与贡献”,以及“提高科技创新水平、解决国家关键技术‘卡脖子问题、推进科技评价改革的主要举措”。由此可见,提升我国学术论文影响力与学术话语权仍是我国科技评价研究的重要命题之一。
程刚从高被引论文的内容方面阐述高被引论文的内涵,认为高被引论文一般具有一定的理论深度与理论突破,抓住了本学科研究的关键性及本领域普遍关心的问题,对工作实践有较大的指导意义在理论上有相对的认识超前性。Tahamtan I等将高被引论文影响因素总结为三大类:第一,论文层面因素:质量、主题新颖性和关注度、领域和研究主题特征、方法论、文献类型、研究设计、结果和讨论、论文中的数据和附录、标题摘要特征、参考文献特征、文献长度、文献年龄、早期引用情况、文献的可访问性;第二,期刊层面因素:期刊影响因子、语言、范围和出版形式;第三,作者层面因素:作者数量、作者声誉、作者学术排名、自引、作者國家(地区)、作者的国际和国内合作情况、作者生产力、作者性别年龄种族、组织特征和资金等。针对主题相关的特征研究中,Zhang X等在4个不同学科中训练神经网络模型,对论文被引量使用各种因素建模,发现各种因素对于论文被引的影响在不同主题下分布差异显著。Yan R等则使用主题流行排名、主题多样性表征主题特征,并使用其预测高被引论文得到了较好的效果。
高被引论文的模式与规律研究一种是从引文现象或者科学界现象出发,发现重要的模式。RaanA首次命名了一种现象——睡美人模式,即高被引论文中的延迟承认现象。Ye F等将立即承认的高被引论文称为“时髦女”或者“昙花一现”,并为“时髦女”和“睡美人”建立了统一的测度方式。Zeng C等认为,“睡美人”和“时髦女”都是纯粹的统计模式,并没有揭示科学内容。因此,他将科学发现与科学计量学结合,发现了一种新模式,即科学突破中的“黑天鹅”与“白天鹅”,分别比喻突破性发现的出版物和高被引论文,当“白天鹅”遇到“黑天鹅”会发生重要的科学进步。另一种是根据引文曲线、引文扩散、跨学科特征等对高被引论文进行模式总结与分类。Avramescu A总结大量数据提出了高、中、低峰值3种经典引文曲线、持续增长的“天才型”曲线以及“昙花一现”型曲线。韩旭等归纳总结出9种引文扩散演变模式。Chen S等则研究了高被引论文的跨学科模式,将其分为跨专业和跨学科两类,并研究了此模式在不同学科的分布规律。
在对高被引论文影响力的形成规律的探索中,已有一部分学者认识到高被引论文的影响力的形成过程是一个动态的、复杂的、系统的过程,而不仅仅是某些静态的影响因素的作用或者组合作用。Cronin B提出引文的发生是一种科学社会化下的一种动态进程。闵超等从引文扩散角度强调了高被引论文是科学知识在科学系统内的传递与演化。Bu Y等则通过静态合作特征的时序变化,获得一个动态合作特征——论文合作关系的持续性与稳定性,研究其对论文影响力的影响,从而帮助研究人员决定在一段时间内合作关系投入的策略。
综上所述,在当前的背景下,我国科技论文仍需要进一步提升学术影响力与学术话语权,科技论文评价也需要更加科学合理,同时要有能力面向不同学术评价目的、不同学术评价任务实现更精准的评价。这些都需要建立在对动态、复杂的高被引论文影响力形成机制进行探索与认识的基础上,而以往对高被引论文的特征和影响因素的相关研究,只是统计两个时间端点的静态数据之间的相关关系:出版时的静态特征(比如合作者数量等)与最终影响力结果,显然已无法满足进一步提升学术论文影响力和更科学合理的科技论文评价的要求。并且以往的模式研究较分散,往往只是针对某个现象或仅从被引频次本身进行研究。
因此,本文选取高被引论文作为研究对象,选取过程中“动态情境”的研究视角,基于主题演化维度对高被引论文影响力的形成模式进行探索,促进对单篇高被引论文影响力形成模式与规律的科学认识,有助于找到以及提前预判有潜力的高影响力科学成果,促进学术论文影响力评价理论体系的完善。此外,为我国科技论文、科技期刊进一步提升影响力以及提高学术话语权提供一定的借鉴。
1概念界定
1.1高被引论文影响力的形成
学术论文影响力是指论文在传播过程中因自身学术价值获得的关注度。本文主要通过引文来体现论文的影响力。与高被引论文影响力的形成相关的表述有:高被引论文的产出、高被引论文的生产、高被引论文(影响力)的产生、高被引论文(影响力)的形成、高被引论文影响力的扩散。其中,“产出”“生产”的分析对象侧重于个人、机构等知识生产主体,分析环节侧重于与该论文有关的科学研究活动的开始到结束:从创意、启动,到研究、结束、发布和评价。其中,“产生”“形成”的分析对象侧重于高被引论文,分析环节则相对宽泛,涉及高被引论文的生产、出版、影响力的累积。“扩散”的分析对象则可能是高被引论文也可能是科学知识,分析环节针对论文发表后的引文在科学系统中的分布与演进情况。
本文中“高被引论文影响力的形成”的过程指的是高被引论文所处的动态情境,涵盖的是一篇高被引论文发表前、发表时、发表后影响力累积的全过程动态情境。比如从主题演化维度分析一篇高被引论文影响力形成过程时,使用的数据信息囊括主题演化在该篇高被引论文发表前的历史状态、发表时的状态、发表后影响力演化阶段的状态的整个过程。
1.2动态情境
1994年,Schilit B等首次提出了“情境”概念,最早指“位置、人和物体周围的标识与这些物体的变化”。Schmidt A等认为,情境描述主体所处的态势和环境。之后情境的概念被广泛运用于心理学、计算机与信息技术领域。在计算机与信息技术领域,基于描述性视角,情境是一种信息,是一种可以观测和采集的“适当”属性的集合:基于交互性视角,情境则是一种关联,情境具有动态性,情境和活动的关联会循环产生,活动引发了情境的产生,而情境反过来能影响活动。在心理学领域,情境是指影响事物发生或对机体产生影响的环境条件。情境可分为静态情境和动态情境,动态情境由一系列连续的静态情境构成。
高被引论文的影响力的形成过程是一个处于动态背景中的复杂、系统的过程,不是孤立缥缈的,也不处于静态“环境”之中,而是处于一种动态的“环境”之中,比如领域内主题演化的态势与环境、团队合作演化的态势与环境等。而这种过程在以往的相关研究中没有明确的概念予以描述、对应,并且在以往对高被引论文的特征和影响因素的相关研究中是被忽略的。而本文发现该过程与“动态情境”概念有许多共通之处:第一,该过程体现了影响高被引论文影响力形成的环境条件。第二,高被引论文影响力形成过程的“动态环境”也是一种信息的集合,可以通过观测和采集适当的集合信息来描述。科学计量学领域在这方面有深厚积累,比如描述、刻画、计量主题、合作等层面的信息。第三,高被引论文影响力形成过程的“动态环境”也是一种关联的集合,比如不同维度的影响因素在时序上存在关联性。
因此,本研究将“动态情境”的概念引入,在本研究中定义为对高被引论文影响力形成有关的一系列各维度影响因素在时序上的动态集合体。
2数据来源与动态情境构建方法
2.1数据来源
本文以基因编辑领域为例探索高被引论文影响力形成的模式及规律。选择该领域是考虑到该领域是近年来最受关注、最活跃的研究领域之一,领域的科学家屡次上榜Nature年度影响力十大科学家,产生了许多具有影响力的高被引论文。此外,这是一个新兴学科领域,知识更迭快,具有较显著和复杂的主题演化的动态情境。本文以Web of Science核心合集作为数据来源,检索基因编辑领域所有出版物记录,不限制出版年份。使用的检索式如下:该检索式是围绕核心关键词“基因编辑”以及主要的核心技术(Meganuclease、ZFN、TALEN、CRISPR)进行编写的。检索日期为2022年6月8日,最终得到检索记录34992条。采集到论文数据后,遴选了基因编辑领域在总被引前1%的高被引论文,得到349篇。
2.2基于主题演化维度的动态情境构建方法
科学知识图谱方向的研究已经积累了许多如何挖掘主题、如何展示主题分布情况与关联情况等相关的技术方法,这类方法适合对特定领域的主题发展趋势进行详细解读,但注重详细过程所展示的信息过于庞杂、分散,不便于之后对高被引论文影响力形成进行模式的提取。因此,本文认为可以将主题演化维度的动态情境根据粒度由细到粗分为3个层次进行构建。从第一层次到第二层次再到第三层次,是将主题演化情况的特点进行更高层次的概括。
第一层次即为主题演化详细过程。在动态情境的第一层次的构建中,本文使用基于时间切片和静态主题模型方法相结合的主题演化可视化方法。第二层次为主题局部演化关系。在动态情境的第二层次的构建中,本文结合Palla G等定义的复杂网络演化类型以及关鹏等、金心怡、朱光等、熊文靓等根据知识进化理论和生命周期理论所概括出的主题演化关系,确定新生、消亡、继承、交叉、分裂5种主题局部演化关系类型及相应的判定方法,对第一层次的主题演化过程进行进一步概括。第三层次为主题演化路径。在动态情境的第三层次的构建中,本文提出基于主题局部演化关系类型分布的主题演化路径概括方法,对第二层次的主题演化过程再进行进一步概括。
2.2.1主题演化动态情境的第一层次构建
本文使用基于时间切片和静态主题模型方法相结合的主题演化可视化方法,即分时间窗口进行LDA主题挖掘,然后基于主题间的余弦相似度将相邻日寸间片的主题进行关联,最后得到可视化结果。详细步骤如下:
1)主题挖掘。结合领域每年发文量的变化,适当划分时间窗口。然后对训练数据集进行词向量化,利用Coherence指标确定最优主题数目,在每个时间窗口下建立LDA主题模型,并输出主题一词汇概率分布和文档一主题概率分布。
2)主题关联。通过计算主题间的余弦相似度来表征相邻时间窗的主题相似度,并与设定的阈值比较,从而关联主题。余弦相似度(Cosin Similari-ty,CosSim)计算公式如式(1)所示:
在得到相邻时间窗下的主题两两间的余弦相似度后,将余弦相似度大于所设定阈值的记为一对存在前向和后向关系的主题对,进行主题关联。
3)主題演化可视化。使用桑基图来可视化主题的演化过程。在桑基图中,矩形代表主题,两个时间窗口的矩形之间的曲线块表示演化过程。
2.2.2主题演化动态情境的第二层次构建
主题演化动态情境的第二层次构建是将主题局部演化关系概括为5种类型:新生、消亡、继承、交叉、分裂,如图1所示,判定条件如表1所示。在主题关联时,相邻时间片下余弦相似度大于所设定阈值的记为一对存在前向和后向关系的主题对。因此,表1中前向主题是指一对关联主题对中前时间片的主题,后向主题是指一对关联主题对中后时间片的主题。
2.2.3主题演化动态情境的第三层次构建
第三层次为主题演化路径类型,根据主题演化路径的跨越时长、5种主题演化局部关系类型的占比,为主题演化路径打上特征标签,从而实现分类主题演化路径类型,如表2所示。具体判别标准可能需要根据学科领域的具体情况设定、调整。
最终得到3个层次的动态情境,在后续的高被引论文影响力形成模式的分析中,第三层次可以帮助模式提取,第一层次、第二层次可以辅助进行深入分析。
3研究结果
3.1动态情境构建结果
1)第一、第二层次动态情境。本文基于文献增长理论,结合文献数量分布,将文献时间跨度划分为初步探索期1991-2003年,稳定发展期2004-2013年,快速发展期2014-2022年,如图2所示。划分依据为每个阶段文献数量:1991-2003年文献数量较少,表明该阶段仍处于探索期;2004-2013年文献数量呈现一定的增长趋势,表明基因编辑领域处于稳定发展阶段;2014-2022年增长率很大,表明处于快速增长阶段(2022年数据只到6月)。在此基础上,考虑文献数量分布的均衡性和主题识别的语料需求,将以上3个区间划分为8个时间窗口:1992-2003年、2004-2007年.2008-2011年、2012-2013年、2014-2015年、2016-2017年、2018-2019年、2020-2022年。
以文献标题和摘要为分析语料,使用NaturalLanguage Toolkit(NLTK工具包)进行去除停用词、词干化处理、英文分词等操作。对每个时间窗口进行LDA主题提取,并使用Coherence指标选取主题数量。最终得到主题提取结果,如表3所示。
表3中主题标签是根据词向量情况,取高频词进行组合,结合领域内权威期刊综述文献以及书籍进行人工筛选判断得到。根据基因编辑领域综述文献显示,基因编辑领域公认有三代基因编辑技术,第一代为ZFN(锌指核酸酶技术),第二代为TALEN,第三代为CRISPR。其中,2013年CRISPR首次被证明可以高效实现基因编辑,之后被广泛应用于医学、植物学等学科,极大促进了基因治疗、药物研究等相关领域的发展。可以发现,提取的主题结果与上述情况比较符合。
接下来通过计算主题间的余弦相似度来表征相邻时间窗的主题相似度,并与设定的阈值0.5比较,从而关联主题,并判定领域主题演化类型。最后使用桑基图进行可视化,得到结果如图3所示。
图3是基因编辑领域主题演化的动态情境构建结果。基因编辑领域的研究内容主要分为三大块:①号区域:各种基础性理论性的研究问题,比如内切酶、蛋白质、基因组学等;②号区域:基因编辑领域的核心的技术方法问题,比如基因编辑的靶向、定位、断裂等;③号区域:基因编辑研究较为成熟后的对基因表达的控制和基因编辑技术的应用(人类疾病的基因治疗与药物)相关的研究。
然后对每个主题局部演化关系进行判定,获得第二层次动态情境,比如T1-0到T2-0与T2-3即为分裂。
2)第三层次动态情境。在第二层次的主题局部演化关系判定上,归纳出三大显著的主题演化路径类型以及无主题演化关系的孤立路径。主题状态分为稳定状态和非稳定状态,稳定状态是指不改变领域内研究主题格局的演化关系,表现为继承关系。非稳定状态是指改变领域内研究主题格局的演化关系,包括新生、消亡、分裂、交叉。鉴于所选的时间窗口比较短,且对于一般的学科发展来说稳定发展才是常态,因此认为“继承”关系占比50%以上为继承发展型,若非稳定关系占比50%以上则不认为是继承发展型。之后观察非稳定状态中哪种占比更大来描述主题演化路径特征。根据以上原则,对基因编辑领域内的主题演化路径进行分类,分类说明如表4所示,分類可视化如图4所示。
3.2模式提取
通过观察高被引论文及其引文在第三层次动态情境的分布情况,发现其呈现出较明显的集中性。一是高被引论文主题与第三层次动态情境的关系。经统计发现可以划分为以下几类:高被引论文选题位于长期继承发展型主题演化路径(较大比例,59.74%)、选题位于长期交叉分裂混合型主题演化路径(较小比例,29.94%)、选题位于新生分裂主导型主题演化路径(较小比例8.60%)、选题位于孤立型主题演化路径(极低比例,1.72%)。二是高被引论文影响力演化与第三层次动态情境的关系。观察的方式是以主题演化的动态情境为底图,画出高被引论文后续引文的动态分布。经过观察总结,发现引文的演化主要可以包括两种表现形式,一种是于本身主题演化路径内继续演化,另一种是能够演化到另外的主题演化路径,论文演化到另外的主题演化路径会需要一定时间,略滞后于在本身主题演化路径的影响力扩散。
在以上观察的基础上,本文结合高被引论文选题所切合的路径类型与高被引论文引文分布最多的路径类型两个维度,计算高被引论文选题所属主题演化路径类型与引文所属主题演化路径类型共现概率,从而提取模式。共现热力图如图5所示。
根据共现结果,总结出主要模式(模式1)、次要模式(模式2和模式3)和特殊模式(模式4、模式5、模式6),如表5所示。
模式1在高被引论文中分布最为显著(59%),模式1的特征是选题切合长期继承发展型主题路径,影响力以继续在本长期继承发展型主题路径演化为主,以下简称为继承一继承模式。其次是模式2和模式3。模式2的特征是选题切合长期交叉一分裂混合型主题路径,以跨径影响长期继承发展型主题路径为主,以下简称混合一继承模式。模式3的特征是选题切合长期交叉一分裂混合型主题路径,影响力以继续在本长期交叉一分裂混合型主题路径演化为主,以下简称混合一混合模式。
3.3模式分析
1)继承一继承模式。继承一继承模式代表的是高被引论文的影响力形成的全过程都处于一个长期继承发展的动态情境之中,这种模式是高被引论文最为显著的模式。长期继承发展型的主题路径在第二层次上表现为跨越时间段长且主题局部演化关系以稳定的继承关系为主,这说明该路径的研究主题始终保持一个较稳定的核心,延续性极强,研究趋势也稳定发展,不断迭新递进。结合第一层次的主题情况,发现基因编辑领域的长期继承发展主题路径始终围绕着基因编辑领域的核心技术方法问题,即基因编辑技术中的靶向、定位、断裂等问题,符合第二层次情况。因此,继承一继承模式的内涵是高被引论文影响力的形成需要选题围绕领域的核心问题,并且在该问题上实现迭新与递进性突破从而在本路径内可累积大量影响力。
以张锋的高被引论文为例。张锋是基因编辑领域顶尖科学家之一,是美国麻省理工和哈佛的伯德研究所的生物化学家、神经科学家,曾获有诺奖风向标之称的盖尔德纳奖、阿尔伯尼奖。张锋有21篇高被引论文符合继承一继承模式,其主题分布如图6所示。
从图6中可以看出,张锋在长期继承发展型主题路径上连续、较稳定产出了许多高被引论文。从T4-1到T7-2,论文的主题依次为“细胞内基因靶向、位点与TALEN”“基因靶向、定位与CRISPR系统”“CRISPR编辑系统、工具与使用”“使用CRISPR的基因编辑及基因工程”。可以看出他的研究内容都是围绕基因编辑中的靶向、定位的方法和工具,但又有研究进展的递进——从TALEN系统到CRISPR系统,再逐渐完善工具方法形成可用于基因工程的工具体系。因此,随着学者在该主题路径的研究的不断投入,积累专业知识与深度,能够对该主题做出独特的贡献或者实现突破,高被引论文产出的连续性和继承性就比较明显,也容易在本路径内获得高影响力。
2)混合一继承模式。混合一继承模式代表的是高被引论文的选题处于一个长期交叉一分裂混合状态的主题情境,但后续影响力则主要通过“变道”,在长期继承发展的主题动态情境之中演化。这种模式是高被引论文的次要模式之一。长期交叉一分裂混合型主题路径在第二层次上表现为跨越时间段长且主题局部演化关系持续以不稳定的交叉、分裂关系为主。这说明该路径的研究主题不断调整和变化,不断吸纳新知识、新方法、新技术等,并发掘、衍生新问题。结合第一层次的主题情况,发现基因编辑领域的长期交叉一分裂混合型主题路径的研究主题比较多样,但主要都是基因编辑领域与病毒学、分子生物学、基因组学等领域交叉的基础性研究,比如蛋白质研究、内切酶研究等,符合第二层次情况。此外,该模式还包括影响力演化的“变道”,跨径影响长期继承发展型研究路径。说明该模式下的高被引论文显著影响了领域中核心问题的迭新与递进性突破,获得了比本路径内更大的影响力。因此,混合一继承模式的内涵是高被引论文影响力的形成可以通过“变道”模式实现,选题诞生于长期吸纳新知识、衍生新问题、不断调整变化的主题演化情境,具有促进领域内核心问题突破的潜力,从而实现影响力“变道”,在领域长期继承发展的研究路径中累积大量影响力。
以Jennifer Doudna的高被引论文为例。JenniferDoudna是基因编辑领域的顶尖科学家之一,是美国加州大学伯克利分校的生物化学家,她在CRISPR基因编辑领域进行了开拓性的工作并做出基础性贡献,获得了2020年诺贝尔化学奖。Jennifer Doudna有6篇高被引论文符合混合一继承模式。
如图7所示.Jennifer Doudna的研究涉猎相对广泛,研究主题不断调整变化,包括CRISPR机制作用、蛋白质剪接、CRISPR系统菌株与噬菌体、植物基因遗传新技术开发等。同时可以观察到,虽然她的研究主题并不固定,但是对于核心问题突破有一定的影响。因此,其高被引论文能够“变道”,在领域核心研究路径中积累影响力。本文以JenniferDoudna的一篇诺奖里程碑论文为例展示“变道”过程,如图8所示,图中颜色代表引文的分布数量。该论文2012年发表于混合路径的T4-3主题,2013年第一次被继承路径的83篇施引文献引用,其中40%施引文献也是高被引论文,并在下一个时间窗口就看到了两类主题演化路径的交叉(T6-9),持续对长期继承发展主题路径产生很高的影响,对于新生分裂主导型主题演化路径后续也产生了很高的影响。对于该论文来说,影响力的形成关键在于“变道”的过程。影响力变道的原动力来自学者在长期吸纳新知识、衍生新问题、不断调整变化的主题演化情境下的研究积淀的“势能”,当势能积累到一定程度,即具备了促进领域内核心问题突破的潜力后,可能再加上一些诱变因素的作用,实现了影响力的变道,在变道后获得比本路径更大的影响力。
3)混合一混合模式。混合一混合模式代表的是高被引论文影响力的形成处于一个长期交叉一分裂混合状态的主题演化动态情境。这种模式是高被引论文的次要模式之一。混合一混合模式的内涵是高被引论文影响力的形成可以处于领域内长期吸纳新知识、衍生新问题、不断调整变化的主题动态情境中,通过吸纳、分化与升华,在后续衍生的路径内累积影响力。
以Rodolphe Barrangou为例。Rodolphe Barrangou是北卡罗来纳州立大学的食品科学教授,他在细菌的研究中发现了CRISPR系统的基本机制。RodolpheBarrangou有9篇高被引论文属于混合一混合模式。
如图9所示,Rodolphe Barrangou高被引論文选题所集中的区域,是混合路径上研究主题的调整变化的关键时期。首先在T2时间片,Rodolphe Bar-rangou的1篇高被引论文参与了挖掘新问题“T2-1基因组的重复序列与CRISPR”,之后6篇高被引论文参与了T2-1与“T2-3归巢核酸内切酶、内含子与真菌及噬菌体”的交叉融合,再之后在分化出的菌株与基因组学的主题方向上产生了相关的高被引论文。因此,其高被引论文选题契合吸纳新知识、衍生新问题、不断调整变化的主题演化动态情境,之后继续在后续衍生的路径内累积影响力。
4结语
本文选取高被引论文作为研究对象,选取过程中“动态情境”的研究视角,基于主题演化维度对高被引论文影响力的形成模式进行探索。
首先,提出一个全新的研究视角——动态情境,发现高被引论文的影响力形成过程与“动态情境”概念有许多共通之处,因此将“动态情境”的概念引入,在本文中定义为对高被引论文影响力形成有关的一系列各维度影响因素在时序上的动态集合体。
其次,本文提出将主题演化维度的动态情境根据粒度由细到粗分为3个层次进行构建,并详细设计了各个层次构建的方法。第一层次为主题演化详细过程,使用基于时间切片和静态主题模型方法相结合的主题演化可视化方法。第二层次为主题局部演化关系,使用5种主题局部演化关系类型进行概括。第三层次为主题演化路径,提出基于主题局部演化关系类型分布的主题演化路径概括方法。
然后以基因编辑领域为例进行模式探索。构建了该领域3个层次的动态情境,使用第三层次进行模式提取,第一层次、第二层次辅助进行模式分析。通过实证,提取出一个主要模式和两个次要模式。
1)主要模式:继承一继承模式。指论文选题切合长期继承发展型主题路径,影响力以继续在本长期继承发展型主题路径演化为主。继承一继承模式代表的是高被引论文的影响力形成的全过程都处于一个长期继承发展的动态情境之中,内涵是高被引论文影响力的形成需要选题围绕领域的核心问题,并且在该问题上实现迭新与递进性突破从而在本路径内可累积大量影响力。
2)次要模式:混合一继承模式。指论文选题切合长期交叉一分裂混合型主题演化路径影响力以跨径影响长期继承发展型主题路径为主。混合一继承模式代表的是高被引論文的选题处于一个长期交叉一分裂混合状态的主题情境,但后续影响力则主要通过“变道”,在长期继承发展的主题动态情境之中演化。模式的内涵是高被引论文影响力的形成可以通过“变道”实现,选题诞生于长期吸纳新知识、衍生新问题、不断调整变化的主题演化情境,具有促进领域内核心问题突破的潜力,从而实现影响力“变道”,在领域长期继承发展的主题路径中累积大量影响力。
3)次要模式:混合一混合模式。指论文选题切合长期交叉一分裂混合型主题发展路径,影响力以继续在本长期交叉一分裂混合型主题路径演化为主。混合一混合模式代表的是高被引论文影响力的形成处于一个长期交叉一分裂混合状态的主题演化动态情境。模式的内涵是高被引论文影响力的形成可以处于领域内长期吸纳新知识、衍生新问题、不断调整变化的主题动态情境中,通过吸纳、分化与升华,从而在后续衍生的路径内累积影响力。
综上所述,本文的研究方法与模式探索结果对于探索、认识动态的高被引论文影响力形成机制具有一定的理论价值与研究意义。同时,本文探索了一种构建主题演化动态情境的方法,从第一层次到第二层次再到第三层次,将主题演化情况的特点逐步进行更高层次的概括,提供了关于高被引论文影响力形成过程的更丰富的信息,为我国进一步提升学术论文影响力和改善科技论文评价工作提供一定的启发。
本研究选择基因编辑领域开展实证研究,考虑到它是近年来最受关注、最活跃的研究领域之一,且知识更迭快,具有较显著和复杂的主题演化的动态情境。但还应考虑到不同学科的特性,本文所探索的模式不可简单地泛化,还需要进一步从具有不同特点的学科领域进行对比观察。本文仅从主题演化维度探索了高被引论文影响力形成的几种模式,后续还可以考虑从团队合作、学者个人成长等多个维度进行探索,并且考虑结合引文网络进行更深入的分析。