迟培娟,丁洁兰,冷伏海
(1. 中国科学院文献情报中心,北京 100190;2. 中国科学院科技战略咨询研究院,北京 100190)
每一次重大科技革命或高技术产业形成都离不开突破性研究成果。突破性论文是一种常见的突破性研究成果,已有研究对突破性论文的界定较少,王海燕[1]认为,高影响力论文是指研究成果、思想、观点和方法等会对本学科的发展以及科学共同体的交流产生重大影响的科技论文。其他学者大多是对突破性研究进行界定,例如,库恩等从研究范式的角度分析了突破性研究可能颠覆或者创建新的研究范式[2-3]或引领新的科学范式[4-5]。部分学者从对本领域或其他领域科学研究有重大影响这一视角界定了突破性研究的内涵[6-8],还有学者认为突破性研究具有创新性或新颖性[9-10]。本研究认为,突破性论文是一类具有较高创新性,其理论、研究方法、结论等对本领域或其他领域产生了广泛影响,对社会具有重要价值和影响的基础研究成果。
突破性论文的识别对科技创新的前瞻性布局和科研管理都具有重要意义,当前主要依赖专家评议,广受认可却效率低下,必须采用其他方法加以辅助。基于文献计量学的突破性论文识别研究多围绕引用特征来进行分析,常见的是学术影响力特征,还有研究尝试了从引文路径、多代引用关系、引文网络、引用文本特征等视角来遴选突破性论文,也有学者综合多个指标尝试突破性论文的早期识别,下文将对相关研究进行综述。
学术影响力是学术质量类指标,常见的是以被引频次代表学术影响力。突破性论文的高被引特点基本已经达成共识[1,11-14],但其引用阈值并不明确,有的研究将领域Top 1‰[1]、Top 1%[11]或Top 2%[13]论文作为潜在突破性论文,科睿唯安则将被引频次超过2000 次的论文作为潜在诺贝尔奖成果[15]。为了实现高被引论文的快速识别,部分研究尝试利用论文的短期引用(论文发表后1~5 年)来预测未来的高被引论文[16-25],但这些研究的准确率和召回率依然无法满足实用需求。
Huang 等[26]通过分析引文级联变化识别变革性研究,该方法主要是衡量新的论文在多大程度上破坏了代表既定范式论文引文级联的增长;王海燕等[27]以引文网络中的关键节点、研究前沿核心论文和ESI(Essential Science Indicators) 高被引论文作为突破性论文的代表,利用引用强度和技术生命周期来预测论文是否为突破性论文。上述两项研究适合单篇种子文献分析,操作较为复杂。
Wu 等[28-29]利用文献及其前后向引用关系来计算文献的“颠覆性”得分,颠覆性D的计算公式为D=(i类施引文献数量-j类施引文献数量)/所有施引文献数量,其中i类施引文献是指只引用目标论文的文献,j类施引文献引用目标论文的同时引用目标论文的参考文献,D值越接近于1,越有可能是颠覆性文献;该研究发现团队大小(以文献的作者人数来衡量)与论文的颠覆性负相关,提出小团队更容易产生颠覆性创新的观点,但并未确定有效的阈值来区分突破性论文和其他论文。
Schneider 等[13]将各个领域中Top 2%高被引论文遴选出来,并进一步区分了突破性论文和追随者论文:如果候选论文B2 引用了候选论文B1,引用B2的论文有一定比例同时引用B1,那么B2 论文就是追随者,B1 论文可能是突破性论文;验证结果发现,11 篇突破性论文中可以识别出7 篇。
有学者采用拓扑网络对领域“关键点”进行回顾性识别。陈超美团队将科学网络中具有高中介中心性的论文视为科学转折点[30-31];Min 等[32]认为,3个引文网络结构指标(平均聚类系数、网络连通性和网络密度)对早期发现突破性论文可能具有重要意义,但识别效果未经验证。可视化技术也可以在突破性论文识别过程中发挥作用。Kleinberg[33]提出了突发监测算法,根据词频变化率找出某一时间段内的突现词;陈超美开发的CiteSpace 中的Burst De‐tection 就是基于类似的算法来监测突现词[31]。但这些研究针对的都是研究主题而非单篇论文。
Small 等[34]以生物医学领域为例,提取了引用参考文献的文本信息或上下文信息,发现被包含“discover”的语句引用20 次以上的论文中有8%获得了诺贝尔奖。杨雪梅等[35]以年度十大科学突破的关键论文和诺贝尔奖关键论文作为突破性论文语料数据进行特征词提取,通过特征词识别F1000 数据库某些重要文献,其查全率能够达到90%以上。
为了实现突破性论文的早期识别,Wolcott 等[36]利用随机森林模型识别出6 个月的被引频次、期刊影响因子、作者的高被引论文数量、合著者数量、合著网络点度中心性、本领域的高水平论文数量等指标对识别突破性论文的贡献度较大,采用这些指标预测论文属于突破性论文还是属于对比数据集,预测结果的准确性可达0.91,召回率可以达到77%;该方法的优点是及时性强,适合针对大量文献的海选,但研究中采用的非突破性论文数量过少,仅有2500 篇,更换数据后的适用性尚有待验证,并且预测结果的召回率偏低。
(1)目前突破性论文识别采用的大部分指标实用性不强。一是大部分指标仅能针对少量种子文献进行分析,分析方法复杂,不适合大数据量分析,且分析结论存在普适性问题;二是突破性论文阈值不明确,没有确切的阈值可以将突破性论文和其他论文区分开;三是识别效果还有待于进一步提升,召回率偏低;四是缺少有效的即时性指标,难以实现突破性论文的早期识别。
(2)突破性论文的学术影响力特征需要进一步明确。尽管许多研究认为突破性论文具有高学术影响力特征,但不同研究中采用的阈值有差异,没有明确的阈值来协助遴选;此外,当前引用的观察窗口基本在5 年以上,如果能够进一步明确突破性论文的短时间(2~3 年)引用特征,将有助于实现突破性论文的早期识别。
(3)当前突破性论文的识别过于依赖文献引用信息,缺少对其他特征的进一步研究。例如,有学者提出突破性论文应当具有创新性和新颖性,还有学者认为变革性研究往往具有延迟认可和科学-技术交叉(更容易被专利引用)等特征[4]。这些观点缺乏实证研究的支持,因此需要进行更加深入的研究。
作为一类重要的基础研究成果,突破性论文在“科学创造力”方面应该优于其他论文。为了评估基础研究创新的程度和重要性,有学者将基础研究的“科学创造力”分解成“新颖性”和“有用性”两个方面[37-41],Piffer[42]强调,“新颖性”和“有用性”是所有层次创造力所共有的。
“新颖性”强调了创新本身的独特性[43],是论文在发表背景下的自我特征,一经出现就已经固定。通常情况下,只有具备了“新颖性”的论文才能够通过同行专家的评议并发表,不同论文的新颖性程度可能有差异。“有用性”等同于“影响力”,强调了创新结果在使用和传播过程中是有价值的,研究成果必须能一定程度上对后续基础研究、技术开发或者社会创新产生启发和影响才能体现“有用性”。“有用性”必须经过实践检验,领域专家可以根据自身的知识来预判“有用性”。在知识传播的不同阶段,基础研究可以产生不同的“影响力”。一项基础研究如果对后续基础研究有用,通常会被本领域或其他领域的科学家引用,在基础研究领域就会产生一定的“学术影响力”[44-46]。同时,基础研究中的科学知识大多要扩散到学术界以外,通过创新链向下游传播启发技术创新[47],产生一定的“技术影响力”[48-49],并最终实现其社会价值(图1)。
图1 基础研究成果创造力的特征分解
评价突破性论文实际上也是衡量科技论文“科学创造力”的过程。突破性论文的“科学创造力”较高,因此在“新颖性”和“有用性”方面可能表现突出,其中“有用性”至少体现在“学术影响力”和“技术影响力”两个方面。基于以上分析,本研究提出了突破性论文的三元计量特征(以下简称三元特征)理论:①具有较高的新颖性,知识具有独特性和异质性;②具有高学术影响力特征,获得科研共同体的广泛认可;③一般具有高技术影响力特征,通过对技术开发产生广泛而深远的影响造福人类社会(图2)。
图2 突破性论文的三元计量特征
目前已有的计量研究中,突破性论文的新颖性特征只有少量定性描述[8-10],没有定量研究的支持;突破性论文具有高学术影响力特征已经广受认可[1,11-14],但引用阈值和早期引用特征尚不明确;突破性论文的技术影响力仅有少量研究涉及,例如,杜建等[4]认为变革性研究往往具有科学-技术交叉(更容易被专利引用)特征。本研究将围绕新颖性、学术影响力、技术影响力3 个方面来明确突破性论文的计量特征。
3.2.1 突破性论文的新颖性测度方法
当前新颖性指标算法主要基于知识组合创新理论,采用的知识单元包括参考文献所在期刊和文本内容等,还有少量研究基于文本相似性进行计算[50-51],有必要从中遴选更适合的指标来测度突破性论文的特征。相比于期刊[38,44,52-55],基于文本内容组合的算法能够更好地体现论文知识的创新,如作者关键词组合[56-57]、主题词组合[58-59]和MeSH 词对[60-63]。其中,MeSH 词表是由美国国立医学图书馆发布的生物医学领域权威词表,经过领域专家设计和认可,相比于作者关键词和主题词更加客观标准。但是当前基于MeSH 词对的计算方法较为简单,主要基于MeSH 词对出现时间长短、出现频次或者新MeSH 词对占比,忽视了随机组合概率的影响。
本研究参考Lee 等[38]基于参考文献期刊对组合的算法,对基于MeSH 词对的新颖性指标[63]进行了改进,考虑了MeSH 词对随机组合概率的影响,以区分词对组合的难易程度,进而揭示组合的新颖程度。具体算法如下:
(1)构建目标论文数据集DOI-MeSH 词对应关系表,统计单篇论文所有MeSH 词对组合,将同一年出版论文所有MeSH 词对汇总在一起,构成当年MeSH 词对整体数据集N。
(2)比较某个MeSH 词对在整体数据集实际出现的概率与其预期出现概率的比值,这个比值代表着该词对的组合难易程度,即保守性Commonness:
其中,分子表示t1t2组合在整体数据集N中实际出现的概率;分母表示t1t2组合在整体数据集N中预期出现的概率。如果t1t2组合实际出现概率低于预期概率,即Commonness<1,说明该知识组合更困难、更新颖。
(3)列出单篇论文所有MeSH词对的Commonness,由小到大排列,取10%处的值作为这篇论文的保守性Commonness,采用对数变换来获得保守性的正态分布变量,新颖性与保守性相反,因此,
meshnov 值越大,表示知识组合比预期组合越少见,新颖性越高。
新颖性指标是本研究提出的三元计量特征的核心指标,而计量学指标在应用之前有必要验证其能否有效反映其想要衡量的内容,以揭示其先进性和有效性。Harnad[64]认为,指标必须根据其意图衡量和预测的内容进行验证,验证标准是同行专家评估。本研究将通过比较本研究改进的新颖性指标以及已有新颖性指标与专家评议结果的相关性,以验证本研究改进的新颖性指标的优越性。
F1000 数据库是生物医学领域非常有特色的同行评议数据库,该数据库收录的重要文献应该是更具创新性的。因此,本研究将通过logistics 多项回归模型分析新颖性,结合论文是否被F1000 推荐,来验证本研究提出的新颖性指标与对比指标的收敛效度。对比指标refnov 选择Lee 等[38]基于参考文献期刊组合的新颖性算法,该算法常被采用且已有学者经过对比认为较优[65]。此外,为了避免期刊影响因子的影响,将5 年期刊影响因子加入了自变量;由于该数据库对论文的收录多在论文发表后数月内完成,因此未纳入被引频次。
在Stata 软件中利用多项logistics 回归模型进行分析,logistics 多项回归公式为
其中,Y为因变量,即是否入选F1000 数据库;X1、X2、X3分别为自变量meshnov、refnov 和JIF(jour‐nal impact factor,期刊影响因子);a、b、c分别表示3 个自变量与Y的相关系数。
为了直观表示因变量和自变量的相关程度,进一步计算odds 值,该值表示在指定x条件下,事件为1 或0 的概率比:
本研究并不关注模型拟合的效果,只关注自变量的变化如何影响入选F1000 的概率。通过对比两种新颖性指标与入选F1000 数据库的关系来验证哪种指标更符合专家意见,并选用更优的指标来进行新颖性测度。
实证研究结果表明,生物医学领域论文的两种新颖性与是否入选F1000 数据库的相关性存在明显差异。以2008 年为例,本研究改进的新颖性指标meshnov 与是否入选F1000 数据库的相关系数为0.18,odds=e0.18=1.197,表明meshnov 每增加1 个单位,入选F1000 的概率上升19.7%;另一个对比指标refnov 与是否入选F1000 的相关系数为-0.08,odds=e-0.08=0.923,也就是说每当论文的refnov 增加1个单位,入选F1000 的概率下降7.7%。期刊影响因子与是否入选F1000 的相关系数为0.11,odds=e0.11=1.116,这表明期刊影响因子每增加1 个单位,入选F1000 的概率上升11.6%(表1)。
表1 新颖性与入选F1000数据库的关系分析
分析结果表明,对比指标refnov 与论文是否入选F1000 负相关,这与专家的遴选标准是相反的,因此refnov 不能较好地体现专家认可的创新性。本研究改进的指标meshnov 与专家的预期是一致的,而且与是否入选F1000 数据库的相关程度要优于期刊影响因子,说明meshnov 更能体现专家认可的创新性,因此新颖性指标meshnov 比refnov 更适合衡量论文的创新性。
3.2.2 突破性论文的学术影响力测度方法
论文的学术影响力分析较为常见,最常使用的指标是论文被引频次。目前,替代计量学指标也越来越多地被使用,但由于这类指标存在覆盖范围小[66]、热点偏离学术研究等问题[67],因此,本研究的分析将基于论文被引频次进行。
突破性论文一般需要等待一段时间才能充分显示其影响力。诺贝尔奖论文通常发表20 年以上才能获得充分认可[68],因此,需要首先考察突破性论文的长期学术影响力特征。已有研究发现生物学领域论文发表5 年之后的被引排名就开始慢慢趋于稳定[69],因此8~10 年的观察窗口可以显示大部分论文的学术影响力特征。本研究统计了8~10 年前发表的生物医学领域论文被引频次,同时,为了消除不同学科领域引用差异和领域大小的影响,对同年发表的同领域论文依据被引频次进行排名并计算排名百分比。如果论文属于多个领域,选取排名百分比更小的领域作为分析依据。
表5 两种早期识别突破性论文方法的比较
为了实现突破性论文的早期识别,有必要对其短期学术影响力特征进行分析。采用同样的方法分别计算论文发表后1 年(论文发表当年)、2 年和3年时间窗内的被引频次领域排名百分比,验证突破性论文的短期学术影响力是否具有明显特点。
3.2.3 突破性论文的技术影响力测度方法
技术影响力主要衡量基础研究对技术开发的影响程度。专利对论文的引用是加快技术创新速度的重要驱动力[70]。多项研究表明,生物等领域的专利更倾向于引用期刊论文[71-72],通过测量文本相似性发现大多数专利引用都可以表明知识之间的联系[73]。因此,基础科学向某一特定技术领域的知识传递,可以用该领域内的专利对科学论文的引用频次来定量描述[74-78]。研究发现,专利更倾向引用在自身和其他领域具有较大影响力的论文[79-80];随着引用论文影响力的增加,施引专利的价值也在增加[81]。虽然学术影响力和技术影响力有一定的关联性,但二者衡量了论文不同方面的特征,在科学界和技术界都被高度引用的论文较少重叠[82]。
目前论文的技术影响力分析主要集中在国家[83]、期刊[84-85]、机构[86-87]和单篇论文[4]层面。单篇论文层面,杜建等[4]采用论文是否被专利引用这一指标来寻找被延迟认可的突破性论文,但是被专利引用的论文比例较高,有的领域超过了10%,直接采用这一指标来衡量论文的技术影响力过于粗略。
如果论文被更多高价值专利引用,那么论文的技术影响力也相应更高。本研究参考机构层面的评价指标[86]提出了针对单篇论文的技术影响力指标计算方法,同时考虑了论文被专利引用的次数和施引专利的家族大小。施引专利家族大小体现了专利的价值,因为专利申请需要花费大量的时间和金钱,申请人会根据对专利价值的预判决定向多少个国家或地区进行专利申请。本研究构建的针对单篇论文的技术影响力指标为
其中,TI 表示技术影响力指数;Cp 表示论文被专利引用的次数(以专利家族为统计单位);F表示施引专利平均家族大小。
为了消除领域的影响,依据目标论文的技术影响力指数进行排名并计算论文的排名百分比,分析其中突破性论文的技术影响力特点。
生物医学领域是全球重要的战略方向之一,其基础研究成果可以快速转化为技术应用,成为驱动经济发展的高新技术产业,各国纷纷将其纳入优先发展领域。如果能实现该领域突破性论文的识别,可以更好地进行重大研究的前瞻布局和针对性的科研管理。本研究将以生物医学领域为例,分析突破性论文的三元特征理论是否成立,进一步完善重要成果的科研评价方法。
4.1.1 标准数据遴选
要准确地揭示突破性论文的计量特征,标准数据的选择至关重要。有研究以诺贝尔奖相关论文作为突破性论文的标准数据,但这类论文数量稀少,难以进行计量分析。近年来,Science杂志每年都会发布年度十大科学突破,其中生物医学领域相关研究占据了很大一部分,这些研究获得了广泛的认可。本研究收集了2008—2010 年发表并被评选为年度十大科学突破的15 篇生物医学领域论文作为标准数据。选择这一时间段的原因是引用观察时间窗在8 年以上,可以充分显示突破性论文的影响力。同时还收集了2013 年被评为年度十大科学突破的11 篇相关论文作为验证数据。
4.1.2 数据范围
生物医学领域论文数据总集:被PubMed 数据库收录并标注MeSH 词(3 个及以上),同时被Web of Science 数据库收录,文献类型为Article 的论文。
论文被论文引用统计:2008—2010 年论文被引频次的统计时间是2019 年6 月,数据来自瑞典皇家理工学院基于Web of Science 裸数据的Bibmet 数据库;2013 年论文被引频次统计的截止时间是2021年3 月。被引频次均采用他引,排除了目标论文所有作者发表论文的施引。
论文被专利引用统计:依据2021 年1 月在Lens数据库检索的结果。
4.1.3 学科领域划分方法
为了避免学科差异的影响,本研究后续分析均在学科领域内进行。学科分类参考Web of Science数据库的学科领域。本研究遴选出的突破性论文多来自Science、Nature等综合性期刊,必须将综合期刊发表的论文准确分配到相关学科领域才能保证分析结果的可靠性。本研究参考了瑞典皇家理工学院Bibmet 计量小组采用的基于目标论文的参考文献所在领域来划分的方法:统计论文的参考文献所属学科分类,依据学科包含的参考文献数量降序排列,选取参考文献数量最多的学科C1 作为替换的学科;如果排名第2 位的学科领域C2 的参考文献数量N2大于等于C1 参考文献数量N1 的0.625,则C2 也作为替换的新学科,否则学科重新分类终止;按照此规则继续向下循环,直到学科分类终止或者新学科分类达到6 个。
4.2.1 突破性论文的新颖性特征验证
为了明确突破性论文的新颖性特征,本研究分析了15 篇突破性论文中本研究改进的新颖性指标meshnov 和对比新颖性指标refnov 的特点。结果发现,突破性论文的meshnov 领域排名在2.66%~45.13%,全部都在Top 50%以内,其中有11 篇论文领域排名在20%以内,可见突破性论文的新颖性是较高的。突破性论文的refnov 领域排名百分比差异非常大,6.68%~87.01%不等,也就是说,突破性论文refnov 在各自领域中的排名并不突出,不符合我们对突破性论文具有较高创新性的认知,也可以从另一个侧面反映meshnov 是比refnov 更优的新颖性指标。本研究还发现,突破性论文的meshnov 指标不仅在全领域排名Top 50%以内,在各领域Top 1%高被引论文中,突破性论文的新颖性排名依然可以稳定在Top 50%以内(图3)。这说明突破性论文确实具有较高的新颖性,本研究改进的新颖性指标可以较好地测度突破性论文的创新特征。
图3 突破性论文的两种新颖性指标排名分析
4.2.2 突破性论文学术影响力特征验证
本研究分析了生物医学领域突破性论文的长期学术影响力和短期学术影响力特征。结果表明,在8~10 年的长期观察窗口下,生物医学领域突破性论文的领域排名百分比在0.011%~0.993%,均在Top 1%以内(表2),与此前部分研究采用的Top 1‰、Top 2%等阈值不同,本研究通过实证认为生物医学领域突破性论文的长期学术影响力应该排名在领域Top 1%。本研究涉及的学科领域论文数量多在1 万~6 万篇,对于更小的领域来说(总论文数少于1 万篇),这一阈值可能有变化。本研究仅涉及生物医学领域的突破性论文,尚不清楚其他领域突破性论文的引用排名情况。
表2 生物医学领域突破性论文的学术影响力和技术影响力分析
为了尽早识别出重要研究,本研究更加关注短时间观察窗口下,突破性论文的学术影响力特征。实证研究发现,在论文发表后1 年,大部分突破性论文在发表当年的引用频次排名超过了Top 1%的阈值;2 年的引用频次排名基本都在Top 1%以内,只有1 篇论文在排在1.018%(表2),3 年的引用频次排名全部都在Top 1%以内,与8~10 年窗口下的总引用排名较为接近,这与Adams[88]之前的研究结果较为吻合。
由此可见,生物医学领域突破性论文的高学术影响力特征在论文发表后2~3 年时间就已经开始显现,这可能和两个原因有关:一是这些突破性论文中并不存在延迟认可的情况,二是生物医学领域知识传播速度较快,引用频次可以快速地稳定下来。由于延迟认可的突破性论文较为少见,因此,可以利用这一特征实现生物医学领域突破性论文的早期识别。
4.2.3 突破性论文技术影响力特征验证
本研究分析了生物医学领域论文的技术影响力特征,发现只有少部分论文具有技术影响力。以2008 年生物化学与分子生物学领域为例,仅有22.7%的论文被专利引用过,其中约一半仅被引用1 次(以专利家族为统计单位,如果一篇论文被同一个专利家族的多个专利引用,仅计数1 次)。高技术影响力的论文比较少见,仅有0.31%的论文其技术影响力超过500。论文的学术影响力(被引频次)和技术影响力为低度相关(Pearson 相关性系数为0.354),说明二者衡量的是论文不同方面的特征。
15 篇突破性论文的技术影响力是所在领域平均水平的4~104倍,论文领域排名百分比通常在0.010%~0.73%,均在Top 1%以内,说明突破性论文具有高技术影响力特征(表2)。
突破性论文一般属于Top 1%高被引论文,进一步分析发现突破性论文的学术影响力不一定高于Top 1%高被引论文平均水平,但其技术影响力均高于Top 1%高被引论文平均水平。这说明与其他Top 1%高被引论文相比,突破性论文的技术影响力更加突出,这体现了突破性论文对社会创新的重要贡献(表3)。唯论文引用的评价模式忽视了基础研究对技术开发的影响,在高被引论文中,突破性论文的技术影响力表现十分突出,这可以作为进一步区分追随式高被引论文和突破性论文的重要依据。
表3 生物医学领域突破性论文和高被引论文的技术影响力分析
4.2.4 突破性论文三元计量特征稳定性验证
通过以上实证分析可以发现,突破性论文具有高新颖性、高学术影响力和高技术影响力的特征,本研究提出的突破性论文三元计量特征理论框架是成立的。本研究通过实证还进一步明确了突破性论文在3 个指标上均存在一个阈值。为了验证上述计量特征是否稳定,本研究以新的突破性论文数据进行验证,分析其新颖性、学术影响力和技术影响力三方面计量指标特征是否依然成立。
本研究选择2013 年入选Science杂志年度十大科学突破的生物医学领域论文进行验证,共筛选到11 篇突破性论文。这些论文主要属于生物化学与分子生物学、神经科学和免疫学3 个领域。结果显示,这11 篇突破性论文的新颖性、长期/短期学术影响力、技术影响力领域排名均在Top 50%、Top 1%和Top 1%范围内,说明生物医学领域突破性论文的三元计量特征是稳定存在的。
鉴于突破性论文的三元计量特征是稳定存在的,可以尝试利用3 个指标综合遴选潜在的突破性论文。基于本文4.2.4 节的结论,本研究提出三元指标识别方法,将新颖性领域排名在Top 50%以内、长期学术影响力和技术影响力领域排名均在Top 1%以内的论文作为潜在突破性论文。以2013 年生物化学与分子生物学、神经科学和免疫学领域为例(数据说明见4.1 节),分别遴选出48 篇、13 篇和20 篇潜在突破性论文。
为了证明该遴选方法的有效性,将其与常规遴选方法进行对比。对比方法主要采用当前较为常用的被引频次排名和期刊影响因子两种指标来综合遴选。Hicks 等[89]认为,细胞生物学排名较为突出的期刊的影响因子约为30,因此遴选被引频次入选领域Top 1%,并且发表在期刊影响因子大于30 的论文作为潜在突破性论文。通过上述对比方法在生物化学与分子生物学、神经科学和免疫学3 个学科领域分别遴选到294 篇、67 篇和65 篇潜在突破性论文(表4)。
表4 两种突破性论文的遴选方法比较
对比分析发现,本研究提出的三元指标方法和对比方法召回率均可以达到100%,即不遗漏突破性论文标准数据,这对提高方法的实用性至关重要,如果召回率偏低,还需要采用其他方法来补充,失去了提高初筛工作效率的意义。从精准率来看,三元指标方法明显更优,精准率是对比方法的3~6 倍,可以将单个领域候选论文数量控制在50 篇以下,大大降低了专家人工判读的工作量,提高了初步筛选的工作效率。
突破性论文的早期识别更具有价值和意义。本研究提出的新颖性指标具有即时性,一经发表就可以进行计算,短期学术影响力等待时间较短,结合新颖性和短期学术影响力特征有望实现突破性论文的早期识别。为了实现突破性论文的早期识别,本研究还将加入期刊影响因子这一指标,虽然有不少学者和科学家反对采用期刊影响因子作为单篇论文的评价指标,但是本研究认为,论文是经过同行评议发表的,不同期刊的评审标准本身就可以部分体现研究被认可的程度,诺贝尔奖获得者在Nature、Cell和Science三大顶级期刊的发文数量远远超过其他期刊[90]。
基于三元计量特征理论,本研究提出了三元指标早期识别方法,将生物医学领域新颖性领域排名Top 50%以内,论文两年引用排名Top 1%以内,期刊影响因子在30 以上的论文作为潜在突破性论文,并以2013 年3 个学科领域为例进行分析。对比方法是将两年引用排名Top 1%以内,期刊影响因子在30 以上的论文作为潜在突破性论文。
分析结果表明,两种早期识别方法可以涵盖所有突破性论文标准文献,但是二者在精准率方面存在很大差异。如表5 所示,对比方法中,3 个领域入选的潜在突破性论文分别是333 篇、77 篇和69篇,而三元指标早期识别方法入选的论文数分别是155 篇、33 篇和41 篇,精准率是对比方法的2~3倍,入选的论文数量压缩了一半左右。从识别效果来看,在5 万篇论文以上的大学科领域中初筛的潜在突破性论文有155 篇,在评价工作中具有实用性,可以为后续专家评议奠定较好的基础。
通过上述对比分析可以看出,利用本研究确定的突破性论文计量特征,不仅可以在较长时间窗口下实现突破性论文的精准识别,还可以在较短的时间窗(2 年)下实现突破性论文的早期识别。与已有其他突破性论文的早期识别研究相比,本研究提出的三元指标遴选方法精准率明显高于对比方法,可以将单个领域潜在突破性论文数量控制在合理范围内,具有良好的实用价值。
基于前期工作[91],本研究分析了突破性论文的三元计量特征,并形成了突破性论文遴选和早期识别方法,主要研究结论如下。
(1)突破性论文具有高新颖性、高学术影响力和高技术影响力三元特征。
本研究提出突破性论文的三元特征理论,即突破性论文具有高新颖性、高学术影响力和高技术影响力计量特征。本研究以生物医学领域为例对三元计量特征进行验证,结果发现突破性论文的新颖性领域内排名在Top 50%以内,学术影响力领域内排名在Top 1%以内,技术影响力领域内排名在Top 1%以内,三元计量特征理论是成立且稳定存在的。这一结论为突破性论文的高效遴选和早期识别奠定了基础。
(2)突破性论文三元指标遴选方法和早期识别方法是有效的。
本研究基于新颖性、学术影响力和技术影响力三元计量理论构建了突破性论文的三元指标识别方法,还将其应用于突破性论文的早期识别。与已有方法相比,本研究提出的新方法具有更高的精准率,可以将潜在突破性论文数量控制在合理范围内,有效减少后续专家评议的工作量;适合针对大量文献的批量分析,大大提高了评议效率。
新颖性特征是本研究提出的突破性论文三元计量特征理论中的核心要素之一。本研究以MeSH 词对作为知识组合代表,同时考虑了随机组合概率的影响,提高了新颖性对创新衡量的准确性。由于新颖性具有即时性,明确突破性论文的高新颖性特征,为突破性论文的早期识别提供了一个很好的工具。本研究改进的指标适用于生物医学领域,其他领域还缺少类似于MeSH 词表的权威知识代表,后续可以考虑利用识别的主题等替代MeSH 词表优化新颖性计算方法,进一步扩展研究结果的适用范围。
本研究打破了以往只在学术范畴探讨论文影响力的局限,从论文对技术开发推动作用视角剖析了论文的技术影响力,更加全面地测度了基础研究成果的影响力。生物医学领域的基础研究可以快速转化为技术应用,因此突破性论文同时具有高学术影响力和高技术影响力特征。突破性论文大多来自一般性基础研究,一段时间后可以显示实际应用价值,因此本研究提出的三元计量特征对于大多数突破性论文是适用的。但对于纯理论研究和纯应用研究领域,该方法还需要进一步调整才能使用。纯理论研究很难转化为实际应用,如考古和理论物理研究,其重大影响多限于人类认知,因此技术影响力较低。纯应用研究对技术创新的影响较大,但学术影响力较低。因此,在纯理论研究和纯应用研究领域,需要考虑突破性论文识别方法的差异性,赋予三元指标不同的权重,例如,纯理论研究论文的技术影响力指标权重应适当降低,学术影响力权重应该适当升高。
突破性论文的早期识别十分重要。本研究采用的新颖性是一个非常好的即时性指标,而学术影响力和技术影响力考察的是论文在实际应用中的价值,不经过时间检验难以预知,尤其是技术影响力需要更长的时间来检验。突破性论文的早期识别应遵循科技发展规律,尽量减少而非消除时间滞后性。未来提高突破性论文早期识别的精准性和效率,可以从三个方面入手。一是提高技术影响力指标的时效性:本研究采用8 年及以上观察窗口,未来可以尝试利用更短时间(3~5 年)内的专利引用、专利权人重要性等信息来计算技术影响力;二是挖掘其他即时性指标的特征:例如,自我评价语句文本特征和学科交叉特征等;三是提高突破性论文评价和识别效率:例如,在本研究的基础上实现新颖性和技术影响力计算平台化。