利用文献计量学解析全球miRNA 最新研究趋势

2022-07-22 08:06蓝康澍雷柞何祎雯高龙鑫潘传英王勇胜
中国畜禽种业 2022年6期
关键词:检索论文癌症

蓝康澍 雷柞 何祎雯 高龙鑫 潘传英 王勇胜*

(1,西北农林科技大学动物医学院 712100;2,西北农林科技大学图书馆 712100;3,西北农林科技大学动物科技学院 712100)

微小RNA(microRNA,miRNA)是一种内源性、长度为18~25 个核苷酸的非编码单链RNA。1993 年Lee 等首次在其研究中提到Lin-4(miRNA 的一种),由此拉开了对miRNA 研究的序幕[1]。近年来,miRNA 被证实与多种癌症有关[2],因此,逐渐引起人们的重视。miRNA 的出现使得对癌症早期诊断和治疗成为可能,因此,近年来,miRNA 一直是癌症相关研究的热点,关于miRNA 与癌症发生机制的研究层出不穷[3]。但目前对miRNA 的研究只是冰山一角,对其作用机制还存在许多未知,加快对miRNA 的研究有助于进一步了解肿瘤的发生发展过程及其治疗手段。

文献计量学(Bibliometrics)是一门采用数学、统计学方法对研究文献等计量指标进行分析,以对某个领域进行有效可视化,进而帮助科研人员分析领域整体趋势,为该领域的后续发展提供不同见解的学科[4]。文献计量学最早的应用可追溯到18世纪,科研人员利用文献计量学完成对某一领域的基础文献统计。随着文献计量学在越来越多的领域应用,以及使用越趋成熟,文献计量学的内容已从简单的数理统计发展为使用可视化软件对计量指标进行分析以达到解析研究热点和预测发展趋势[5,6]。

目前,国内外尚未有学者对miRNA 相关论文发表进行系统分析,因此,miRNA 相关研究趋势及论文发表情况仍不明确。本文从文献计量学的角度,基于Web of science(WOS)和中国知网(CNKI)数据库,首次对20 世纪以来miRNA 的相关论文进行分析,结合Excel 2019、Citespace 5.6[7]和GraphPad Prism 9.3.0[8]等软件,从论文发表量、国家、作者、研究领域等方面进行动态分析,旨在为未来miRNA 相关研究提供全新方向及思路。

1 数据来源及研究方法

国际miRNA 论文发表概况分析以WOS 数据库为基础,对20 世纪以来发表的相关文献进行可视化分析;国内miRNA论文发表概况则以CNKI 数据库为基础,同样以2000~2021 年作分析区间,将miRNA 研究概况具体化。

1.1 国际论文数据来源

数据源于WOS 核心合集(Web of Science Core Collection),检索方式为高级检索-检索式:TI=(miRNA OR microRNA),索引日期为:2000-01-01 至2021-12-31,检索日期为2022 年2 月5 日,共检索出56284 条SCI 论文,其中有23939 篇来自国内(通过添加国际/地区筛选条件)。对论文发表的国家/地区和发表论文质量进行进一步分析。

1.2 国内论文数据来源

由于WOS 数据库不太收录中文论文,而我国部分论文都发表在中文期刊,因此,对CNKI 数据库上的论文进行分析,有助于我们更进一步了解国内miRNA 相关研究进展。

在知网中进行专业检索,检索式为:TI=‘miRNA’ +‘microRNA’+‘微小RNA’+‘微RNA’,检索区间与WOS 中检索区间一致,为2000-01-01 至2021-12-31,检索日期为2022 年2 月5 日,共检索出论文25541 篇,对结果进行可视化分析,进一步得出结论。

1.3 分析及研究方法

在Web of Science 和中国知网上对相关关键词进行检索,使用网站的可视化分析功能对文章发表情况(如发表主题、国家等)进行初步分析,再将数据导出至Excel 2019 软件中进行整理。通过网站输出的数据,利用Citespace 5.6 软件进行关键词共现分析和聚类分析:从Web of Science 中导出数据(文件格式为txt)后,将Citespace 界面的node types 选定为“Keyword”,时间区间设为“2000~2021”,时间切片设为1。在进行正式分析前对数据进行预试验分析,界面中Top N%(表示每个时间切片引用次数最多的前N%)设定为10.0,由于文献数量太多,分析结果的节点过大且图谱杂乱交错,最终选定适宜设定值为1.0。

2 结果

2.1 国际发表论文概况

分析结果显示,自20 世纪以来,miRNA 相关SCI 论文发表趋势是先上升后下降。2001~2019 年,miRNA 相关论文的发表数量大幅度提升;但在2019 年后,miRNA 相关论文的发表数量明显下降,如图1。

图1 WOS 数据库20 世纪以来miRNA 相关论文发表量变化

从研究方向看,肿瘤学以12146 篇相关论文在所有miRNA 相关SCI 论文中占比最大(21.58%),远超于第二名生物化学/分子生物学(相关论文7985,占总发表论文数的14.187%)和第三名细胞生物学(相关论文7266 篇,占总发表论文数12.91%)。

在miRNA 相关论文发表的国家中,中国以23939 篇占总发表论文的42.53%,远超于第二名的美国(发表论文14445篇,占总发表论文的25.66%)和第三名的德国(发表论文2841篇,占总发表论文的5.09%),见表1;此外,在发表miRNA相关论文的作者中,发表论文数前十名都来自我国;在基金资助机构方面,我国国家自然科学基金委员会资助相关论文10500 篇,占所有论文数的18.66%,见表2。

表1 国际miRNA 相关论文发表数Top 10 国家

表2 国际miRNA 相关论文发表数Top 5 基金资助机构

论文发表数量不能作为单一衡量指标,所发表论文的质量也需要受到重视。为更准确衡量国家之间miRNA 发表论文的质量,笔者通过添加“高被引论文or 热点论文”和“国家/地区”条件进行进一步分析,发现我国发表的文章篇均被引频次为207.52 次,h 因子(h-index,h 因子为N 则表示有N 篇论文分别被引用了至少N 次)达99,与其他两个论文发表数前三的国家相比仍有一定差距;美国发表miRNA 相关SCI 论文篇均被引频次为364.82,h 因子为127;德国发表miRNA 相关SCI 论文篇均被引频次为370.38,h 因子为42。

2.2 国内发表论文概况

根据CNKI 数据库可视化分析结果发现,2006 年以前,我国miRNA 有关中文论文发表数量较少,每年发表数量均在100 篇以下,2006 年以后论文发表数进入增长期,2018 年论文发表数出现短暂下降,但总体保持稳定;2019 年后,论文发表数量明显下降,参见图2。由此可见,基于CNKI 数据库论文可视化的分析,我国发表在中文期刊的miRNA 相关论文数量变化趋势与国际miRNA 相关SCI 论文发表变化趋势大致一致。

图2 20 世纪以来中文期刊miRNA 相关论文发表数量趋势

从论文主要主题分布情况看,除去miRNA 本身名称主题(miRNA、miRNAs、微RNAs 等),我国对miRNA 的研究主题主要为靶基因、差异表达、细胞凋亡、细胞增殖等;“靶基因”关键词占比较高的原因是近年来许多研究人员都开始将重点放在具体miRNA 的靶基因预测和挖掘上,如梁学振等[9]和张宁芳等[10]的研究,以及高阳[11]对miR-202 的靶基因预测以进一步miR-202 对早期胚胎影响的研究。“差异表达”主题体现了miRNA 的差异表达对细胞生理过程及疾病过程的影响,如曲蕾对miR-202 差异表达的研究[12]。而“细胞凋亡”“细胞增殖”等代表miRNA 通过调节不同靶基因表达而形成的影响。

从学科分布看,发表在中文期刊的miRNA 相关论文大多都与肿瘤学相关,肿瘤学以10435 篇论文处于绝对数量优势,甚至超过其他前五名学科发表论文数的总和(心血管系统疾病相关论文2310 篇,生物学相关论文2196 篇,基础医学相关论文1678 篇,妇产科学相关论文1385 篇),而且其他学科分布相对均匀,如妇产科学、泌尿科学、消化系统疾病等,参见图3。这与miRNA 参与各系统器官肿瘤调控有密切关系,如Sun等[13]和巫梦雪[14]等对miRNA 与卵巢癌关系的研究,李亚男等[15]和李杰[16]等对消化系统癌症的研究。

图3 20 世纪以来中文期刊miRNA 相关论文学科分布Top 20(来源:中国知网)

2.3 关键词共现分析和聚类分析

笔者进一步使用Citesapce 软件对国外miRNA 相关发表论文进行关键词共现分析和聚类分析,根据Citespace 分析结果得出出现频率最高的前十个关键词,见表3。

表3 Citespace 分析得出出现频率最高的关键词前10

在关键词共现图谱中,节点大小与该词出现的频数成正比,图谱中关键词“expression”出现的频数最多,结合miRNA 功能分析得出miRNA 的差异表达仍是国际miRNA 相关研究的重点,miRNA 在癌症中的差异表达(过表达或者表达下调)可以调控癌症的发生发展。关键词“proliferation”出现的高频率很可能与miRNA 对癌症的增殖扩散作用有关,这一点也可与关键词“cancer”的高频出现相联系,见图4。综合可得,miRNA 相关研究的重点仍与癌症紧密相关。

图4 miRNA 相关论文关键词共现分析图谱

用关键词聚类分析以对联系紧密的关键词进行聚类,共得出7 个聚类。聚类图谱的聚类模块值(Q 值)为0.3674,聚类结构显著[17]。由聚类图谱可得,#0 上皮-间质转化(EMT)是最主要的研究方向,EMT 也与癌症紧密相关(EMT 与肿瘤转移机制有关)。此外,#2 再灌注损伤也是miRNA 相关研究的热点之一,说明miRNA 在除肿瘤、癌症外的其他机体疾病、损伤过程也有重要的调控功能[18],见图5。

图5 关键词聚类图谱

3 总结与展望

本研究利用文献计量学的方法对20 世纪以来国际和国内miRNA 相关发表论文趋势进行梳理,从发文量、基金资助机构、发文作者和发文作者等角度进行深入分析,为将来miRNA 研究趋势提供参考。通过分析得出以下结论。

从国际和国内miRNA 发表论文的趋势看,miRNA 的研究热度处于总体上升的趋势,由于miRNA 能调控靶基因的表达,在细胞生理过程和疾病过程中扮演重要角色,人们逐渐重视对miRNA 的研究。国内miRNA 相关研究的不断发展离不开国家基金的支持,从论文基金支持机构看,我国国家自然科学基金共资助10500 篇miRNA 相关研究的论文发表,占总论文发表数的18.656%。2010 年,国家自然科学基金成立了“非编码RNA 与肿瘤发生、发展及转归”的重点项目立项领域[19],这极大程度推动了国内miRNA 研究领域的发展。国内许多miRNA 相关项目受到资助后[20,21],相关研究人员开始对miRNA 进行进一步研究,miRNA 的生理功能及其作用机理被不断挖掘。有学者对国家自然科学基金在中医内科学领域立项项目的研究热点进行分析,发现在1997~2019 年国家自然科学基金在中医内科学领域中立项的1751 项项目中,主题词miRNA 以155 次的出现频率位居第二,仅次于信号转导通路(791次)[22]。相较于美国等发达国家,我国科研起步虽然相对较晚,但通过后续发展过程中的基金资助及研究人员的不断努力,我国在各领域的研究均已处于领先地位,在miRNA 相关领域,我国论文发表情况现已位居第一。

2019 年之后miRNA 相关研究出现了相对滞后的现象,推测为2019 年爆发的新冠肺炎疫情对各领域都带来了重大冲击,包括科研领域,何礼邦等[23]对国际山羊相关论文发表态势的分析中也提到,由于疫情影响,相关领域的研究论文呈下降态势。但这在后疫情时代的不断调整后会有所改善,笔者预测,在今后几年,miRNA 相关研究发展趋势会逐步回归正轨。值得一提的是,我国在国际上发表的miRNA 相关论文数最多。此外,在miRNA 发表论文的基金资助机构中,中国国家自然科学基金资助力度最大,说明我国对miRNA 研究的重视。但在论文水平上,从热点文章被引频次和h 因子看,我国相对其他发达国家(如美国和德国)仍有一定差距,只有后续不断提高研究和论文质量,我国在国际miRNA 相关领域中才能更具有话语权。在研究主题方面,国内外miRNA 研究侧重点各不相同,国外研究更侧重于研究miRNA 在各类肿瘤、癌症中的调控作用;而国内则侧重于miRNA 调控机理,如探究其“靶基因”,引起“细胞凋亡”、“细胞增殖”等。对miRNA 机理的探究固然对深入全面了解miRNA 有重要意义,但也要注意综合其机理及其内涵、应用,防止出现对领域内涵理解不深刻,盲目追求研究热点,过度强调细胞信号通路等微观分子机制问题[22]。在国内研究方面,miRNA 研究学科分布较广,miRNA 在各系统的研究都有涉及。此外,通过关键词共现分析和聚类分析可知,miRNA 相关研究热点仍与肿瘤、癌症相关,说明未来miRNA 相关研究重点可能仍与肿瘤和癌症相关,miRNA 很可能通过相似的机制对肿瘤、癌症的发生发展进行调控,研究miRNA 部分调控机制,可以为miRNA 在其他疾病的研究提供可靠思路。此外,根据关键词聚类分析结果,再灌注损伤作为现阶段miRNA 相关研究的热点之一(仅次于肿瘤),很可能在未来发展为miRNA 主要的研究主题。

目前,国内外对miRNA 的研究大部分还停留在理论层面,在实践应用方面还有待进一步的提升。只有将miRNA 相关研究理论应用到实践,为疾病诊断和治疗提供新技术,才能深化miRNA 相关的研究意义,进一步造福人类。

猜你喜欢
检索论文癌症
体检发现的结节,离癌症有多远?
CNKI检索模式结合关键词选取在检索中的应用探讨
通过实际案例谈如何利用外文库检索提高检索效率
瑞典专利数据库的检索技巧
本期论文英文摘要
癌症“偏爱”那些人?
英国知识产权局商标数据库信息检索
中国癌症分布图
本期论文英文摘要
本期论文英文摘要