■
宋国营1) 常 春2) 苏 楠3) 林江涛3)赵景辉1) 刘雪松1) 朱 瑶1) 熊 曾4)
1)中华医学会杂志社《中华医学杂志》编辑部,北京市东城区东四西大街42号 100710
2)北京大学第三医院呼吸科,北京市海淀区花园北路49号 100191
3)中日友好医院呼吸内科,北京市朝阳区樱花东路2号 100029
4)中南大学湘雅医院放射科,湖南省长沙市开福区湘雅路87号 410008
医学期刊编辑掌握学科领域的研究热点及发展趋势,甄别及优先发表学术影响力高、创新性好的研究论文,是提高医学期刊影响力的重要措施[1-2]。使用互联网计算机智能分析系统辅以人工阅读的方式能揭示已有研究的整体特征及预测其发展趋势,克服人工阅读工作量过大且具有主观性的缺点。常用获取研究热点的方法主要有MeSH主题词分析[3]、数据库分析[4-5](如Essential Science IndicatorsTM数据库、Web of Science数据库等)、文献检索系统分析[6](如PubMed、CNKI等)、生物医学专业搜索引擎[7-8](如GoWeb、Google学术)等文献计量学方法,但其中一些方法较为复杂,部分需要付费搜索。本研究利用全开放的数据源GoWeb及PubMed系统,将两者结合,以哮喘机制研究为例,对医学期刊文献进行回顾性分析,以期帮助责任编辑捕获领域研究热点及预测其发展趋势,为医学期刊编辑选稿、提高期刊学术影响力提供简单易行的好方法。
数据来自GoWeb生物医学专业搜索引擎(网址http://www.gopubmed.org)及 PubMed 文献检索服务系统(网址 http://pubmed.cn/)。
登录www.gopubmed.org后,在检索输入框中输入“Asthma AND Mechanism”,自动生成检索记录,左侧统计栏自动显示名词术语及其频次、生成研究论文年度分布曲线及相关研究兴趣年度曲线。热点即大多数研究者关注的研究内容,反映在医学期刊文献中,就是某一名词术语出现的频次,频次越高说明研究者越关注[7-8]。基于此,人工记录频次最高的10个名词术语,观察各名词术语的研究论文年度分布曲线及相关研究兴趣年度曲线变化规律,阅读近年来哮喘机制研究的权威综述及指南,由1名哮喘机制研究的权威临床专家及1名资深呼吸系统学术期刊编辑归纳哮喘机制的研究热点。
为证实所归纳哮喘机制研究热点的准确性,本研究从期刊引用报告(Journal Citation Report,JCR)找出2014年度影响因子大于5的呼吸系统国际权威期刊,在PubMed中检索各期刊2011—2015年关于哮喘机制的文献,检索式:Asthma[Mesh Terms]AND Mechanism AND期刊[ISSN]AND 2011/01/01—2016/01/01,下载题录。由2名主治医师以上从事哮喘研究的呼吸内科医师及2名学术期刊编辑人工阅读标题和摘要理解文献所表述的内容,提炼研究内容,阅读人员先独立判断,不一致时协商获得一致,计算各研究内容比重,分析研究内容的年分布特征,总结规律。
因为近年来新的研究内容可能因为研究时间不长,发表文章累积篇数不多,所以相关术语频次较小,而未被涵盖在初步归纳的研究热点范围内。但这些研究内容也应引起研究者的关注,很可能是今后研究的发展趋势。故本研究针对未涵盖在初步归纳的研究热点范围内的研究内容进一步行GoWeb分析[7],根据检索获得的相关文献量、研究论文年度分布曲线及相关研究兴趣年度曲线预测哮喘机制研究发展趋势。
利用GoWeb生物医学专业搜索引擎获得哮喘机制研究相关期刊文献5473条检索记录。利用GoWeb获得的发表频次最高的10个名词术语及其频次 分别为:Eosinophils(907)、Nebulizers and Vaporizers(874)、Allergens(873)、Inhalation(863)、Immunoglobulin E(845)、Mast Cells(472)、Ovalbumin(447)、Bronchoconstriction(443)、Bronchoalveolar Lavage Fluid(433)、Bronchial Hyperreactivity(419)。各术语相关研究论文年度分布曲线及相关研究兴趣年度曲线如图1,对应的中文名词术语分别为嗜酸性粒细胞(图1A)、雾化器和汽化器(图1B)、过敏原(图1C)、吸入(图1D)、免疫球蛋白E(图1E)、肥大细胞(图1F)、卵清蛋白(图1G)、气道重建(图1H)、支气管肺泡灌洗液(图 1I)、气道高反应(图1J)。这10个名词术语中雾化器和汽化器、卵清蛋白、吸入、支气管肺泡灌洗液均属于检查治疗手段、动物模型造模工具及致病途径,气道高反应是诱因,以上5个术语均不属于哮喘机制研究范畴内,而嗜酸性粒细胞、过敏原、免疫球蛋白E、肥大细胞这4个术语均属于免疫学发病机制,气道重建是哮喘发病的另一重要机制。因此从获取的热点关联术语和各术语相关研究论文年度分布曲线及相关研究兴趣年度曲线可以归纳出哮喘机制的研究热点主要集中在免疫学及气道重塑上。
2014年度影响因子大于5的呼吸系统国际权威期刊共5本,其名称及影响因子分别为:Am JResp Crit Care(12.996)、Lancet Respir Med(9.629)、Thorax(8.290)、 Eur Respir J(7.636)、 Chest(7.483)。在PubMed中检索出各期刊2011—2015年关于哮喘机制的文献共23篇(表1),23篇文献中免疫学机制研究为10篇,占43.5%,气道重建7篇,占30.4%,其他研究共6篇,占26.1%。23篇文献按研究热点年度分布特征见表2。结果显示2012年及以前,免疫学在哮喘机制研究中占优,明显多于气道重建,2013年后气道重建文献占比逐年提高,与免疫学基本相当,2015年仅检索到1篇哮喘机制文献,为气道重塑相关研究。免疫学研究集中于细胞因子及辅助T细胞分化,共7篇,占70%;气道重塑研究集中于平滑肌细胞及成纤维细胞分化,共6篇,占85.7%;其他包括:表观遗传学3篇、血管生成1篇、神经内分泌失衡1篇、吞噬功能1篇。
表1 影响因子(2014年)>5的呼吸专业SCI期刊2011—2015年发表哮喘机制论文情况
本研究针对表观遗传学、血管生成、神经内分泌失衡、吞噬功能4项研究内容进一步行GoWeb分析,以表观遗传学为例,在检索框内输入“Asthma AND Mechanism AND epigenetics”,检索结果及相关文献的逐年变化趋势显示:表观遗传学16篇,其中DNA甲基化有7篇,组蛋白乙酰化有4篇,micro-RNA 2篇,文献均集中于2010年后,且快速上升(图2A);同理获得血管生成文献22篇,其中12篇集中于VEGF-α,从1999年开始研究,一直处于平台期(图2B);神经内分泌失衡25篇,1970年开始研究,2000年达研究高峰,后逐年下降(图2C);吞噬功能11篇,1989年开始研究,后逐年下降(图2D)。研究论文年度分布曲线及相关研究兴趣年度曲线显示表观遗传学有望成为哮喘机制研究的新热点。
图1 哮喘机制研究热点术语研究论文年度分布曲线及相关研究兴趣年度曲线
GoWeb是一个有效的文献挖掘工具,其工作原理为:GoWeb将检索提问提交给 Yahoo(http:∥www.yahoo.com),从Yahoo接收检索结果,从中提取基因本体特征GO和医学主题词表MeSH形成一个临时的等级分类表,并统计每个分类目录对应的检索结果数量,对检索者起到了快速导航作用,使其对检索到的结果有一个大概的了解,并能很快找到自己需要的检索结果[9]。尽管Goweb是一现有图书情报分析工具,但现有文献主要集中于对这一工具的原理、使用范围进行简单介绍。本研究旨在将该工具功能迁移到科技期刊编辑领域,指导医学编辑更好地把握有关领域研究热点,提高学术期刊学术影响力。本研究将两个开放免费的GoWeb与PubMed数据源结合使用,以哮喘机制研究为例,利用GoWeb自动生成高频次名词术语及其年发表分布特征,初步归纳研究热点,再利用PubMed检索国际权威期刊发表的相关论文年度分布特征来评价初步归纳研究热点的准确性,最后对未涵盖在初步归纳的研究热点范围内的研究进一步行GoWeb分析,预测研究发展趋势,帮助医学期刊责任编辑归纳领域研究热点及预测其发展趋势。目前本研究采用的这一研究体系尚未见报道。与现有其他研究体系相比,本研究采用的方法,数据源完全开放免费,热点挖掘过程简单实用,结果可靠,可以重复,实用性强。
表2 23篇文献按研究热点年度分布情况
图2 相关研究论文年度分布曲线及相关研究兴趣年度曲线
本研究从获取的热点关联术语及各术语研究论文年度分布曲线、相关研究兴趣年度曲线,整体归纳出哮喘机制研究热点主要集中在免疫学及气道重塑。依据关联术语查阅文献获知[10-11]:哮喘是T淋巴细胞介导的肺内的炎症反应,Thl/Th2比例失衡是哮喘的免疫学发病机制,其中Th2细胞数目增多和功能亢进是导致哮喘发生的重要原因,各种细胞因子刺激初始CD4+T细胞向Th2细胞分化中发挥重要的作用。因此研究树突状细胞、T淋巴细胞、Thl、Th2细胞及释放的各种细胞因子在支气管炎症反应的作用及维持Thl/Th2比例平衡是免疫学机制的研究热点。气道重塑主要表现为炎症细胞浸润和腺体增生肥大,细胞外基质沉积、基底膜增厚及气道平滑肌增厚,同时伴有非特异性的气道高反应,被认为是难治性哮喘重要的病理基础。
一般来说,能发表在专业领域顶级核心期刊的文献代表了该领域的最热点最前沿的研究。本研究通过具有医学知识背景者人工阅读这些文献来判断本研究分析结果在文献中的涵盖率,验证了上述热点分析的准确性,说明通过GoWeb挖掘的哮喘机制研究热点准确性较高。本研究针对未涵盖在初步归纳的研究热点范围内的内容进一步行GoWeb分析发现表观遗传学有望成为哮喘机制研究的新热点。
使用医学知识挖掘系统指导医学编辑紧跟相关领域研究热点,组织发表高质量的学术论文是本研究最大的创新点。本研究所述方法仅是一个医学知识挖掘系统的使用。另外,本研究选择的研究对象较具体,仅仅集中在呼吸系统领域中一个具体的研究主题——哮喘机制,如果选择更高一级别的学科领域进行分析,将极大地增加分析的工作量,但原理、方法、实施过程是一样的。本研究提供的方法,可以对感兴趣的任意学科领域进行分析。整体看来,本研究结果具有较好的准确率,将GoWeb与PubMed结合能很好地帮助责任编辑捕获领域研究热点及预测其发展趋势,为科学研究的热点挖掘提供了较好的技术平台,为医学期刊编辑掌握相关学科领域的研究热点及发展趋势、提高医学期刊学术影响力提供了简单有效且可行的方法。
[1] 陈汐敏,接雅俐,蒋莉,等.从6种医学学报的高被引论文分析看如何提高医学学报类期刊的影响力[J].中国科技期刊研究,2013,24(4):666-670.
[2] 张垒.高被引论文的特征因素及其对影响因子贡献研究[J].中国科技期刊研究,2015,26(8):880-885.
[3] 李静,董良广,游苏宁.《中国科技期刊研究》2006年至2011年载文关键词分析 [J].中国科技期刊研究,2012,23(3):404-407.
[4] 陈汐敏,丁贵鹏,接雅俐,等.国际临床医学研究领域热点论文产出状况分析及对我国医学期刊的启示[J].中国科技期刊研究,2013,24(6):1079-1084.
[5] 曹启花.基于SCI文献统计分析制订组稿策略 [J].中国科技期刊研究,2013,24(6):1109-1113.
[6] 陈汐敏,丁贵鹏,接雅俐,等.肿瘤学研究热点论文的分析及对我国医学期刊编辑的启示 [J].中国科技期刊研究,2014, 25(2): 282-286.
[7] 杜志银,林涛,杜永洪.GoWeb:基于GO和MeSH的生物医学搜索引擎研究[J].现代情报,2008(3):166-168.
[8] 张士靖,杜建.GOPubMed:基于GO和MeSH的信息检索与分析研究 [J].医学信息学杂志,2009,30(7):6-11.
[9] Dietze H,Schroeder M.GoWeb:a semantic search engine for the life science web[J].BMC Bioinformatics, 2009, 10(Suppl 10): S7.
[10] Fahy JV.Type 2 inflammation in asthma-present in most,absent in many[J].Nat Rev Immunol, 2015, 15 (1):57-65.
[11] Boulet LP,O'Byrne PM.Asthma and exercise-induced bronchoconstriction in athletes[J].N Engl JMed, 2015, 372(7): 641-648.