,, ,,
在信息爆炸的时代,为读者提供便捷有效的学科信息服务和支持,是图书馆员面临的重要课题。近几年,信息计量学及可视化分析技术广泛应用于信息科学、管理学[1]等领域,在医学领域也逐渐开始应用。2005年陈超美[2]将CiteSpace应用于循证医学研究并获取了肺癌及心脏病的临床证据图谱,2011年刘磊[3]基于Web of Science对糖尿病视网膜病变文献进行了计量学分析,2013年周序[4]利用CiteSpace对视网膜脱落的SCI论文进行了可视化分析。
经过文献调研我们发现,针对眼科学研究特征进行的知识图谱分析较为少见。因此,本文选择眼科学SCI论文为研究对象,试图通过内外部特征分析探测眼科学研究状况及发展特点,在为眼科学研究者提供一定参考的同时,也为医学图书馆资源建设和学科服务提供一定的参考。
登录Web of ScienceTM,选择“Journal Citation Reports(JCR)”数据库,限定年份为2012年,并选择按学科浏览期刊,打开“Ophthalmology”类期刊列表,可知SCI数据库共收录59种眼科学期刊。遵循二八定律的原则,按5年影响因子对期刊进行排序,选择位列前20%的期刊(约12种)(表1)。
用ISSN号检索表1中的12种期刊,文献类型限定为“review”和“article”,检索时间段为2009-2013年,共得到14 658条论文记录(检索时间为2014-07-10),选择带参考文献的全著录格式下载并存储。
表1 SCI收录的影响因子位例前20%的眼科学期刊
利用Web of Knowledge平台的检索结果分析工具Analyze Results按发表时间、国家分布、作者等对14 658条文献数据进行统计分析,并将所需数据导入Mircrosoft Excel软件中,分析其外部特征;将数据导入陈超美[5]教授开发的CiteSpace中,分析数据内部特征。通过分析眼科学的研究热点、知识前沿与知识基础,根据其演变情况来寻找研究热点及趋势,并以可视化的方式展示出来。节点类型分别使用关键词、参考文献、突变专业术语等,阈值根据需求选择Top 10(20或30)per slice,主题词选择标题、摘要和关键词等。
3.1.1 发表时间
一个学科在某一时期发表论文数量的增加速度,不仅可以说明这一学科研究的发展速度,也可以在一定程度上反映研究者对该学科的关注程度[6]。本文检索获得的14 658篇论文时间分布情况为:2009年2 838篇,2010年2 864篇,2011年3 163篇,2012年2 905篇,2013年2 888篇,说明2009-2013年眼科高影响因子论文产出较稳定,眼科学正处于学科发展的成熟期。
3.1.2 国家分布及被引情况
14 658篇论文来自112个国家,选取发文量较高的前10个国家,分析其检出论文的被引频次,比较不同国家眼科学的研究水平。在Analyze Results中限定字段“国家/地区”即可获取发文量排名前10的国家发文情况(表2),前10个国家累计发文共14 881篇(此统计方法包含了研究论文所有参与作者的国家),共被引151 620次,平均被引10.19次。
表2显示,所发论文篇均被引次数高于平均水平(10.19次)的国家有意大利、德国、美国,发文篇数与篇均被引频次排名均靠前的为美国、日本、德国,篇均被引频次排序上升位次最多的国家为意大利,下降位次最多的是英国。通过篇数与篇均被引次数的排名变化还可看出,中国发文篇数排名第五,篇均被引频次排名第七。我国眼科学研究虽在发文量上有所建树,但篇均被引频次却不高,比总体平均水平(10.19次)低1.23次,说明我国眼科学研究与国际水平仍存在一定差距。综合比较各方面数据,美国、德国等在眼科学领域表现较为突出。
表2 发文量居前10位国家发表论文的被引情况
3.1.3 高影响力作者分布
发文量和被引频次分别从数量和质量两个角度反映作者的科研生产力和学术影响力[7]。本文将眼科学领域高影响力作者定义为在全球高影响因子的眼科学期刊中发表论文较多且被引次数较高的核心作者。
14 658篇论文共涉及38 349位作者。依据普赖斯提出的计算公式m=0.749(nmax)1/2(m为最低产核心作者发表论文数,nmax为所统计年份中发文最多的那位作者的论文数),发文m篇以上的作者为核心作者(也称多产作者)。由本文数据计算可得,m=0.749(nmax)1/2=0.749*1911/2=10。也就是说,发表10篇及以上论文的作者可以看作是眼科学领域的核心作者。由于Analyze Results最多只能显示500条记录,不能提取到所有核心作者的发文情况,因此本文选取发文较多的前10位(即发文量70篇及以上)核心作者为研究对象(表3)。
这10位作者发文1 052篇,共被引12 261次,平均被引11.65次。所发论文篇均被引次数高于平均水平(11.65次)的有Robert N. Weinreb,Paul Mitchell,David S. Friedman,Jie Jin Wang,Nagahisa Yoshimura;发文篇数与篇均被引频次排名均靠前的作者为Robert N. Weinreb,Paul Mitchell,Tien Y. Wong;单篇被引频次排名上升最大的是约翰霍普金斯大学的David S. Friedman,共上升6个位次;下降最大的是新加坡国立大学的Tien Y. Wong,共下降5个位次。综合比较各方面数据,Robert N. Weinreb,Paul Mitchell等在眼科学领域的成绩较为突出。
表3 眼科学领域发文量排名前10的作者
3.2.1 高频词分析
论文的关键词或主题词是研究人员对其核心内容的高度提炼,在某学科论文中反复出现的关键词或主题词则可能反映该学科的研究热点[8]。本文使用CiteSpace统计分析论文题录中的关键词或主题词重复出现的频次,并以信息可视化的方法显示高频词,得出眼科学领域近几年的研究热点[7]。
笔者将14 658条论文全记录导入CiteSpace中,设定相应的参数值,然后选择探索关键路径的路径算法(pathfinder)。Pathfinder算法通过模型运算来剪切网络中的大部分较不重要的节点关联,只保留最重要的节点关联,同时让所有节点均保持不动,以便最大程度上将原网络简化为一个最小值网络[8]。节点类型(Node Types)选择关键词(Key Word),并选择适当的阈值(Top 20 per slice),运行CiteSpace生成高频关键词知识图谱,可以显示出高频词列表,按中心性排序后选取热点词中排名靠前的关键词,同时对一些意义相同的或者无意义的关键词进行合并或剔除,结果见表4。
表4 2009-2013年眼科学论文中的高频关键词
由表4可见,2009-2013年眼科学研究领域中,青光眼、黄斑变性、光学相干断层扫描术等关键词出现频率极高,在一定程度上也代表了眼科学领域近几年的研究热点。
3.2.2 眼科学领域知识前沿
探测眼科学领域的学术研究前沿对该学科领域的研究人员特别是临床医生具有十分重要的意义,可以使他们准确、及时地掌握眼科学的研究前沿和最新发展动态,甚至还可以据此预测眼科学未来一段时间的发展方向及需进一步研究的问题。
本文为获取眼科学的知识前沿,采用突变检测算法,即通过考察词频的时间分布,将其中频次变化率高的名词短语从大量的主题词中探测出来,依靠词频的变动趋势而不仅仅是频次的高低,来确定学科领域的研究前沿获取该学科的知识前沿[9]。运行CiteSpace,选择突变专业术语(Burst Terms),节点类型选择关键词(Key Word),运行后可获得2009-2013年眼科学研究前沿术语表。我们选取按频次排名靠前的关键词(表5),然后将显示类型选择为(Time Zone),同时对一些意义相同的或者无意义的关键词进行合并或剔除,最后生成眼科学知识前沿时区图谱(图1)。该图包含69个关键突变节点,其中2009年50个,2010年7个,2011年7个,2012年3个,2013年2个。
由表5和图1可看出,眼科学突变词汇集中于2009年,之后几年新的研究热点较少出现,另外2009年突变词的被引频次也极高。造成2009年热点词较多的原因,一是该热点持续受到关注,二是本文数据来源文献是2009-2013年。此外,2010-2011年眼科学领域新的高频词数量及被引次数与2009年相比相差很大,2012-2013年新的高频词更是稀少,可见2010年以来眼科学研究无较大突破。
表5 2009-2013年眼科学研究前沿术语及频次
图1 2009-2013年眼科学研究知识前沿图谱
3.2.3 眼科学知识基础分析
文献计量学认为,引文形成了研究前沿,被引文献组成了知识基础[10]。文献的被引频次在一定程度上能反映该文献的影响力。如果一篇文献同时引用两篇不同的文献,那么这两篇文献存在共被引关系[11]。文献共引分析是将一个学科领域的文献进行研究方向归类,从而寻找该领域的研究热点及知识基础。再次运行CiteSpace,阈值选择Top10 per slice,节点类型(Node Types)选择参考文献(Cited Reference),由此生成眼科学知识基础图谱(图2)。
图2 2009-2013眼科学知识基础图谱
该图谱由18个节点和10条连线组成。图中一个节点代表一篇论文,节点的大小代表论文被引频次,节点的年轮结构反映该文献出现的时间,年轮的色调由冷变暖表明文献出现时间由远及近。关键节点文献是2006年由美国迈阿密大学的Philip J. Rosenfeld发表在NewEnglandJournalofMedicine(近5年影响因子为52.42)上题为“Ranibizumab for Neovascular Age-related Macular Degeneration”的论文,该文论证了兰尼单抗治疗与年龄相关的黄斑变性方法,共被引295次。共被引频次最高(501次)的论文,其研究主题也为兰尼单抗治疗与年龄相关的黄斑变性的方法研究。
分析18个节点论文的研究内容后,我们发现有10篇论文主要研究与年龄相关的黄斑变性治疗方法,有4个节点论文研究光学相干断层扫描术,其余4个节点分别研究的是心理问题、青光眼与视力损伤。此外,在分析出的共引文献中,时间最早的为1991年由麻省理工学院Huang D发表在Science上题名为“Coherence Tomography”的论文,该文共被引211次;时间最近的是2009年Ron Margolis发表在AmericanJournalofOphthalmology上的的论文,题名为“Enhanced Depth Imaging Optical Coherence Tomography of the Choroid In Highly Myopic eyes”,共引频次为123次。
通过相关的统计数据以及知识图谱,对12种眼科学高影响力期刊2009-2013年刊发的14 658篇论文进行了眼科学研究的内、外部特征,得出以下的结论。
从2009-2013年眼科学发文量的统计数据中可看出,眼科学正处于学科发展的成熟期,且发表在高影响因子期刊上的论文数量上无较大的突破。
通过发文量与被引频次的对比分析发现,在眼科学领域,美国、日本、德国等国家的成绩较为突出,加利福尼亚大学的Robert N.Weinreb和悉尼大学的Paul Mitchell等在眼科学领域影响较大。
使用CiteSpace词频分析得出眼科学领域的研究热点有青光眼(glaucoma)、黄斑变性(macular degeneration)、光学相干断层扫描(optical coherence tomography)、内皮生长因子(endothelial growth-factor)、兰尼单抗(ranibizumab)等。
眼科学在2009年处于繁荣期,突变词汇数量多且被引频次较高。2010年后突变词汇减少,被引次数也大幅降低,说明2010年至今眼科学处于稳定发展时期,新的研究热点较少且无较大的突破。通过眼科学知识图谱分析,我们发现黄斑变性的治疗方法与光学相干断层扫描术研究一直受到持续关注,是眼科学研究的热点与前沿。
本文通过对SCI收录眼科学论文的分析,辨识出眼科学的前沿及发展路径,确认该学科领域的经典基础文献,并发现不同研究前沿之间的内部联系,有助于科研人员寻找知识结构的关键点[12-15],也为医学信息资源建设及学科服务提供了一定的参考。