基于BiblioShiny的先天性白内障可视化文献计量分析(2011─2020年)

2022-01-18 12:22:14廉恒丽柯向青黄锦海李璋亮黄小敏郭迎暄
中华眼视光学与视觉科学杂志 2021年12期

廉恒丽 柯向青 黄锦海 李璋亮 黄小敏 郭迎暄

先天性白内障是指出生时或出生后1年内发生的晶状体混浊,可伴有其他眼部异常或系统性疾病,其发病率为0.01%~0.06%,占全世界儿童致盲性眼病总数的1/10,是导致儿童失明和弱视最常见的原因之一,占儿童致盲眼病第2位[1]。先天性白内障幼儿处于眼球发育阶段,对检查、摘除与植入晶状体均有很大的局限性与风险,同时需要定期的屈光矫正、规范积极的弱视及双眼融合功能训练和长期随访。到目前为止,各国学者均对先天性白内障进行了大量的研究。

BiblioShiny是由意大利Massimo Aria 教授在Bibliometrix科学文献计量软件的基础上,使用 R语言的Shiny 软件包进行二次开发完成,具有交互可视化用户界面,方便用户进行相关的科学计量及可视化分析的文献计量工具[2];可提供可视化的柱状图、词云、战略坐标图、历史文献被引网络图、地图等。目前应用于科研、政府和教育等方面,如胜任力教育研究[3]、国际科研评价研究[4]、政府数据利用研究[5]等。现笔者对WoSCC数据库2011─2020年收录的先天性白内障相关文献,使用BiblioShiny在线分析平台进行文献计量分析,通过关键词云图、作者合作网络共现等,分析全球该领域研究的总体趋势热点、领先的国家和机构、核心的期刊、重要的文献,为国内学者进行相关研究提供思路和方向。

1 材料与方法

1.1 数据来源

本研究的数据主要来自WoSCC数据库(美国科技信息所),检索式为“TS=(Congenital cataract)索引=SCI-EXPANDED,SSCI,CCR-EXPANDED,时间跨度IC:2011─2020”,文献类型设置为Article。共获得1 492条检索记录。

1.2 分析工具和方法

1.2.1 BiblioShiny功能介绍 BiblioShiny能够转换SCOPUS,Web of Science,Cochrane Database of Systematic Reviews(CDSR)和RISmed PubMed/MedLine数据库下载的数据,使其能够在R环境中运行。该工具包含了完整的文献计量学分析流程,能满足文献计量研究需求,可实现文献相关的知识和社会结构挖掘。

1.2.2 BiblioShiny程序的安装与运行 首先,下载并安装最新版本的R语言程序(https://cran.r-project.org/)和RStudio运行平台(https://rstudio.com/)。

然后,打开RStudio,在控制界面窗口上键入如下命令,打开BiblioShiny程序

R>install.packages(“ bibliometrix”,dependencies=TRUE)

R>library(bibliometrix)

R>BiblioShiny()

2 结果

2.1 先天性白内障相关研究的基本信息

2011─2020年先天性白内障相关研究文献的基本信息,包含了关键词、作者、合作网络等,见表1。

表1.2011─2020年先天性白内障相关研究文献基本信息Table 1.Information description of congenital cataract literature in 2011─2020

2.1.1 发文量的逐年变化与预测 年度发文量可直接反映某研究领域在不同时段的研究热度,呈现特定阶段的研究趋势。图1中红色折线表示从2011到2020年,先天性白内障SCI发表数量呈波段式增加趋势,至2017年增加达到高峰(170篇)。另外,后半部分的蓝色折线表示对未来3年文献发表数量的预测分析,紫色虚线表示预测值的95%置信区间。预计到2023年SCI发表量可达173篇,其中下限为137篇,上限可达208篇。

图1.2011─2020年先天性白内障逐年论文发表量与预测红色折线表示各年度实际发表论文数量,蓝色折线表示对未来3年文献发表数量的预测值,紫色虚线表示预测值的95%置信区间Figure 1.Annual paper publication volume and forecast for congenital cataract in 2011─2020.The red broken line represents the actual number of papers published each year,the blue broken line represents the forecast analysis of the number of papers published in the next 3 years,and the purple broken line represents the 95% confidence interval of the predicted value.

2.1.2 文献发表的期刊分布情况 WoSCC数据库检索的1 492篇文献共发表在390种期刊上,其中前10位高产期刊分属4个国家,美国期刊占70%。发表先天性白内障相关文献最多的为《Molecular Vision》,共刊文74篇;其次是《PLoS One》,共刊文66篇,均为美国期刊。前10位高产期刊见表2。

表2.2011─2020年先天性白内障前10位高产期刊信息表Table 2.Top 10 high-yield journals of congenital cataract in 2011─2020

2.2 文献作者分析

2.2.1 作者产出分析 一般来说,高产作者的学术活跃度相对较高。对作者科研产出进行分析可以使用如下路径:Authors-Most Relevant Authors(数量选10),见表3。

表3.2011─2020年先天性白内障前10位高产作者Table 3.Top 10 highly productive authors of congenital cataract in 2011─2020

表3为该研究领域的前10位高产作者,发文量第1位的是来自加利福尼亚州帕罗奥多市斯坦福大学医学院眼科的Lambert SR博士,专门研究斜视儿童和成人的眼部疾病;发文量第2位的是中国广州中山大学中山眼科中心陈睛晶,她致力于探索先天性白内障规范化诊疗的相关研究;发文量第3位的是中国广州中山大学中山眼科中心林浩添,他参与研发的内源性干细胞治疗先天性白内障新疗法,被评为“2016年全球生命医学八大突破进展”;发文量第4位的是中国广州中山大学中山眼科中心白内障科主任陈伟蓉教授,研究方向主要为先天性白内障手术、视功能重建及生存质量的相关研究,近年来着重于MircoRNA与晶状体老化、白内障术后免疫反应等研究;发文量第5位的是中国广州中山大学中山眼科中心刘奕志教授,他实现了人类晶状体再生,开拓了利于内源性干细胞治疗疾病的新方向;发文量第6位的是中国杭州浙江大学医学院附属第二医院眼科的姚克教授,他对白内障、青光眼、屈光不正等均有较深入的研究。

2.2.2 文献作者所属国家分布 使用路径:Authors-Countries-Corresponding Author's Country(数量选10),对高产国家或地区进行分析及作图,发现先天性白内障相关研究发文量排名前10位的国家,中国和美国学者的发文量最多,分别是346篇(占23.2%)和296篇(占19.8%),其次是印度(117篇)、德国(80篇)、英国(73篇)、日本(61篇)、法国(51篇)、意大利(50篇)、土耳其(46篇)、巴西(32篇),见图2。可以看出中国和美国在这一研究领域发文量较多,处于领先位置。值得注意的是,英国和德国所发表文章中近半数是通过国际间合作完成的,说明英国、德国在这一研究领域的国际合作广泛而又深入;而中国的国际合作率较低,仅为13.3%。

图2.2011─2020年先天性白内障前10位高产国家条形图发文量越多,条柱越长;蓝色柱条表示文章的作者来自单一国家,红色柱条表示文章作者来自多个国家Figure 2.Top 10 high-yield countries for congenital cataract in 2011─2020.The more posts,the longer the bars.The blue bars indicate that the authors of the articles are from a single country,and the red bars indicate that the authors of the article are from multiple countries.

2.3 关键词词云分析

论文关键词是对论文核心内容的高度凝练,关键词词云分析是对文献集中的关键词进行词频统计,抽取出现频率较高的关键词,在视觉上予以突出,形成关键词词云,使读者能够方便领略文本信息中的主旨要素。

在BiblioShiny中,绘制关键词词云可以使用如下路径:Documents-WordCloud,见图3。从图中可以看出,当前科研评价的主要研究热点集中在“Children”(209,6.1%)、“Gene”(149,4.6%)、“Surgery”(133,4.1%)、“Mutations”(108,3.4%)、“Intraocular-lens implantation”(92,2.9%)及“Expression”(88,2.7%)等方面。

图3.2011─2020年先天性白内障关键词词云图字体大小与关键词的数量呈正比,字体越大,关键词频次越高Figure 3.Keyword word cloud diagram of congenital cataract in 2011─2020.The font size is directly proportional to the number of keywords.The larger the font,the higher the keyword frequency.

2.4 主题结构分析

2.4.1 词汇地图 在BiblioShiny中,通过主题结构分析可以绘制出词汇地图,分析路径为:Conceptual Structure-Factorial Analysis。图4为国际科研评价研究的词汇地图。从图中可以看出,研究领域划分为2个类别,即基础研究(蓝色)和临床研究(红色)。基础研究包含了基因突变、分子遗传学、蛋白质、聚合、稳定性等方面的研究,引用最多的文献为来自特拉华大学生物信息学和计算生物学中心的Lachke等[6]于2012年在《Invest Ophthalmol Vis Sci》上发表的题为《iSyTE:integrated Systems Tool for Eye gene discovery》的论文,作者开发并验证了1种称为iSyTE(用于眼部基因发现的集成系统工具,http://bioinformatics.udel.edu/Research/iSyTE)的计算工具。iSyTE使用小鼠胚胎晶状体基因表达数据集作为生物信息学过滤器,从涉及疾病的人或小鼠基因组区域中选择候选基因,并对它们进行优先级排序以进行进一步的突变和功能分析。该研究提出了β-晶状体蛋白之间的蛋白质-蛋白质相互作用在维持晶状体透明性方面的重要性,并为人类先天性白内障-微角膜综合征研究提供了新的见解;临床研究集中在小儿白内障患者的治疗、患病率、结果、风险和管理等方面。

图4.2011─2020年先天性白内障词汇地图研究领域划分为2个类别,分别为蓝色区域和红色区域Figure 4.Vocabulary map of congenital cataract in 2011─2020.The figure divides the research field into 2 categories,namely the blue area and the red area.

2.4.2 主题地图 在BiblioShiny中,通过主题结构分析可以绘制出主题地图,分析路径为:Conceptual Structure-Thematic Map。图5为国际科研评价研究的主题地图,其横坐标表示中心度,纵坐标表示密度,据此绘制出4个象限,用于分析研究主题的发展及相互影响的情况。其中,第Ⅰ象限是指重要且发展势头良好的研究主题,可见基因表达主题是目前的学术研究热点;第Ⅱ象限是已有良好发展,但是对于当前领域不重要的研究主题,可见流行病学不是当前的研究主流;第Ⅲ象限中的主题表示刚刚涌现或者即将消失的研究方向,如对形觉剥夺的研究是即将消失的研究方向;第Ⅳ象限中的研究主题属于该研究领域的知识基础,在本例中有先天性白内障和基因突变。

2.5 知识结构分析

图5.2011─2020年先天性白内障主题地图第Ⅰ象限是指重要且发展势头良好的研究主题;第Ⅱ象限是已有良好发展,但是对于当前领域不重要的研究主题;第Ⅲ象限中的主题表示刚刚涌现或者即将消失的研究方向;第Ⅳ象限中的研究主题属于该研究领域的知识基础Figure 5.A diagram map of congenital cataract in 2011─2020.Quadrant Ⅰ refers to important research topics with a good momentum of development.Quadrant Ⅱ refers to research topics that have been well developed but are not important in the current field.Quadrant Ⅲ represents research directions that have just emerged or are about to disappear.The research topics in quadrant Ⅳ represent the knowledge base of this research field.

图6.2011─2020年先天性白内障共被引网络文献之间的连线越多,代表引用越多,不同的颜色代表不同的研究方向Figure 6.Co-cited network of congenital cataract in 2011─2020.The more links between documents,the more citations,and different colors represent different research directions.

2.5.1 共被引网络 在BiblioShiny中,通过知识结构分析,可以绘制出共被引网络图,分析路径为:Intellectual Structure-Co-citation Network。文献共被引分析适合研究并揭示文献之间的内在联系及规律。从本研究的共被引网络图6分析得知,大致分为3个聚类。第1聚类(蓝色)中,2008年Hejtmancik[7]在《Semin Cell Dev Biol》上发表的《Congenital Cataracts and their Molecular Genetics》文章,主要对先天性白内障及其分子遗传学进行了概述,指出白内障是一种常见的终末期突变,大多数遗传性白内障都与一组编码蛋白质的基因有关,这些蛋白质对维持晶状体透明度和稳态具有特别重要的意义。该聚类中,论文的研究内容主要是先天性白内障的发病率、危险因素、手术治疗等。第2聚类(红色)中,Foster等[8]于1997年在《J Cataract Refract Surg》上发表的《Epidemiology of cataract in childhood:A global perspective》的文章,表明先天性白内障是导致儿童失明的最重要原因之一,也是可治疗的。全世界估计有20万儿童因白内障而失明,每年有2~4万发育性双侧白内障的婴儿出生。在发展中国家,需要改进早期病例检测和转诊服务,并建立具有评估、手术治疗和儿童白内障长期管理专业知识的中心。该聚类中,论文的研究内容主要是分子遗传、基因突变和蛋白质功能改变等。第3聚类(绿色)中,Graw[9]于2009年在《Exp Eye Res》上发表的《Genetics of crystallins:Cataract and beyond》的文章,系统介绍了晶状体蛋白的遗传学。以哺乳动物为例,发现豚鼠cryz基因突变导致白内障。在该聚类中,研究内容主要集中在晶状体蛋白的结构、稳定性和功能、蛋白质错误折叠和聚集等。

2.5.2 历史文献被引网络 对历史文献进行引证,具体分析路径为:Intellectual Structure-Historiograph。选择默认参数,输出重要性较高的前20篇文献,其中前5篇见表4。表中展示了2项统计指标,GCS(Global citation score)即Web of Science中文献被引统计总数;LCS(local citation score)即当前数据集里(2011─2020年先天性白内障领域),文献被引次数。假设1篇文献GCS很高,但是LCS不高,很可能意味着在其他领域影响力更大。

研究发现,总被引用次数最多的是四川大学华西医院分子治疗研究中心的Zhao等[10]在2015年发表于《Nature》的论文《Lanosterol reverses protein aggregation in cataracts》,该研究确定了羊毛甾醇是预防晶状体蛋白聚集的关键分子,并指出了一种预防和治疗白内障的新策略,在其他领域影响力远大于先天性白内障领域;其次为Lambert等[11]于2014年发表于《JAMA Ophthalmol》上的论文《Comparison of contact lens and intraocular lens correction of monocular aphakia during infancy:a randomized clinical trial of HOTV optotype acuity at age 4.5 years and clinical findings at age 5 years》,比较在婴儿期单侧白内障手术后用隐形眼镜和人工晶状体进行光学矫正的视觉效果,被Wu等[12]于2016年在《Invest Ophthalmol Vis Sci》上发表的《The Role of Retinal Dopamine in C57BL/6 Mouse Refractive Development as Revealed by Intravitreal Administration of 6-Hydroxydopamine》引用,论述了视网膜多巴胺在C57BL/6小鼠屈光发育中的作用,研究发现降低视网膜DA水平可导致C57BL/6小鼠近视屈光改变,这主要是由于角膜变陡所致。在先天性白内障领域影响力排第1的是Gillespie等[13]于2014年在《Ophthalmology》杂志发表的《Personalized diagnosis and management of congenital cataract by next-generation sequencing》,研究评估整合来自下一代测序的基因组数据和表型数据以增强对双侧先天性白内障的诊断实用性。引用自美国国立卫生研究院国立眼科研究所、眼科遗传学和视觉功能科的Chen等[14]于2011年在《Am J Hum Genet》杂志发表的《Mutations in FYCO1 Cause Autosomal-Recessive Congenital Cataracts》,研究发现巴基斯坦人群中FYCO1突变的频率可能有助于遗传诊断,可以更好地治疗或预防白内障。为了解晶状体透明性和人类白内障提供了新的细胞和分子切入点。

2.6 社会结构分析

2.6.1 机构合作网络 在BiblioShiny中,通过社会结构分析,可以绘制出机构合作网络图,分析路径为:Social Structure-Collaboration Network-Field-Institutions。从图7机构合作网络图分析可知,第1簇(蓝色)为悉尼大学与澳大利亚弗林德斯大学的合作网络;第2簇(红色)为中山大学和迈阿密大学的合作网络;第3簇(绿色)为以埃默里大学为中心的与斯坦福大学、哈佛医学院、哈佛大学、印第安纳大学、明尼苏达大学、阿拉巴马大学伯明翰分校的合作网络;第4簇(紫色)为旧金山加利福尼亚大学和特拉华州大学为中心的合作网络;第5簇(橘色)为以北京大学医学院和首都医科大学为中心的合作网络;第6簇(棕色)为以哈立德国王眼科医院和约翰霍普金斯大学为中心的合作网络;第7簇(粉色)为以费城儿童医院和宾夕法尼亚大学为中心的合作网络。第4簇与第1簇、第3簇联系紧密,第6簇、第7簇与第3簇联系紧密。

表4.2011─2020年先天性白内障历史文献被引网络Table 4.Historical direct citation network of congenital cataract in 2011─2020

图7.2011─2020年先天性白内障机构合作网络图机构与机构之间的连线越多,代表合作越多,不同的颜色代表不同的合作网络Figure 7.Institutional collaboration network of congenital cataract in 2011─2020.The more connections between organizations,the more collaborations they represent.Different colors represent different collaboration networks.

2.6.2 国家合作地图 在BiblioShiny中,通过社会结构分析,可以绘制出国家合作地图,分析路径为:Social Structure-Collaboration WorldMap。国家合作排名第1的是美国,与中国和英国合作最多,其次是和德国、意大利、法国、印度;排名第2的是德国,分别与英国、意大利和印度联系比较多。

3 讨论

目前,常用Bibliometrix、CiteSpace和VOSviewer文献计量学技术,探讨各领域的研究现状和发展趋势。其中,CiteSpace是一项基于Java开发的应用,由美国德雷塞尔大学(Drexel University)的华人学者陈超美团队开发,主要用于分析科学文献的趋势,并进行可视化[16]。VOSviewer是荷兰莱顿大学科技研究中心的Van Eck和Waltman于2009年开发的一款基于JAVA的免费软件,侧重科学知识的可视化,其最大的优势就是图形展示能力强,适合大规模数据,且通用性强,适配于各种数据库的各种格式的来源数据。而Bibliometrix是一个开源的工具,用于执行科学文献的综合科学图谱分析。它采用R语言编程,具有灵活性,便于与其他软件交互使用。因此,Bibliometrix具有快速升级和集成的灵活性,可进行文献计量分析,并为共引、耦合、科学合作分析和共词分析建立数据矩阵。

2011─2020年在先天性白内障领域,中国和美国为发文量最多的国家,但是美国的国家间、机构间的合作网络均远大于中国,提示中国可提高机构、国家的国际合作率。前10位高产期刊中,美国期刊占据绝对优势。发文量第1位的是来自美国加利福尼亚州帕罗奥多市斯坦福大学医学院眼科的Lambert SR博士。被引频次最高的论文是美国宾夕法尼亚大学高级视网膜和眼科治疗学中心的Bennett等[17]于2016年在《Lancet》上发表的题为《Safety and durability of effect of contralateraleye administration of AAV2 gene therapy in patients with childhood-onset blindness caused by RPE65 mutations:A follow-on phase 1 trial》的论文,该文是第一个成功对对侧眼进行基因治疗的研究。

全球先天性白内障领域,主要研究热点集中在Gene、Surgery、Mutations、Intraocular-Lens Implantation和Expression等方面;且研究热点逐步从临床研究结合表型研究过渡到联合基因检测技术的研究。机构合作网络中,悉尼大学与澳大利亚弗林德斯大学的合作最多。目前主流研究方向可分为临床治疗、基因层面和蛋白质层面。先天性白内障研究中,应注重夯实先天性白内障的基因突变知识,并提高基因表达研究方面的技能。目前我国研究水平处于世界前列,以中山大学中山眼科中心尤为突出。值得一提的是,我国中山大学中山眼科中心眼科学国家重点实验室的林浩添,参与研发的内源性干细胞治疗先天性白内障新疗法,被评为“2016年全球生命医学八大突破进展”;刘奕志教授实现了人类晶状体再生,开拓了利于内源性干细胞治疗疾病的新方向,为我国的先天性白内障领域研究作出了重大的贡献。

利益冲突申明本研究无任何利益冲突

作者贡献声明廉恒丽:酝酿和设计实验,实施研究,采集数据,分析和解释数据;撰写论文;统计分析;根据编辑部的修改意见进行修改。柯向青:实施研究,采集数据;起草文章。黄锦海:酝酿和设计实验,分析和解释数据;对文章的知识性内容作批评性审阅;指导,支持性贡献。李璋亮:对文章的知识性内容作批评性审阅;指导。黄小敏:实施研究,采集数据。郭迎暄:酝酿和设计实验,分析和解释数据;对文章的知识性内容作批评性审阅;获取研究经费,指导