糖尿病视网膜病变基因相关研究热点的文献计量学分析

2018-12-14 05:29赵芳坤张劲松施蓓宋雨凌许军
中国医科大学学报 2018年12期
关键词:主题词象限视网膜

赵芳坤,张劲松,施蓓,宋雨凌,许军

(中国医科大学 1. 附属第四医院眼科,眼科医院,辽宁省晶状体学重点实验室,沈阳 110005; 2. 基础医学院机能学科实验中心,沈阳 110122;3. 附属第四医院内分泌科,沈阳 110032)

糖尿病视网膜病变 (diabetic retinopathy,DR) 是糖尿病最常见的严重微血管并发症之一,在糖尿病患者中的发生率可达22%~37%,是工作年龄人群视力丧失的主要原因[1-2]。临床上根据其严重程度可将DR分为非增殖型 (non-proliferative diabetic retin-opathy,NPDR) 和增殖型糖尿病视网膜病变 (proliferative diabetic retinopathy,PDR) 。由于缺氧及静脉出血造成的微动脉瘤、血管渗漏、硬性渗出、视网膜内微血管异常、棉絮斑为NPDR的特征;缺血导致的视网膜新生血管为PDR的特征[3]。DR的发生及严重程度并不能用血糖控制程度及糖尿病病程完全解释。有些糖尿病患者血糖控制较好、病程较短,依然发生了DR;而有些患者则相反,血糖控制不佳、病程较长,却无DR发生。因此,DR相关基因的差异有可能成为DR发生及发展的重要危险因素。以往很多DR相关的研究忽视了疾病人群本身的个体差异,最终导致DR的疗效受到影响。二代测序使研究人员能够从基因组、转录组、蛋白质组及代谢组学角度更好地了解DR这一疾病。DR的病理生理学通路可以概括为血管通透性增加,凝血功能异常,内皮细胞异常,组织缺血,新生血管形成等[4]。DR相关基因所处的通路可以概括为糖代谢相关,炎症相关,新生血管及血管通透性相关,胰岛素信号通路相关等[5]。

文献计量学是运用数学和统计学方法对已经发表的文献进行定量分析和描述,从而评价研究现状、预测发展趋势的方法[6],因此有助于研究人员掌握某一科研领域的变化趋势。较为常用的方法包括共引文分析及共词分析等[7]。由于DR基因相关研究文献众多,为了解该领域的研究现状、最新热点问题及变化趋势,本研究利用PubMed数据库,从文献计量学角度对近年来国际上发表的DR基因相关文献的外部特征及内部特征进行可视化分析与总结,以期从整体上把握DR基因的研究热点及前沿领域,旨在为进一步的科研工作提供参考依据。

1 材料与方法

1.1 资料来源

以生物医学数据库PubMed为数据源,检索式为“Diabetic Retinopathy”[MeSH] AND “Genes”[MeSH],时间限定为2010年1月1日至2017年12月31日,统计相关文献数量、期刊分布及主题词和副主题词出现频次。

1.2 建立共词矩阵及聚类分析

应用中国医科大学崔雷教授开发的书目共现分析系统 (bibliographic item co-occurrence mining system,BICOMS) 统计主要主题词及副主题词出现频次,按频次高低排序,根据累计频次的变化选定截取的阈值[8]。采用SPSS 20.0软件对高频主题词进行聚类分析,变量之间距离的计算采用平方欧氏距离法,并绘制共词聚类树图。

1.3 绘制战略坐标图

由高频主/副主题词组成的共现矩阵来计算类内链接平均数和类间链接平均数,并分别计算各个主题类别的向心度和密度。各类别的密度表示该类别内的内部完整性强度,各类别的向心度通过类别的主要项与其他类别之间的链接强度计算而得。各主体类别密度=各类内链接平均数-类内链接平均数的总平均值;向心度=各类间链接平均数-类间链接平均数的总平均值;以向心度为X轴,密度为Y轴,绘制各个研究类团在战略坐标图中所处的象限,并分析其意义。

2 结果

2.1 DR基因相关研究文献分布特征

对2010至2017年刊载DR基因主题文献的期刊分布进行统计分析,已发表的1 193篇文献分布于322种期刊中,发表文献数量总体呈逐年上升趋势。发文量排在前3位的期刊依次为Investigative Ophthalmology & Visual Science (IOVS) ,占总发文量的8.56%;PLoS One,占总发文量的6.15%;Molecular Vision,占总发文量的4.06%。各年代文献量分布见图1,发文量最多的前10位杂志见表1。

图1 2010年至2017年DR基因相关论文随年份变化情况Fig.1 Number of publications on DR-related genes from 2010 to 2017

2.2 高频主题词及副主题词词频分析

表1 2010年至2017年PubMed数据库中DR基因相关文章发文量前10位杂志Tab.1 Distribution of publications on DR-related genes in the PubMed database from 2010 to 2017

在纳入的文献中,出现频次>10次的主/副主题词共有44个,占总频次的35.12%,这些词体现了本领域的研究热点与重点,见表2。其中排名前3位的主/副主题词分别为diabetic retinopathy/genetics (207次) ,polymorphism,single nucleotide/genetics (143次) ,diabetes mellitus,type2/genetics (83次) ,说明DR相关基因单核苷酸多态性的遗传学研究为科研热点。

2.3 高频主题词及副主题词的聚类分析

通过对表2中的44个高频主题词进行聚类分析,总结出近7年来DR基因相关研究的5大主题类团。第一类:DR相关基因单核苷酸多态性的遗传学研究;亚洲大陆世系人群的疾病遗传易感性研究;DR相关microRNA遗传学和代谢研究;血管内皮生长因子A (vascular endothelial growth factor A,VEGFA) 遗传学和血管生成抑制剂的治疗应用研究等(由1、2、3、10、26、9、8、25、43、37、34、23、19、22、38号主题词组成) 。第二类:DR相关视网膜新生血管病理学和遗传学研究 (由39、41、33、20号主题词组成) 。第三类:依赖病毒 (腺相关病毒) 介导的基因治疗方法;信使RNA有关的基因表达调控的实验性研究;氧化应激所致视网膜色素上皮细胞病变的研究 (由27、32、6、15、16、24、44、40号主题词组成) 。第四类:DR的药物治疗;血管内皮生长因子相关药物对视网膜血管内皮细胞的作用 (由7、21、14、18、35、31、42号主题词组成) 。第五类:高糖血症致DR视网膜血管内皮细胞凋亡的代谢学研究 (由29、30、28、4、11、5、12、36、17、13号主题词组成) 。见图2。

表2 2010年至2017年PubMed数据库中DR基因相关文献高频主题词及副主题词Tab.2 High-frequency MeSH terms from the analyzed papers on DR-related genes from 2010 to 2017

图2 2010年至2017年DR基因相关研究高频主题词的共词聚类分析结果Fig.2 Dendrogram of 44 high-frequency MeSH terms from 2010 to 2017

2.4 高频主题词及副主题词的战略坐标分析

为进一步了解各类团在整个研究中的地位,预测未来研究趋势,根据聚类分析结果,分别计算各类团的向心度和密度,以向心度为横轴,密度为纵轴,绘制各个研究聚类的战略坐标图。第一象限表示主题内外部关联好,处于研究核心位置,且研究较为成熟;第二象限表示主题内研究较为成熟,但处于边缘位置;第三象限表示主题内外部关联均较差;第四象限表示外部关联好,主题内研究较差。如图3所示,DR相关基因单核苷酸多态性的遗传学研究 (类团1) 落在第一象限;类团5落在第一、四象限交界处。第三象限主要为类团2、4;第四象限为类团3。

3 讨论

3.1 DR基因相关文献分布规律探讨

美国国立医学图书馆编撰的Medline医学数据库是目前国际上最权威的医学文献检索数据库,具有覆盖面广、报道迅速、使用方便的特点。本研究采取的样本来源于该数据库,基于PubMed进行文献计量学分析,描述了近7年DR基因相关领域发表文献的数量及期刊分布,并选用主要主题词/副主题词作为研究对象进行了分析。本研究结果表明,近7年DR基因相关研究每年的发文量差别不大,可能是该领域新的突破点不多,从而使研究出现了瓶颈。

3.2 DR基因相关研究的主题结构及热点

图3 2010年至2017年PubMed数据库中DR基因相关文献各聚类类团战略分布图Fig.3 Strategic diagram for DR-related genes from 2010 to 2017

主题词是对文献内容最准确、最简洁的提示,在很大程度上反映了论文的主要研究内容。如果某一主题词在其所在的研究领域出现的频率高,则说明该主题词可以反映出此类研究的热点。共聚类分析通过数学算法将关系密切的主题词聚集成类团,1个类团代表1类研究热点[9]。利用高频主题词的共词矩阵,可以用“战略坐标”来进一步分析DR基因相关各热点研究的发展阶段。在战略坐标中,X轴为向心度,表示领域间相互影响的强度,Y轴为密度,表示某一领域内部联系强度[10]。向心度反映的是一个学科领域和其他学科领域相互影响的程度,联系的数目和强度越大,说明该领域在整个研究工作中越趋于中心地位;密度反映的是该主题的内部强度,密度越高说明各主题词之间的联系越紧密,研究趋势越成熟[11]。

本研究发现,DR基因单核苷酸多态性遗传学研究 (类团1) 落在第一象限。这是因为DR是一种多基因作用的疾病,基因存在多态性现象,而遗传异质性及种族差异性也与DR的发生发展密切相关。同种基因启动区、翻译区等不同部位的插入、缺失及突变引起基因空间结构的改变,导致其所编码的转录、翻译产物发生变化,最终引起机体内的一系列异常病理变化。如果能够准确把握基因在DR发生发展过程中的作用机制,即可为DR的基因诊断和治疗提供依据。因此,DR相关基因多态性的研究受到了关注,促使类团1密度和向心度均很高,内外部关联均好。

高糖血症导致视网膜血管内皮细胞凋亡的代谢性研究 (类团5) 位于第一、四象限交界,向心度较高。长期慢性高血糖引起血管内皮损伤,血管壁周细胞减少,动脉血管瘤形成和血-视网膜屏障破坏,血液成分渗透到组织间隙,形成视网膜出血和硬性渗出,血管基底膜增厚,从而导致视网膜缺血性改变。该类团位置说明其与其他类团的联系紧密,提示通过加强该主题的研究可以在一定程度上带动其余各个主题的发展。

DR药物治疗相关基因研究 (类团4) 以及视网膜新生血管相关病理学、动物模型及遗传学研究(类团2) 位于第三象限,说明这2个主题类团在整个学科中处于边缘不成熟的位置,在这一方面的研究有望成为未来的发展方向。

依赖病毒介导的基因治疗方法、氧化应激所致的视网膜色素上皮细胞病变 (类团3) 位于第四象限,其自身内在研究较差,说明需要加强其自身研究,丰富主题内容。在高糖环境中,氧化应激反应可诱导视网膜产生活性氧类物质,造成膜蛋白及脂质过氧化,内皮细胞紧密连接受损,通透性增加,大分子物质通过视网膜微血管内皮细胞沉积在基底膜,从而参与DR的发生发展。应用于DR的基因治疗载体需要具备以下特征:一是能高效地将外源基因导入视网膜神经细胞及视网膜色素上皮细胞;二是能够使其在视网膜细胞中稳定表达。基因治疗载体可分为非病毒载体和病毒载体两大类。病毒载体有腺病毒、逆转录病毒、单纯疱疹病毒、腺相关病毒(adeno-associated virus,AAV) 等。目前,研究[12]表明AAV载体可以靶向感染视网膜光感受器和色素上皮细胞,并以一种稳定有效的方式介导外源基因表达,因此对DR的基因治疗具有显著优越性和潜力。

3.3 本研究的局限性

本研究存在一定局限性。首先,不同类型杂志对文献的收录标准不同,可能会造成杂志收录DR基因相关文献量的差异;其次,PubMed数据库收录范围及主题词标引有其局限性,以主题词作为检索可能会遗漏一些文献;第三,本研究选取了高频主要主题词及副主题词进行处理,不能排除其他低频主题词成为未来研究方向的可能性。

综上所述,本研究首次采用了文献计量学方法,从多角度分析了近8年来国际上关于DR基因相关研究的热点、现状及趋势,为未来开展DR基因相关研究提供了参考信息。

猜你喜欢
主题词象限视网膜
勘 误
深度学习在糖尿病视网膜病变诊疗中的应用
复数知识核心考点综合演练
家族性渗出性玻璃体视网膜病变合并孔源性视网膜脱离1例
高度近视视网膜微循环改变研究进展
球结膜下注射庆大霉素致视网膜损伤1例
关键词的提取与确定
常数牵手象限畅游中考
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
平面直角坐标系典例分析