, ,,,
阿尔茨海默症(Alzheimer disease,AD)是慢性或进行性大脑结构器质性损害引起的神经系统疾病[1],是一种非传染性疾病。其特点是起病缓慢或隐匿且不可逆,病程长且病情迁延不愈,多发于老年期且有多种病因。到目前为止,阿尔茨海默症的病因、发病机理仍然不明,给临床上进行阿尔茨海默症的预防及治疗带来了很大的困难[2]。阿尔茨海默症患者的日常生活必须持续受到他人监护,医治花费巨大且在较长一段时间内严重影响患者及其家庭的正常生活和工作。因此,阿尔茨海默症是目前国家重点支持研究的一项重大慢性非传染性疾病。
目前国内外介绍阿尔茨海默症研究进展的文献并不多,葛佳佳在2015年主要从阿尔茨海默症的药物治疗、神经干细胞移植治疗等方面对该研究进展展开讨论[3],Galimberti D等人在2013年对2012年关于阿尔茨海默症临床以及治疗方面的新进展进行了总结[4]。其余的多是针对该疾病的某一方面进行回顾,如阿尔茨海默症的诊疗研究进展[5]等。以往的研究大多是对某几类刊物所发表的关于阿尔茨海默症的文献进行总结,目前尚未见到国内外有应用同被引聚类分析、共词聚类分析及其战略坐标分析阿尔茨海默症研究演变历程的报道,因此本文尝试运用文本挖掘的方法探讨阿尔茨海默症的研究发展脉络,以期为该研究专业人员和管理决策人员提供参考。
研究表明,同被引次数可用来反映文献在内容及主题上的相关度[6]。以此为基础对这些文献进行的引文聚类分析,可以描述学科发展状况和动态结构[7]。本文利用SCI数据库检索相关文献,检索式为:标题:(“Alzheimer Disease”)OR标题:(“Alzheimer′s Disease”),时间限定为2012年至今,文献类型选择“article”,共获得相关文献9 662篇。将这些论文的文献信息导入书目信息共现挖掘系统BICOMB[8],统计引文频次。截取频次≥150的文献作为高被引文献,共72个,同时构建高被引论文-来源文献矩阵。将该矩阵导入SPSS 19.0分析软件中进行系统聚类,聚类方法选择最远邻元素,度量标准选择Ochiai系数,以此绘制同被引聚类分析树状图。根据树状图将这些高被引论文加以归类,同时结合这些论文的题目和内容,得出各个类别所研究的主题。
研究表明,可根据两个高频主题词在同一篇文献中同时出现的次数来分析这两个主题词之间的密切程度。对全部高频主题词两两统计的共现次数进行聚类,可以对当前学科研究进行归类,从而发现当前研究的热点[9]。
本文利用PubMed数据库检索相关文献,检索策略为:“Alzheimer Disease”[Majr] NOT Review[ptyp], 时间限定为2012年至今,共检索出相关文献11 790篇。将检索到的文献导入BICOMB,统计这些文献中“主要主题词+副主题词”字段的频次,截取频数≥60的主题词作为高频主题词,共107个,同时生成主要主题词+副主题词的词篇矩阵。将该矩阵导入SPSS 19.0中进行系统聚类,聚类方法选择组内连接,度量标准选择Ochiai系数,以此绘制树状图。根据树状图的聚类分析结果对每一类别的高频主题词/副主题词组合的语义关系加以归类,从而分析总结出该类别所研究的主题,进而得到近5年阿尔茨海默症研究的热点。
战略坐标(Strategic Diagram)由Law等人于1988年提出[10]。战略坐标是一个二维坐标,它把每一个研究热点放置在坐标的4个象限中,从而描述各主题的研究发展状况[11]。根据各篇论文的发表时间,计算每个类别的平均发表时间,以此反映该类别主题的平均年龄,称为新颖度;根据各篇论文的被引次数,计算每个类别的平均被引次数,以此反映该类受到关注的程度,称为关注度[12];分别将新颖度和关注度作为X轴和Y轴,以全部高被引论文的平均发表时间和被引次数为原点绘制出引文战略坐标,以此反映此前对于阿尔茨海默症的研究历史。共词战略坐标的横轴表示向心度,纵轴表示密度,坐标的原点则是两个轴的中位数或平均数。向心度用来衡量不同类别之间主题词的密切程度,表示一个学科领域和其他学科领域相互影响的程度;密度用来衡量同一类别中各主题词之间的紧密程度,表示该类维持自己和发展自己的能力[13]。据此原理,通过绘制共词战略坐标来表示阿尔茨海默症研究领域的基本框架,由此分析目前国际上阿尔茨海默症研究热点的发展趋势。
根据被引频次≥150的引文词篇矩阵,利用SPSS 19.0做出聚类分析树状图(图1)。选择距离24为分类标准,将72篇高被引论文根据聚类分析树以及引文的题目和内容分为14类。其中高频引文均为2013年以前发表,因此反映了阿尔茨海默症2013年以前的研究历史。根据各类高频引文的内容,可将阿尔茨海默症的研究热点总结为以下方面。
图1 同被引聚类分析树图
第一方面:关于阿尔茨海默症的诊断,包括第四类、第五类、第十三类。第四类的主要内容是通过特定临床特征来诊断阿尔茨海默症以及利用状态评定量表来评估患者精神状态,并研究轻微认知损害对确诊阿尔茨海默症的临床意义;第五类主要研究阿尔茨海默症的病理生理学诊断标准,包括通过路易小体、额颞骨的小叶退化、血管性病变进行诊断;第十三类则是研究了利用脑脊髓液作为生物标记信号诊断阿尔茨海默症,并将其用于对阿尔茨海默症诊断标准的修正。
第二方面:运用不同的方法判断阿尔茨海默症患者的疾病严重程度,包括第六类。该类主要讲述了运用不同的方法判断阿尔茨海默症患者的疾病严重程度。如可利用神经精神量表区分AD患者行为改变的严重性和频率,利用心理测试、行为评分以及简单的心理和行为组合简单评价,利用临床痴呆评定量表明确AD患者认知功能受损程度。
第三方面:关于阿尔茨海默症的预防,包括第十二类。该类主要讲述了对某些相关的细胞和分子进行研究有助于开发阿尔茨海默症预防和治疗策略。Mattson MP在2004年指出,由于负责信息的存储和处理的神经细胞的进行性功能障碍和死亡,会导致AD患者失去记忆以及认知能力,甚至他们性格的巨大改变。因此,了解与神经元死亡有关的细胞和分子的改变,可能会有助于制定有效的阿尔茨海默症预防和治疗措施[14]。
第四方面:对阿尔茨海默症发病机制以及治疗方法等方面进行研究,包括第一类、第七类、第九类、第十一类。第一类介绍了利用全基因组关联研究来分析与阿尔茨海默症相关基因,主要研究了与阿尔茨海默症相关的CLU、PICALM、CRI、CD33等基因,并通过Meta分析集中分析了载体蛋白4种等位基因与迟发性阿尔茨海默症之间的联系;第七类主要通过比色测定乙酰胆碱酯酶活性研究阿尔茨海默症的发病机制;第九类则是根据淀粉样蛋白假说,研究β-淀粉样蛋白与阿尔茨海默症发病机制之间的关系以及β-淀粉样蛋白定向治疗剂可否用于治疗阿尔茨海默症;第十一类研究了突触损失与阿尔茨海默症发病的相关性研究,以及根据可溶性蛋白聚体可有效抑制海马长时程增强,提出了阿尔茨海默症的特异性治疗方法。
第五方面:关于阿尔茨海默症的病理学研究,该方面包括第八类。该类的病理学研究包括通过石蜡切片和AT8免疫反应评估阿尔茨海默症的神经纤维病变,同时该类也研究了β-淀粉样蛋白在AD患者和非AD患者是大脑中病理性的扩展是否存在明显的差异。
第六方面:对降低阿尔茨海默症的患病风险以及延迟发病进行讨论,包括第二类和第三类。第二类主要是通过德尔菲法了解阿尔茨海默症的全球发病率,以及通过最近对阿尔茨海默症发病机制、诊断治疗的研究讨论如何降低患该疾病的风险;第三类则通过研究未来阿尔茨海默症患者人口增长的趋势,评估了可延迟阿尔茨海默症患者发病的干预措施的潜在影响,以此降低患病风险。
第七方面:利用某些模型对阿尔茨海默症进行研究,包括第十类、第十四类。第十类的研究热点是转基因动物模型在阿尔茨海默症研究中的应用,包括通过转基因鼠中神经细胞内β-淀粉样蛋白聚集、神经退行性变和神经元损失现象研究阿尔茨海默症;第十四类的主要内容是利用静息状态网络和针对动态生物标记的假设性模型研究阿尔茨海默症。该方面涉及利用这些模型对阿尔茨海默症的特征研究、诊断、临床分期及遗传学研究。
根据前述聚类结果,得到战略坐标(图2)。
图2 阿尔茨海默症各研究热点的引文战略坐标
根据引文战略坐标图,从历史的角度(即发表时间的顺序)依照横轴新颖度从左向右分析整个阿尔茨海默症相关研究,分析如下。
第六类和第七类即运用不同的方法判定AD患者的疾病严重程度以及对于发病机制的研究,发表时间最早(其中文献最早发表于1961年),并且关注度也比较靠前,包括用神经精神量表、心理测试、行为评分以及临床痴呆评定表进行评估以及通过乙酰胆碱酯酶活性研究阿尔茨海默症的发病机制。这充分表明,对于阿尔茨海默症的疾病严重程度的评估以及发病机制的研究,是开展阿尔茨海默症研究不可或缺的基础。
关于第四类通过特定临床特征诊断阿尔茨海默症以及利用状态评定量表评估患者精神状态,并研究轻微认知损害对确诊阿尔茨海默症的临床意义等研究文献的平均发表时间是1992年。早在1975年,就有研究人员提出临床医生可用“小精神状态”对患者的精神认知状态进行分级和评估[15];在2004年则有相关流行病学研究表明轻度认知障碍可在某些条件下加速转变为痴呆以及阿尔茨海默症[16]。尽管这类主题研究开始时间比较早,但目前仍是人们最为关注的阿尔茨海默症的研究方向。
对于阿尔茨海默症的病理生理学诊断标准(第五类)和病理学研究(第八类)均开始于上世纪90年代初期。随着对阿尔茨海默症研究的不断深入,目前对阿尔茨海默症的病理学研究关注度较高,对其病理生理学诊断标准的研究关注度相对较低。
目前,阿尔茨海默症的淀粉样蛋白级联假说的相关研究(第九类)受关注程度很高,而且也比较新颖。假说最早由HARDY JA在1992年提出[17],此类包含的3篇文献均在讲述对于阿尔茨海默症的淀粉样蛋白级联假说的相关研究。这个假说是目前阿尔茨海默症研究的一个焦点话题。20世纪初期的相关研究主要集中在转基因动物模型在阿尔茨海默症研究中的应用(第十类)以及阿尔茨海默症的一些特异性治疗方法(第十一类),但是受关注程度不高,还有很大的发展空间。有学者于2004年提出,利用与负责信息存储和处理的神经细胞进行性功能障碍或死亡有关的分子和细胞变化研究阿尔茨海默症(第十二类)。这一研究方向比较新,但受关注程度不是很高。
2007年前后比较新颖的课题是分析与阿尔茨海默症相关的基因(第一类),研究如何降低阿尔茨海默症的患病风险和延迟发病(第二类、第三类),以及利用脑脊髓液作为生物标记信号诊断阿尔茨海默症,并将其用于阿尔茨海默症诊断标准的修正(第十三类)。尽管发表时间比较近,但是目前除了对如何降低阿尔茨海默症的患病风险及延迟发病的研究外,其他研究课题的被引用次数均较少。
用静息状态网络和针对动态生物标记的假设性模型研究阿尔茨海默症(第十四类)是目前关于阿尔茨海默症的相关研究中最为新颖的,平均发表时间为2009年,受关注程度比较高,尤其是对阿尔茨海默症的诊断及遗传性的研究。
本文选出现频次≥60的前107条“主要主题词+副主题词”记录作为高频主题词,利用SPSS 19.0对高频主题词进行聚类分析,得到共现聚类分析树图。选择距离24为分类标准,将107条高频主题词根据聚类分析树分成九类,分析各类内主题词之间的寓意关系,共得出目前阿尔茨海默症研究以下九类热点。
第一类:研究了利用哌啶类化合物、茚满类化合物、胆碱酯酶抑制剂、美金刚、脑代谢改善药和神经保护药等治疗阿尔茨海默症。如2014年,Gareri P等人针对联合使用美金刚和胆碱酯酶抑制剂治疗阿尔茨海默症的回顾性研究[18]。
第二类:在阿尔茨海默症护理中,对病人日常生活活动和心理活动的研究以及对医疗护理者心理负担的研究。如2014年Conde-Sala JL等人就阿尔茨海默症护理者的心理变化轨迹以及影响因素进行研究后,认为患者的精神症状以及此护理者是否是唯一的护理者等均会对医疗护理者的心理负担产生重要影响[19];2015年,Votruba KL等人研究了阿尔茨海默症患者对于自己精神状态的认知与护理者对其抑郁症状的描述之间的关系,探索了两者分别在预测阿尔茨海默症病人的情绪和日常生活活动的作用[20]。
第三类:研究了阿尔茨海默症的遗传发病机制,包括β-淀粉样蛋白、载脂蛋白E类、早老素的遗传学变化,涉及到遗传易感性和单核苷酸多态性。如2001年Ertekin-Taner N等人在典型迟发型阿尔茨海默症遗传家系中进行了β-淀粉样蛋白的遗传可能性研究,提出在典型阿尔茨海默症中可将该蛋白作为连锁分析识别位点[21]。
第四类:进行了AD患者体内β-淀粉样蛋白对神经元的毒性及其与年龄的相关性研究,以及可利用正电子发射断层扫描(PET)成像技术检测脑内β-淀粉样蛋白的累积以诊断阿尔茨海默症。如Sevigny J等人研究将淀粉样蛋白正电子发射断层扫描(PET)成像作为筛选工具来鉴定淀粉样蛋白阳性患者,从而可以进一步诊断阿尔茨海默症[22]。
第五类:阿尔茨海默症患者的物质代谢研究,包括淀粉样前体蛋白分泌酶的代谢,β-淀粉样蛋白、β-淀粉样蛋白前体及tau蛋白在脑、神经元、海马等处的代谢研究。如Takahashi RH等人在2013年发表的一篇文献表明β-淀粉样蛋白肽和轴突微管相关蛋白tau蛋白的病理聚集是阿尔茨海默症的重要标志[23]。
第六类:介绍了一些阿尔茨海默症的研究方法(包括运用图像解释、计算机辅助、模式识别、自动化、磁共振成像等研究阿尔茨海默症)和阿尔茨海默症的病理学研究(包括海马体、神经元,大脑、白质、淀粉样斑块的研究,轻度认知障碍和认知障碍的病理学研究)。如Liao W等人使用单变量和多变量来对轻度认知障碍或阿尔海默病患者的脑结构改变进行的协方差分析,显示皮质厚度在内嗅、颞和扣带皮质等处下降更显著[24]。
第七类:研究了阿尔茨海默症的诊断及对阿尔茨海默症病因和其治疗的费用方面的研究。如Thomann PA等人通过研究,发现可通过检查是否有区域局限性海马体萎缩来进行阿尔兹海默症的早期诊断[25]。
第八类:通过对阿尔茨海默症患者的血液和脑脊髓液进行研究确定此病的进展情况,具体可通过对脑脊髓液中β-淀粉样蛋白、多肽碎片、tau蛋白、生物标志物等物质的研究以及对于载脂蛋白E4的基因研究。如Hoglund K等人2008年发表的文献指出运用免疫印迹分析Abeta水平可用来判断有轻度认知障碍的患者是否会发展成阿尔茨海默症,轻度认知障碍能够发展成阿尔茨海默症的患者具有载脂蛋白E基因型和比较高的tau和磷酸tau的脑脊髓液水平[26]。
第九类:阿尔茨海默症的预防控制、治疗以及对β-淀粉样蛋白与阿尔茨海默症发病的相关性的研究。如Schott JM 等人2006年发表文献表明β-淀粉样蛋白是阿尔茨海默症一个重要的致病因素,β-淀粉样蛋白免疫治疗是治疗阿尔茨海默症的新的突破点,还可以通过抑制β-分泌酶和γ-分泌酶来诊治阿尔茨海默症[27]。
从上述共词聚类分析得到9个研究热点类别的战略坐标见图3。
图3 阿尔茨海默症相关研究高频主题词的战略坐标
结合共词战略坐标(图3)分析阿尔茨海默症领域的热点如下。
第一象限包括类别5(阿尔茨海默症的物质代谢研究)、类别7(阿尔茨海默症的诊断)、类别9(阿尔茨海默症的预防控制及治疗)。这3类的向心度和密度相对于其他类来说比较高,内部各研究主题之间关系紧密,而外部又与其他类有着密切的联系,说明这3类的研究趋向成熟,是阿尔茨海默症研究的核心主题。
第二象限包括类别2(阿尔茨海默症患者的心理护理)。此类具有较高的密度,但向心度较低,此类与其他类联系不紧密,但内部的聚集程度很高,具有较高的聚合度,说明该研究已形成了一定的规模。
第三象限包括类别1(应用哌啶类化合物等治疗阿尔茨海默症)、类别3(阿尔茨海默症的遗传学发病机制研究)、类别4(应用PET技术检测脑内β-淀粉样蛋白的累积以诊断阿尔茨海默症)、类别8(应用特定物质确定阿尔茨海默症的发展情况)。这3类的密度和向心度都比较低,说明其内部结构松散,且与其他类之间的联系不够紧密,目前的研究尚不成熟,但未来会受到人们更多的重视。
第四象限包括类别6(研究阿尔茨海默症患者的某些病理改变)。此类密度低,向心度高,说明该研究热点内部结构比较松散,但与其他类别联系紧密,在整个阿尔茨海默症研究领域中表现活跃,研究人员对此有浓厚的兴趣和较高的关注度。虽然该研究主题尚不成熟,但具有巨大的潜在发展空间。
“引文战略坐标”所用数据为高频引文,均发表于2013年以前,故由此得到的研究主题应该反映阿尔茨海默症研究领域在此以前的研究历史;“共词战略坐标”所用数据为2012-2016年间发表论文的高频主题词,故由此得到的研究主题反映阿尔茨海默症研究领域2012-2016间的研究现状。二者在分析各主题发展状况时可互为补充。
“共词战略坐标”是以向心度和密度构成的二维坐标,在图中一共形成4个区域,用来描述各个主题发展状况。位于第一象限,说明该区域内的主题趋向成熟,并与其他主题建立了广泛的联系;位于第二象限,说明该区域内的主题研究比较集中,但是与其他领域还未建立广泛的联系,具有潜在的发展趋势。一般来说,趋向成熟和具有潜在发展趋势的主题通常被引次数比较高,这一点在“引文战略坐标”图中可以得到印证。如“共词战略坐标”中的第7类阿尔茨海默症的诊断位于第一象限,其平均被引次数为763,居各热点平均被引次数排序的第一位,反之亦然。
另外,研究阿尔茨海默症的预防,在“引文战略坐标”图中新颖高较高,但关注度较低;在“共词战略坐标”图中位于第一象限外侧,说明该主题随着时间的发展逐渐受到研究人员关注,后期趋向成熟,成为主流研究之一。通过研究阿尔茨海默症患者的脑脊髓液来确定疾病进展情况,在“引文战略坐标”图中新颖高较高,但关注度较低;在“共词战略坐标”图中位于第三象限,说明该主题自身发展较慢,有待于进一步发展以受到研究人员的关注。
本文也存在局限性。高频主题词及高频引文的阈值选取虽然可利用一些固定算法,但往往不切合实际,因此本文中高频主题词和高频引文的阈值是凭经验确定的。这会直接影响到高频主题词及高频引文的数量,从而影响聚类结果。这也是高频主题词以及高频引文聚类分析固有的局限性。
通过同被引聚类及引文战略坐标分析,可以得出阿尔茨海默症的研究热点、历史上的典型研究及其战略发展趋势。从各类热点受关注的程度来看,利用特定临床特征进行阿尔茨海默症的诊断是目前最受关注的研究热点,其次是阿尔茨海默症的淀粉样蛋白级联假说的相关研究。
对于阿尔茨海默症的发病机制等研究,虽然开始时间较早,但目前仍是专家学者比较关注的研究热点。关于阿尔茨海默症相关基因的研究、如何降低阿尔茨海默症的患病风险以及延迟发病等方面,由于研究时间相对较晚,目前受关注程度不高,具有巨大的潜在研究发展空间,今后将日益受到人们的重视。
通过高频主题词的共词聚类及战略坐标分析,可以得出阿尔茨海默症的研究热点及其战略发展趋势。从向心度角度来看,当前阿尔茨海默症研究中比较核心的问题是阿尔茨海默症的病理学研究,阿尔茨海默症患者的物质代谢研究,阿尔茨海默症的诊断以及阿尔茨海默症的预防控制及治疗;从密度角度看,阿尔茨海默症患者的物质代谢研究,阿尔茨海默症的病因及治疗方法的研究,阿尔茨海默症患者的心理护理等都是比较成熟的研究主题,而阿尔茨海默症的病理学研究还不够成熟。
其余的主题包括阿尔茨海默症的遗传学发病机制研究等都距离研究核心比较远,同时自身的研究的密度也不够高,说明这些研究还是有待于进一步发展。