张桐硕,冀润利,夏时海,向晓辉
·脂肪性肝病·
近10年非酒精性脂肪性肝病研究热点共词聚类分析*
张桐硕,冀润利,夏时海,向晓辉
目的了解中国近10年在非酒精性脂肪性肝病(NAFLD)领域的研究热点和主题结构。方法以2014年2月为检索节点,对“中国科技引文数据库(CSCD)”中2004年1月~2013年12月所收录的有关NAFLD研究文献中的关键词作为研究对象,采用词频分析、因子分析和共词聚类分析等方法,应用Excel 2010和SPSS17.0统计软件对这些关键词进行统计分析。结果共检索到标注关键词的NAFLD相关文献852篇,截取的40个高频关键词涵盖全部相关论文数的70.2%;经共词聚类分析归纳出有关NAFLD研究中的9个研究热点:胰岛素增敏药物、超声检查、流行病学及危险因素、动物模型、发病机制及中医药疗法、胰岛素抵抗、中医药研究、基因水平和临床诊治研究。结论本文归纳出的9个研究热点涵盖了近10年在NAFLD研究领域的中文文献,了解它们的进展有助于相关研究的扩展。
非酒精性脂肪性肝病;共词聚类分析;因子分析;研究热点
非酒精性脂肪性肝病(non-alcoholic fatty liver disease,NAFLD)是一种无过量饮酒史的肝实质细胞脂肪变性和脂肪贮积为病理学特征的临床综合征。NAFLD的疾病谱是由单纯性肝脏脂肪变性发展到非酒精性脂肪性肝炎(non-alcoholic steatohepatitis,NASH),最终导致肝硬化甚至肝细胞癌[1]。NAFLD在西方国家正逐渐成为一种主要慢性病日益受到重视,但现即将成为一个全球性流行病[2,3]。近年来,随着人们生活水平的提高,生活方式的改变以及饮食结构的变化,NAFLD在我国的发病率呈逐年上升趋势,有报道已占到中国肝硬化病因的第二位[4]。我国近10年NAFLD的研究取得了长足进展,并独具特色。因此,了解和把握我国NAFLD的研究状况和特点具有重要意义。共词分析法属于内容分析方法中的一种,已日益完善并被广泛应用于各个研究领域,其原理是通过对能够表达某一学科领域主题或研究方向的专业术语共同出现在同一篇文献或论文中的分析,判断学科领域中主题间的关系,进而展现该学科的研究结构[5]。但到目前为止,未见应用定量方法分析NAFLD方面研究热点的文章[6,7]。本文拟结合文献计量分析与内容分析,应用因子分析和共词聚类分析法,对我国2004年~2013年十年间发表的NAFLD相关文献进行分析,旨在揭示国内NAFLD领域研究的范围与热点,以期为该领域的研究人员提供可资参考的依据。
1.1 资料来源本研究选取中国科技引文数据库(2004年~2013年)的论文为基本的数据来源。为保证查准率,选取的文献数据包含了以下两个检索结果:(1)“文题”包含“非酒精性脂肪*肝*或NAFLD or NASH”的论文;(2)“关键词”包含“非酒精性脂肪*肝*或NAFLD or NASH”的论文。从得到的检索结果中剔除会议通知、会议报道、刊物征稿等消息类文献,并只挑选有关键词的学术论文。最后经过去重后,得到国内相关研究文献852篇。
1.2 研究方法由于各文献作者所使用的关键词存在不规范性,所以对关键词加以规范,合并同义词、近义词以及中英文不同写法等,用通用的关键词统一命名[8]。把非酒精性脂肪肝、非酒精性脂肪性肝病、脂肪肝(非酒精性)、NAFLD等统一合并为非酒精性脂肪肝;把甘油三酯、甘油三脂、甘油三酯类、TG等统一合并为甘油三酯;把体质指数、人体质量指数、体重指数、BMI等统一合并为体质指数。通过Excel 2010对这些关键词进行词频统计。以1973年Donohue[9]根据齐普夫定律推导出的高频低频词界定公式:为依据,进行先行排列,其中,是词频为1的关键词的个数,为高频词中的最低频次值,即高频、低频词频临界值。从中截取40个关键词作为高频关键词。在确定高频词汇后,两两统计这40个关键词在文献中的共现频次,建立一个40×40的共词矩阵,再依据Ochiia系数将共词矩阵转换成相关矩阵,用于因子分析和聚类分析[10]。将相关矩阵导入到SPSS17.0统计软件,进行因子分析,按照“特征值大于1的因子被保留,特征值小于1的因子被舍弃”,从关键词中提取符合条件的因子个数并进行分析。应用SPSS17.0软件作共词聚类分析,绘制高频主题词的聚类分析树图。
2.1 关键词词频分析情况对关键词合并后,共得到1158个规范关键词,其中前40位高频关键词见表1。这40个关键词涵盖了相关文献598篇,占全部相关论文篇数的70.2%。
表12004年~2013年我国有关NAFLD文献高频关键词
2.2 因子分析结果按照“提取的因子累积百分比要达到60%以上”的原则,从关键词中提取符合条件的因子9个,见表2。由此可见,在后面所进行的聚类分析中,将本研究所用的高频关键词分为9类。
表2 因子分析结果
2.3 聚类分析结果经共词聚类分析,得到40个高频主题词的聚类分析树图(图1)。根据聚类结果,并结合专业知识对每一类关键词组合的语义关系加以分析,归纳出我国近10年来有关NAFLD研究中9个研究热点:(1)胰岛素增敏药物对相关细胞因子的影响,由白介素、抵抗素、二甲双胍、罗格列酮、胰岛素抗药性、肿瘤坏死因子-α等6个关键词组成;(2)超声检查的广泛应用,由超声检查、大鼠、肝纤维化等3个关键词组成;(3)NAFLD的流行病学及危险因素,由代谢综合征、儿童/青少年、肥胖、高脂血症、患病率、流行病学、体质指数、危险因素等8个关键词组成;(4)基于动物模型的行为干预研究,由动物模型、非酒精性脂肪性肝炎、小鼠、饮食干预、运动干预等5个关键词组成;(5)NAFLD的发病机制及中医药疗法的推广,由发病机制、甘油三酯、胃肠道疾病、氧化性应激、中医药疗法等5个关键词组成;(6)胰岛素抵抗,由非酒精性脂肪肝、糖尿病、胰岛素抵抗、脂肪肝等4个关键词组成;(7)中医药研究,由肝功能、血脂、中医药研究等3个关键词组成;(8)发病机制在基因水平上的研究,由基因、瘦素、胰岛素、脂联素等4个关键词组成;(9)NAFLD的临床诊治研究,由诊断、治疗等2个关键词组成。
图1 高频关键词的聚类树状图
本研究基于文献计量法和内容分析法,利用词频分析、因子分析、共词聚类分析,结合具体论文和专业知识较真实客观地总结了我国近10年NAFLD的研究热点和领域。以下9个研究热点在一定程度上体现了这个阶段国内NAFLD的研究现状。
胰岛素增敏药物对相关细胞因子的影响。白介素、抵抗素、肿瘤坏死因子-α这些细胞因子的改变可诱发胰岛素抵抗,从而参与脂肪性肝炎和肝纤维化的发病。胰岛素抵抗又会引起胰岛素抗药性的发生,因而改善胰岛素抵抗的药物如以二甲双胍为代表的双胍类药物及以罗格列酮成为目前临床上治疗NAFLD较为常用的药物[11]。大量的动物实验和临床研究通过二甲双胍、罗格列酮等胰岛素增敏药物对上述与NAFLD相关的细胞因子的影响,来探究药物的作用机制和治疗效果,使之成为NAFLD研究领域的热点之一。
超声检查的广泛应用。B超在脂肪肝定性及定量诊断中具有重要的临床应用前景,是诊断脂肪肝的首选方法。此外,超声引导下的肝穿刺活检是迄今最可靠的脂肪肝鉴别方法,但超声检查的敏感率和正确率受肝纤维化程度的影响。有报道认为,在非纤维化的肝脏中,超声诊断脂肪肝的敏感性达100%[12]。
NAFLD的流行病学及危险因素。由于我国超重和内脏性肥胖的高发,我国NAFLD发病率不断上升,并越来越呈现出低龄化的趋势,甚至出现了许多儿童和青少年患者。体质指数(BMI)与人体脂肪含量之间存在明显的曲线关系,BMI至今仍被广泛用于诊断肥胖和超重,但需根据性别及种族进行适当的校正。脂肪肝与肥胖关系密切,脂肪肝患者BMI明显高于非脂肪肝人群。因此,调整饮食,控制体质量,有效干预超重,是降低脂肪肝发病率的重要手段。代谢综合征、肥胖、糖尿病和高脂血症已被公认为是导致NAFLD和NASH发生发展的危险因素[13]。
动物模型的行为干预研究。我国对NAFLD的研究主要是通过动物模型实现的[14],而小鼠是NAFLD造模中首选的实验动物之一。动物模型除了具有评价一些药物治疗效果外,近年来科研人员也在积极探索给予模型动物行为干预研究。在动物模型上证实了运动干预和低热卡饮食可促进实验动物肝脂肪变的消退,显著改善脂肪性肝炎。动物模型研究结果体现了调整饮食和增加运动等非药物治疗措施对于促进NAFLD康复的重要性,对人类寻找NAFLD的防治方法具有启发意义。
NAFLD的发病机制及中医药疗法的推广。NAFLD的病因及发病机制均相当复杂。相比而言,目前对酒精性肝病(AFLD)的发病机制有较多的了解,但对NAFLD的发病机制并未完全明确。我国在NAFLD的研究方面还很肤浅,发病及进展机制有待于医学工作者去探索。“二次打击”学说已成为阐明NAFLD发病机制的主要理论。“第二次打击”涉及氧化性应激,而氧化性应激参与糖脂代谢、胰岛素敏感性及炎性反应等多个病理学过程。甘油三酯增高为NAFLD病人的主要特征。贮存于脂肪组织细胞中的甘油三酯分解可提供大量的游离脂肪酸,血浆游离脂肪酸的升高可引起细胞线粒体结构和功能异常,造成氧化和抗氧化系统的动态失衡,即氧化性应激,而氧化性应激与脂质过氧化是非酒精性脂肪肝受到二次打击进一步发展的重要因素。同时,由胃肠道疾病引起的营养不良,造成肝脏脂肪转运障碍也可导致NAFLD,这一发病机制正逐渐受到重视。由于NAFLD的发病机制至今尚未完全阐明,缺乏有效的干预方案和药物。中医药对于治疗脂肪肝具有疗效稳定持久以及不良反应少等优势。采用中药多靶点和多环节作用的特点,并与生理学和现代药理学研究相结合[12],发掘和解释中药、膏方、针灸、电针等中医药疗法的临床价值,从而为NAFLD提供更多更有效的治疗手段,乃是我国NAFLD研究的一大特色。
胰岛素抵抗。胰岛素抵抗又称胰岛素耐受,是肝、外周脂肪以及肌肉组织对胰岛素作用的生物反应低于正常水平。胰岛素抵抗干预脂质代谢,引起肝细胞内脂质堆积,形成脂肪肝,即“二次打击”学说中所谓的“第一次打击”。胰岛素抵抗普遍存在于2型糖尿病中,是糖尿病根本的触发因素,因此糖尿病患者是NAFLD的高发人群。由于胰岛素抵抗在NAFLD发病中起到关键作用,一直是国内外NAFLD研究的焦点。
中医药研究。NAFLD的中医药研究以中医传统基础理论指导作为基本原则,结合辨证论治的中医理论,运用现代医学统计学析因分析为主要方法,与肝功能、血脂等指标的检验结果进行比对,从而来初步探讨NAFLD的舌脉特点、症状、证候分型特点,达到为进一歩的临床辨证、辨病、诊断、以及治疗提供理论依据。NAFLD的证候学研究、辨治规律研究等中医药研究逐渐兴起,尤其是近几年来中医对NAFLD的研究进一步深化,取得了一系列新进展[7]。
基因水平上的发病机制研究。NAFLD有家族性发病现象,提示遗传基因可能起着重要的作用,多种基因与NAFLD发病的易感性有关。瘦素、胰岛素和脂联素都是机体脂质代谢以及糖稳态调控的重要激素。瘦素具有抑制胰岛素分泌的能力,瘦素的缺乏及瘦素受体的基因敲除可以导致脂肪肝的形成。现有的研究表明,脂联素的基因多态性影响着胰岛素的敏感性,2型糖尿病和代谢综合征的易感位点即是脂联素基因所在位点。对基因进行分析和检测可以为个体选择最有效的治疗原则,以及针对其基因信息提供特异性的药物。目前,国内外对NAFLD发病机制的研究均已达到基因水平,并且发展迅速。
NAFLD的临床诊治研究。NAFLD的诊断和治疗密不可分。对NAFLD进行及时准确的诊断对提高治疗效果、减少肝脏疾患的罹患率及病死率有十分重要的临床意义。对NAFLD检测手段的发现、研究的进一步深人将为抗脂肪肝新药研发提供理论依据。NAFLD的治疗仍未发现特效药物,目前的治疗主要包括生活方式调节和药物治疗两方面。
从整体来看,我国近10年NAFLD领域的研究热点内容丰富,涵盖危险因素、发病机制、防治措施等多个方面;研究方式多样,包括流行病学调查、临床试验、动物模型等手段;胰岛素抵抗是NAFLD发病机制研究的焦点,对相关因子的研究程度逐渐深入基因和分子水平;代谢综合征、肥胖、糖尿病和高脂血症是导致NAFLD的主要危险因素。另外,我国的NAFLD研究热点反映出以下国情特点:NAFLD患者呈现低龄化的趋势,儿童/青少年患者受到普遍关注;中医药研究逐渐兴起,中医思想对NAFLD的认识日趋成熟,中医药疗法效果显著,具有广泛的研究空间和开发前景。
关键词是文章核心内容的浓缩和提炼,一般而言,关键词出现的频率可以反映某个研究领域受关注的程度,关键词出现的频率越高,该关键词所代表的研究领域就越受关注,该研究领域就越有可能是某个学科的研究热点。因此,按照关键词出现的频率排序,高频主题词就能反映出某个学科的研究热点。但是单凭词频统计还不足以准确判断该学科的研究热点及其变化,因此需要在确定高频词汇后,两两统计这些关键词在文献中的共现频次,建立共词矩阵,再通过Ochiia系数将共词矩阵转换成相关矩阵。相关矩阵的数据很重要,它是因子分析和聚类分析的基础数据。
“因子分析要达到的目标就是用尽可能少的因子去描述众多的指标或因素之间的联系,其基本思想是根据相关性大小把研究对象的变量分组,使得同组内的变量之间相关性较高,而不同组的变量相关性较低”。用因子分析法可以将众多的观测变量浓缩成少数几个因子,即根据相关性大小把研究对象的变量进行分组,把相关性比较密切的几个变量归在同一类中,每一类变量就成为一个因子,用较少的几个因子反映原始资料的大部分信息。共词聚类分析法是将距离较近的主题词聚集起来,形成概念相对独立的类团,使类团内属性相似性最大,类团间属性相似性最小。
本研究利用共词分析法对我国2004年~2013年NAFLD的研究热点和主题结构进行了揭示,充分显示了共词分析在探索学科研究热点及趋势方面具有的实用性。但本研究也存在一些不足,如只纳入了中国科技引文数据库(CSCD),可能会造成其他研究成果的丢失,但本研究的结果仍为我们了解我国近10年NAFLD的研究热点提供了线索。此外,共词聚类分析虽然是探讨学科研究热点的常用方法,但是也存在着在揭示信息内容不够全面的缺点。下一步可将NAFLD共词分析法进行拓展和完善,比如利用战略坐标判定我国NAFLD各个研究热点的成熟度、核心以及演化情况,利用共词网络挖掘NAFLD的核心和边缘主题,以期更加全面系统地了解NAFLD的研究热点与发展现状。
[1]Kleiner DE,Brunt EM,Van Natta M,et al.Design and validation of a histological scoring system for nonalcoholic fatty liver disease.Hepatology,2005,41(6):1313-1321.
[2]de Silva HJ,Dassanayake AS.Non-alcoholic fatty liver disease: confronting the global epidemic requires better awareness.J Gastroenterol Hepatol,2009,24(11):1705-1707.
[3]Loomba R,Sanyal AJ.The global NAFLD epidemic.Nat Rev Gastroenterol Hepatol,2013,10(11):686-690.
[4]段誉.1080例肝硬化患者病因及临床特点分析.健康之路,2013,12(6):40-42.
[5]李佳.共词矩阵在聚类结果分析中的作用.中华医学图书情报杂志,2009,18(4):77-81.
[6]陈大明,肖宏.基于Web of Knowledge的乙型肝炎文献计量研究.中国科技期刊研究,2007,14(5):802-808.
[7]陈蓓琪.脂肪肝文献评价和辨证论治规律探讨.南京中医药大学博士学位论文,2012.
[8]付瑶,杨畔.基于共词分析的我国关联数据研究进展探析.图书馆学研究,2013,24(4):18-24.
[9]Donohue JC.Understanding seientific literatures-a bibliometrie approach.Cambridge:The MIT Press,1973:49-50.
[10]钟伟金,李佳.共词分析法研究(一)-共词分析的过程与方式.情报杂志,2008,34(5):70-72.
[11]王建丽,张斌.非酒精性脂肪肝的研究进展.光明中医,2013,16(5):1081-1084.
[12]曾民德.脂肪肝.中华消化杂志,1999,16(2):47-49.
[13]赵紫烟,董静波.非酒精性脂肪肝的危险因素及脂肪肝诊断的研究进展.医学综述,2011,24(10):1522-1524.
[14]张瑜,许建华.脂肪肝模型研究进展.海峡药学,2008,20(3): 10-13.
(收稿:2014-03-17)
(校对:陈从新)
Chinese science citation database based co-words clustered analysis on research hotspots in non-alcoholic fatty liver diseases in China during the past decade
Zhang Tongshuo,Ji Runli,Xia Shihai,et al.Department of Hepatopancreatobiliary and Splenic Medicine,Affiliated Hospital,Logistics University of Chinese People's Armed Police Forces,Tianjin 300162,China
ObjectiveTo explore the research hotspots and subject structure of non-alcoholic fatty liver diseases(NAFLD)in China in the past decade.MethodsThe key words of articles in NAFLD field were retrieved in Chinese science citation database(CSCD)from January 2004 to December 2013.Word-frequency analysis,factor analysis and co-words clustered analysis were applied and statistic analysis was performed using excel 2010 and SPSS17.0.ResultsEight hundred and fifty-two articles in presence of keywords about NAFLD were included and 40 high-frequency words were selected,which accounted for 70.2%of all relevant papers.The co-word clustered analysis showed that there were 9 hot subjects about NAFLD during last 10 years including insulin-sensitizing drugs,ultrasonography,epidemiology and risk factors,animal models,pathogenesis and traditional Chinese medicine,insulin resistance,Chinese medicine research,as well as gene and clinical treatment studies. ConclusionsThe co-word clustered analysis of research hotspots helps to understand the developmental of NAFLD in China.
Non-alcoholic fatty liver disease;Co-word clustered analysis;Factor analysis;Research hotspots
国家自然科学基金项目(81173393);武警后勤学院创新团队基金项目(WHTD201310)及附属医院种子基金项目(FYM201117)
300162天津市武警后勤学院附属医院消化二科/肝胆胰脾中心(张桐硕,冀润利,夏时海,向晓辉);检验医学系(张桐硕)
张桐硕,男,21岁,大学本科。主要从事消化系疾病生物标志物研究。E-mail:zhangtongshuo@yeah.net
向晓辉,E-mail:xiaohuixiang@163.com
10.3969/j.issn.1672-5069.2014.05.007