基于复杂网络节点度分析技术的肝纤维化证候相关生物指标文献研究*

2012-08-31 06:14王伟明陈建新畅洪昇
中西医结合肝病杂志 2012年5期
关键词:纤维化证候肝硬化

王伟明 卢 朋 陈建新 赵 云 畅洪昇 王 伟△

1.北京中医药大学 (北京,100029) 2.中国科学院自动化研究所综合信息系统研究中心 3.北京中医药大学信息中心4.军事医学科学院基础医学研究所

复杂网络分析:复杂网络是描述复杂系统的一种有效方式,对复杂网络的分析有多种方法,本技术主要使用节点度来衡量生物指标的关联性,确定关键的生物指标。所谓节点度是指该节点的连接数,即节点的边数。在本文中,节点度表示为生物指标相关性。本技术使用复杂网络描述相互关联的生物指标,以3 018篇肝纤维化中医证候医学文献为处理对象,从系统的、整体的、全局的观点去考量生物指标,把生物指标作为实体对象,建立生物指标的复杂网络,通过使用文本挖掘的同现处理、复杂网络分析,获取关键核心的生物指标。

1 资料与方法

1.1 检索文献与建立数据库

1.1.1 依据2011年肝硬化中西医结合诊治共识[1],确定肝硬化中医证候:肝气郁结证/水湿内阻证/湿热蕴结证/肝肾阴虚证/脾肾阳虚证/瘀血阻络证,以此作为文献研究对象。

1.1.2 在CNKI(《中国知网》)基本检索窗口中确定“全文”,分别输入:“肝纤维化”和“肝硬化”,“并含”“主题”“证候or证”:分别得到文献,肝气郁结428篇,湿热蕴结326篇,水湿内阻44篇,肝肾阴虚1 333篇,脾肾阳虚818篇,瘀血阻络522篇,文献发表时间:1981-2012年,共有文献3 471篇,分别下载文献。

1.1.3 纳入标准 凡涉及到肝硬化 (或肝纤维化)中医证候或某一证型与生物指标的相关研究文献均列为纳入文献。

1.1.4 排除标准 ①非肝硬化或肝纤维化为主要内容的相关文献予以排除;②综述性文章均予以排除;③经阅读发现内容重复且为同一研究的文献,选择资料最为完整的一篇文献予以纳入,其余排除;④仅有治疗经验而无相关生物理化指标的医案及治验性质的文章予以排除。

1.1.5 筛选策略及录入方法 对以上检索到的3 471篇文献,进行人工核对和阅读,按照上述纳入与排除标准,筛选以肝硬化 (或肝纤维化)证候及相关生物指标为主要研究内容的文献且为核心期刊收录的文章3 018篇。对筛选文献的基本信息进行整理,文章题目、中医证候、生物指标、结论、文献来源、作者、期刊等,并转化至文本文档录入,建立数据库。

2)改变超声温度313、323、333、343、353 K,超声酸化后样品编号记为ST1、ST2、ST3、ST4、ST5。

1.2 建立待选的生物指标词典 按照肝脏疾病临床与基础的类别与范围,先广泛初选相关指标200个生物指标如下[2~7]:

神经内分泌指标(NEI):多巴胺 (DA),去甲肾上腺素(NE,NA),乙酰胆碱 (Ach),5-羟色胺 (5-HT),促肾上腺皮质激素释放激素 (CRH),肾上腺素 (AD),促肾上腺皮质激素 (ACTH),性激素结合球蛋白 (SHBG),血浆皮质酮(CORT),血清睾酮 (T),脱氧异雄酮,雄烷二酮 (AR),雌二醇 (Ez),雌酮 (EO),雌三醇 (E)a,性激素结合球蛋白 (SHBG),雌激素受体 (ER),γ干扰素 (interferon γ,IFNr)。

肝纤维化指标:透明质酸 (HA)、层粘连蛋白 (LN)、Ⅲ型前胶原 (PCⅢ)、Ⅳ型胶原 (Ⅳ-C),TP,CG,PLD,组织型纤溶酶原激活物 (PA),组织型纤溶酶原激活物抑制剂(PAI)-1。

肝炎肝硬化指标:HBV DNA定量,HCV RNA,凝血酶原活动度 (PTA),丙氨酸氨基转移酶 (ALT),天冬氨酸转氨酶 (AST),总胆红素 (TBil),IFNα,IFNγ,白蛋白 (A),球蛋白 (G),白蛋白/球蛋白比值 (A/G),血清胆碱酯酶(ChE),血清一氧化氮 (NO),血清内皮素 (ET)-1,凝血酶原时间 (PT),部分凝血酶时间 (APTT),凝血酶时间(TT)。

细胞因子:白介素 (IL)-10,IL-13,IL-27,病毒脱氧核糖核酸单核细胞趋化蛋白-1(MCP-1),巨噬细胞抑制蛋白-2(MIP-2),红细胞生成素 (EPO),血清粒细胞集落刺激因子(G-CSF),转化生长因子 (TGF)β1,TGFβ2,肝细胞生长因子 (HGF),成纤维细胞生长因子 (FGF)。

血液流变学指标:门静脉内径 (DPV),脾静脉内经(DSV),门静脉最大血流速度 (PVX),脾静脉最大血流速度 (SVX),门静脉血流量 (PVF),脾静脉血流量 (SVF)。

分子生物学指标:肝星状细胞 (HSCs),α-SMA蛋白,Ⅰ型胶原蛋白 (ColⅠ),Ⅲ型胶原蛋白 mRNA,Smad3表达,AGE受体 (RAGE),NF-κB,p65 mRNA,RNAi,维甲类X受体α (RXR-α),视黄醇类核内受体-α (retinoid X receptor-alpha,RXR-α) 基因,Hedgehog、MAPK、磷脂酰肌醇 3-激蛋白激酶B,SHAP-HA蛋白,肿瘤坏死因子 (TNF)-α,基质金属蛋白酶组织抑制因子 (TIMP)-1,血小板衍生生长因子(PDGF),基质金属蛋白酶 (MMP)-1,pcDNA-gremlin,细胞凋亡相关因子Caspase-3,肿瘤坏死因子相关凋亡诱导配体(TRAIL),CC趋化因子配体2(CCL2),缺氧诱导因子,Th1/Th2极化,诱导型一氧化氮合酶 (iNOS)mRNA,col-Ⅰ基因,col-Ⅲ基因,肾素-血管紧张素Ⅱ (AngⅡ)1型受体(AT1R)mRNA,热休克蛋白 70(HSP70),血浆内毒素,ED2,受体型蛋白酪氨酸磷酸酶 (PTPRJ),过氧化氢酶(CAT),肝再生增强因子 (ALR),ERK1蛋白。

免疫组化指标:Bcl-2表达,Bax表达,肝组织细胞核增殖抗原 (pcna),蛋白酶活化受体 (PARs)1,PAR2,MMP-2,TIMP-2,纤溶酶原激活物抑制物 (PAI-1),骨桥蛋白(OPN),PLT,直接胆红素 (DBil)。

肝组织指标:羟脯氨酸 (Hyp),超氧化物歧化酶(SOD),谷胱甘肽 (GSH),单胺氧化酶 (MAO),丙二醛(MDA),IL-17。

基因:α1肾上腺素受体1A亚型基因 (ADRA1A),亚甲基四氢叶酸还原酶 (MTHFR)基因C677T,P22PHOX基因,(AT1R)基因A1166C,AT1R基因AC+CC基因型及C等位基因,醛固酮合成酶 (CYP11B2)基因T(-344)C,AT1R-810A/T,AT1受体基因mRNA,P2Y12基因TC/CC型,ACE基因DD基因型,内皮型一氧化氮合酶基因 (eNOS),一氧化氮合酶基因 G894T(Glu298Asp),血管紧张素Ⅱ2型受体(AGTR2)基因1675A/G,血管紧张素原基因M235T,血管壁Ⅰ型胶原蛋白和基因,SLC6A2基因启动子3(promoter3,rs168924),SLC6A2基因启动子 2(promoter2,rs2397771),血小板膜受体P2Y12基因G52T、-T744C多态性:TC/CC基因型,蛋白酪氨酸磷酸酶1B(PTP-1B)基因位点IVS6+G82A(G突变),过氧化物酶体增殖物激活受体 (PPARγ)C161T基因,心钠素 (ANP)基因T2238C多态性及其C型受体 (NPRC)基因A-55C,内皮素-2(endothelin-2,ET-2)基因A985G,血管紧张素原 (AGT)基因T174M,eNOS G894T基因型TT型纯合子。

其他指标:ⅳ型胶原 (ⅳ-c),α2巨球蛋白 (α2ma),γ谷氨酰转肽酶 (GGT),脂肪细胞刺激因子 (lsp),γ球蛋白,人单核细胞趋化蛋白-3(mcp-3),神经肽γ(NPγ),血管活性肠肽 (VIP),胰高血糖素 (Glu),生长抑素 (SS),儿茶酚胺 (CA),血管加压素 (AVP),脑啡肽,脑利尿钠肽或脑钠肽 (BNP),C型钠尿肽 (CNP),前列腺素 (PG),激肽酶,肾上腺髓质素 (ADM),醛固酮 (ALD),血浆肾素活性 (PRA),ET-1或 ET,NO,iNOS,前列环素 (PGI2),血管内皮生长因子 (VEGF),血管收缩因子 (EDCF),血管舒张因子 (EDRF),结缔组织生长因子 (CTGF),血栓素(TX)A2,TXB2,6-酮-前列腺素F1α (6-K-PGF1α),降钙素基因相关肽 (CGRP),ANP,降压肽类激素心钠素(ANF),P物质 (SP),血浆β-内啡肽 (β-EP),血浆硫化氢(H2S),男性卵泡刺激素 (FSH),黄体生成素 (LH)血小板-白细胞聚集PagT,高敏C反应蛋白或C应蛋白 (H-CRP或HsCRP 或 CRP),IL-6,IL-1, 尿 N-乙 酰-β-葡 萄 糖 苷 酶(NAG),肌酐 (Cr),尿酸 (UA),24小时尿蛋白 (24小时PRO),外周血淋巴细胞过氧化物酶体增殖物激活受体γ信使核糖核酸PPARγ(mRNA),酪氨酸羟化酶 (TH),c-fos,总胆固醇 (TCh),甘油三酯 (TG),低密度脂蛋白胆固醇(LDL-C),高密度脂蛋白胆固醇 (HDL-C),脂蛋白a(LP-a),低密度脂蛋白自身抗体 (Ab-OX-LDL),血友病因子(vWF),P选择素GMP-140,胰岛素抵抗 (IR),天冬氨酸(Asp),γ-氨基丁酸 (GABA),牛磺氨酸 (Tau)。

1.3 统计学方法 应用复杂网络节点度技术进行计算机自动分析[8~10]。

1.3.1 确定复杂的网络节点 根据生物指标词典,识别每一篇文献的生物指标,记为Ci= {v1,v2,v3……vi},其中Ci表示第i篇医学文献中生物指标集合,把生物指标作为网络节点。

1.3.2 确定复杂网络的边 根据节点同现关系,出现在同一篇文献中的生物指标 (节点)是相互关联,所有边记为E={e1,e2,e3……ei}。

1.3.3 构建复杂网络 根据所有文献中识别到的生物指标节点以及节点关联,构建生物指标的复杂网络,记为G=[V(G),E(G)]。

1.3.4 计算网络节点度 节点度为顶点关联的边的数目,记为de(vk)。

1.3.5 网络节点度排序 根据节点度的大小进行,从大往小排序,记为D={d1,d2,d3……dn}。最终获取度数靠前的生物指标。

2 结果

2.1 生物指标关联图 见插页图1。

2.2 关联度高的生物指标排序情况 见表1。

表1 频次居前15位的肝纤维化患者证候与生物指标的关联度

3 讨论

3.1 分析结果 通过复杂网络节点度技术,运用计算机自动分析,可以从海量文献数据中将200个与肝纤维化相关中医证候生物学指标范围快速、准确地缩小到15个关联度最高的核心指标,15个核心指标涉及类别主要是NEI网络,肝脏疾病,肝纤维化,肝脏炎症,是神经免疫内分泌整体与肝脏局部病变相结合的网络系统,这正与肝硬化中医证候肝藏血主疏泄,调畅情志、调储血量、濡养肝及筋目的整体观有一定的符合度。

3.2 数据挖掘技术评价 中医证候对现代生物文献的利用,常常受数据挖掘方法的限制,本课题采用一种可优选的技术方法,将200种以上的生物指标客观、科学、快速地缩小至15个指标,可以更为深入有效地利用现有文献数据库,从中归纳总结现阶段中医药研究的成果,从文献挖掘的角度探讨肝纤维化中医证候与生物指标的相关性,探寻反映不同证候肝纤维化的共性病理改变以及各个证候所特有的病理特征的核心指标,为今后进一步进行多中心大样本的证候与生物指标相关性的临床研究提供参考。

3.3 问题与展望 由于肝纤维化与肝硬化在生物领域的兼夹,对该方法挖掘出来的关键生物指标还是需要临床和基础专家进一步在实际工作中进行选取,通过实验不断验证应用。该研究成果也有可能拓展至其他病证结合领域的核心指标筛选过程,为中医证候与现代科学关系的研究搭起一条新的桥梁。

[1]刘成海,危北海.肝硬化中西医结合诊治共识[J].中国中西医结合消化杂志,2011,19(4):277-279.

[2]巫协宁.临床肝胆系病学 (新版) [M].上海:上海科学技术文献出版社,2002:440.

[3]黄耀煊.肝病分子生物学[M].福州:福建科学技术出版社,2003:437.

[4]王吉耀.现代肝病诊断与治疗 [M].上海:复旦大学出版社,2007:440.

[5]陈悦,龚作炯.肝脏疾病诊疗进展[M].武汉:湖北科学技术出版社,2008:392.

[6]李发旺.中西医结合诊治:肝炎、肝硬化与肝癌[M].兰州:兰州大学出版社,2008:320.

[7]萧树东.消化系疾病基础与临床进展[M].上海:上海科学技术文献出版社,2005:324.

[8]GIRVAN M,NEWMAN ME.Community structure in social and biological networks[J].Proc Natl Acad Sci USA,2002,99(12):7821-7826.

[9]汪小帆,李翔,陈关荣.复杂网络理论及其应用 [M].北京:清华大学出版社,2006:260.

[10]M.E.J.NEWMAN.The Structure and Function of Complex Networks[J].SIAM Rev,2003,3(10):167-256.

猜你喜欢
纤维化证候肝硬化
单核苷酸多态性与中医证候相关性研究进展
肝纤维化无创诊断研究进展
氧化槐定碱体内体外通过AKT/mTOR通路调控自噬抑制HBV诱发肝纤维化
中西医结合疗法对慢性乙型肝炎肝硬化的疗效分析
奥曲肽联合奥美拉唑治疗肝硬化合并上消化道出血的效果观察
基于Delphi法的高原红细胞增多症中医证候研究
上海地区2型糖尿病中医证候分布特征初探
芪红水煎液抗大鼠免疫肝纤维化的作用机制
大黄蛰虫丸对小鼠酒精性肝纤维化损伤的保护作用
胃镜下组织胶注射治疗肝硬化胃静脉曲张破裂出血的疗效评价