孙占东 刘嘉 曾庆琪
摘要:目的 从系统生物学角度挖掘基因与4种中医体质(湿热质、血瘀质、特禀質、痰湿质)的相关性,探究体质形成及体病相关的微观机理,为体质分类及体病相关理论提供生物学依据。方法 计算机检索中国知识资源总库(CNKI)、中国学术期刊数据库(万方数据)建库至2016年12月31日收录的中医体质与基因表达相关文献。收集4种中医体质的差异表达基因,分别采用DAVID数据库进行富集分析,包括基因组织富集分析、疾病分析、GO分析及通路分析。对DAVID数据库分析结果进行下载整理。结果 4种中医体质在基因层次上存在较大差异,每种体质显著富集的基因功能、活性、通路、相关疾病、表达位置等均有特异性。基因表达模式不同,导致体质对疾病易感性及倾向性的差异。结论 本研究提示中医体质形成的实质是基因表达模式的差异,病理变化由其改变所致。
关键词:中医体质;体病相关;基因;富集分析
DOI:10.3969/j.issn.1005-5304.2018.09.022
中图分类号:R2-05;R229 文献标识码:A 文章编号:1005-5304(2018)09-0091-05
Abstract: Objective To dig the correlation between genes and four TCM constitutions (phlegm-dampness, blood stasis, allergy, and dampness-heat); To analyze microscopic mechanism of constitution formed and constitution-disease correlation; To provide biological basis for TCM constitution classification and constitution-disease correlation theory. Methods Literature about TCM constitutions and gene expressions in CNKI and Wanfang Database were retrieved by computers from the establishment of database to 31, December 2016. Differentially expressed genes of four TCM constitutions were collected, and DAVID database was used for enrichment analysis, including gene tissue enrichment analysis, disease analysis, GO analysis, and pathway analysis. The results of DAVID database analysis were downloaded and analyzed. Results Four TCM constitutions had differences in gene level, and each constitution had the specificity in significantly enriched gene function, activity, pathways, related diseases, and expression locations. Different patterns of gene expression led to the constitution differences in disease susceptibility and tendency. Conclusion The essence of TCM constitution formation is the change of gene expression patterns, and the pathological changes are also caused by the change.
Keywords: TCM constitutions; constitution-disease correlation; gene; enrichment analysis
随着人类疾病谱的变化,其复杂性、多样性促使个体化医疗模式成为新浪潮。中医体质学说是以研究人类各个体质特征,以个体为对象,指导疾病的预防、治疗以及养生康复的中医基础理论,与个体化医疗模式密切相关。王琦[1]提出的体质九分法被普遍认可。体质形成的微观机制是中医体质学研究必须面临的科学问题[2]。体质的形成具备个体性的物质基础,每种体质都有其特定的基因表达模式,体质宏观的差异应源于微观基因表达的差异[3]。因此,从分子水平探究体质形成的生物学机理十分必要。
目前中医体质的基因组学研究表明,各种偏颇质在基因表达上普遍存在失调[4]。基因直接或间接决定了中医体质对某些病症种类的易罹性及倾向性,从而导致个体在病性、病位、病程、病变等方面的差异[5]。通过研究体质的基因表达基础,即体质与基因、基因与疾病的相关性,预测体质与疾病的相关性,可为中医体质学“体病相关”理论提供生物学依据。
基因功能富集分析又称为功能聚类分析,其原理为超几何分布,最终获得一组基因集在某个功能分类中的显著性条目,这些条目是与实验目的有显著关联的、靶向性的基因功能类别,即导致样本差异最重要的功能信息[6]。本研究整合4种体质(湿热质、血瘀质、特禀质、痰湿质)的基因表达数据,采用系统生物学方法,对各体质的差异表达基因进行富集分析。以期从分子水平阐述中医体质易感疾病的原因、性质、部位及其内在联系,为调体防病提供参考。
1 资料与方法
1.1 数据来源及筛选
计算机检索中國知识资源总库(CNKI)、中国学术期刊数据库(万方数据),以主题词“体质”“基因表达谱”进行模糊检索,检索范围均从建库至2016年12月31日。对结果逐一仔细阅读,同时满足下列标准予纳入:①实验样本符合9种体质分类及判定标准[1]。②以偏颇体质为实验样本,平和体质为对照样本,样本量不小于3。③取样于人体外周血液且应用芯片技术检测基因表达谱。④文献结果中明确报道偏颇质相对于平和质样本的差异表达基因。
1.2 数据提取
对文献中4种偏颇体质差异表达的基因进行提取收集,以基因列表(gene list)形式分别保存于独立的文本文件中,基因列表格式:gene1,gene2,gene3...。如某种体质差异表达基因结果在文献中以芯片ID形式报道,需对芯片ID进行转换,找出该芯片参考资料,将芯片ID转化为对应的正式基因符(official gene symbol),如ID(211300_s_at)→gene symbol(TP53)。最后对所获得的每种体质差异表达基因去冗处理。
1.3 数据分析
采用DAVID数据库(https://david.ncifcrf.gov/)对收集的4种体质差异表达基因进行富集分析。DAVID为生物信息整合数据库,知识库丰富且易操作,可对输入的基因集进行“一键式”系统综合的生物功能注释分析,目前被引用超过26 000次。将提取的基因列表文件输入数据库,在输出结果中可直接获得体质差异表达基因的组织、疾病、GO(gene ontology)、生物通路等富集信息,其输出结果可另存为文本格式。对下载结果进一步筛选,当P<0.05时,富集结果有统计学意义,被作为该种体质显著性的富集条目[7]。利用数据库集成的分析功能,可明确基因功能、特性、表达位置等信息。
组织富集分析。对于给定的体质差异表达基因集,组织富集分析可快速识别其在人体组织中显著表达的位置,用于分析细胞、组织、器官与体质症候表现的关系。
疾病富集分析。基于OMIM数据库收录的人类遗传疾病基因,将体质差异表达基因集作为输入数据,通过疾病富集分析可获得对应的疾病信息,为进一步体病相关研究提供依据。
GO富集分析。GO富集分析分为“molecular function”(分子功能)、“biological process”(生物过程)、“cellular component”(细胞组成)3部分,通过该项分析可找出在统计上显著富集的GO条目,寻找影响体质形成的基因功能。
生物通路富集分析。利用KEGG数据库,获取体质差异表达基因参与的生物通路,分析生物通路的功能与体质形成的相关性,探究体质形成的微观机制。
2 结果
2.1 中医体质差异表达基因数据
经检索,获得文献CNKI 107篇、万方数据195篇。阅读筛选后,进行4种体质差异基因数据提取、整理,获得4种中医体质差异表达基因集、文献及实验数据见表1。
2.2 4种中医体质差异表达基因组织富集分析
组织富集可对基因表达位置进行定位研究,分析细胞、组织、器官与体质症候表现的关系。4种中医体质差异表达基因在人体分布位置存在较大差异。特禀质差异表达基因富集范围较广,多分布于脾脏、外周血淋巴细胞、自然杀伤细胞、血小板等免疫及血液系统,及肝脏、卵巢、胰腺等脏器。湿热质差异表达基因分布于口腔、肝脏、骨髓、肺等部位,在白细胞、嗜中性粒细胞中也存在。痰湿质差异表达基因的分布多与生殖器官相关,如子宫、卵巢、胎盘,在上皮细胞与淋巴细胞中也有分布。血瘀质差异表达基因分布于骨髓、子宫、T细胞等。差异表达基因信息见图1。
2.3 4种中医体质差异表达基因疾病富集分析
特禀体质显著富集得到13种疾病,其中8种为免疫系统疾病,2种与白血病相关;湿热体质富集得到13种疾病(免疫系统疾病4种、肿瘤4种、口腔疾病2种及自然流产);痰湿质富集得到4种疾病(肿瘤2种、无精子症及自身免疫性疾病);血瘀质富集得到2种疾病(糖尿病1、2型)。1型糖尿病被特禀质、血瘀质共同富集,HIV感染被特禀质、湿热质共同富集。4种体质差异表达基因疾病富集分析结果见图2。
2.4 4种中医体质差异表达基因GO富集分析
差异表达基因GO富集分析在三个层次上得到显著富集的注释条目结果为:湿热质分子功能3条、生物过程21条、细胞组成12条;血瘀质分子功能7条、生物过程6条、细胞组成5条;特禀质分子功能7条、生物过程23条、细胞组成10条;痰湿质分子功能5条、生物过程10条、细胞组成11条。每种体质富集结果详细注释条目见图3。
不同体质差异表达基因在生物体内功能、活性及表达位置不同,可能导致体质差异。差异表达基因主要参与的生物过程方面,湿热质为防御真菌、细菌、病毒反应、免疫反应等,血瘀质为细胞增殖、内吞作用等,特禀质为免疫反应、信号转导、MAPK活性激活、炎症反应等,痰湿质为正向调节I-kappab激酶/NF-kappaB信号、自噬、IL-1细胞反应、IL-4负调控等。部分条目被多种体质共同富集,如蛋白质结合被特禀质、痰湿质、血瘀质共同富集,蛋白激酶结合被特禀质及血瘀质共同富集,poly(A) RNA结合被痰湿质、血瘀质共同富集,表明多种体质差异表达基因均参与重要的生物反应过程,各体质在组学层面存在内部联系,提示兼具多种体质或体质间转化的可能。
2.5 4种中医体质差异表达基因生物通路富集分析
分析差异表达基因参与的生物通路,特禀质富集得到7条生物通路,其中4条(系统性红斑狼疮、抗原处理和表达、T细胞受体信号通路、肿瘤坏死因子信号通路)属免疫系统,提示特禀质免疫系统较平和质增强。湿热质富集得到4条通路,其中2条属免疫疾病通路、2条与细胞吞噬相关,也展示出免疫活性上调。痰湿质富集得到4条通路,其中2条属传染性疾病通路,提示出炎症反应的亢进,1条与鞘脂代谢相关,提示与脂类代谢疾病相关,1条为破骨细胞分化通路。血瘀质富集得到3条通路,1条通路与肿瘤的胆碱代谢相关,1条通路属磷脂酰肌醇信号通路,与钙离子转运相关,1条与信号转导与细胞能动性有关。各体质差异表达基因富集得到的条目不同,但在免疫反应、炎症反应、代谢等方面均表现出较平和质增强的趋势,所得结果可能为富集生物通路与体质特征的相关性及体质形成的微观机制,通路信息见图4。
3 讨论
中医体质学研究各体质类型的生理、病理特点,分析疾病的反应状态、病变性质和发展趋向,从而指导预防和治疗。然而,中医体质形成的微观机制尚不明确。本研究挖掘4种体质具有的特异性遗传物质基础,揭示不同体质间的微观基因表达差异。
特禀质多与先天禀赋有关,也与后天失养相关,此类人群对外界环境适应能力较差。本研究结果表明,特禀质差异表达基因分布于免疫及血液系统,与免疫系统疾病高度相关,多参与免疫反应、信号转导、MAPK活性激活、炎症反应等,与系统性红斑狼疮、抗原处理和表达、T细胞受体信号通路、肿瘤坏死因子信号等免疫系统通路相关。提示特禀质与免疫系统和先天遗传疾病关系密切,符合中医理论。
湿热质因先天不足,久居湿地;或喜食肥甘,长期饮酒,湿热内蕴。此类人群周身乏力、面部痤疮、口干口苦、便秘、尿短赤等。本研究结果表明,湿热质差异表达基因分布于口腔、肝、肺等易“上火”部位,与肿瘤、免疫系统疾病及口腔病,防御真菌、细菌、病毒反应,免疫反应等密切相关。热邪病位多变,其性上炎;湿邪重浊黏滞,其性趋下,故湿热质易罹患疾病复杂多样,但主要涉及感染性疾病。
“肥人多痰湿”,痰湿质常表现为嗜睡,喜食辛辣、肥甘厚腻,周身乏力、倦怠、身体沉重、大便黏腻等。本研究结果表明,痰湿质差异表达基因分布多与生殖器官,肿瘤、无精子症等,正向调节I-kappab激酶/NF-kappaB信号、自噬、IL-1细胞反应、IL-4负调控等,脂类代谢疾病通路及炎症通路有关。提示痰湿质多与肥胖相关,符合中医理论。
血瘀质常因情志、饮食、劳逸等内伤致血行不畅,或因外邪、内伤、气虚、邪热迫血妄行,表现为面色青黯、疼痛、拒按、舌質紫黯等。本研究结果表明,血瘀质和肿瘤发病相关,与血瘀质常致癥瘕积块的中医理论相符;血瘀质出现磷脂酰肌醇信号通路变化,涉及钙离子转运,提示与心脑血管疾病相关。疾病富集提示血瘀质与糖尿病存在高度的体病相关性。
综上,不同体质的基因表达模式存在差异,易患疾病与体质存在高度相关性。各体质在基因层次有一定联系,提示兼夹体质存在基因组学基础。但本研究仅收集了差异表达基因,未对体质间相关性深入分析,后续可结合个体体质特征及基因表达模式进一步研究。中医体质以整体观为基础,系统生物学也以整体观研究生命本质。采用系统生物学方法,可对多种体质在蛋白质组学、代谢组学方面开展研究,体内的生命物质如酶、细胞因子、代谢产物等,对体质形成同样发挥着重要作用,可进一步印证体质差异的客观基础。
参考文献:
[1] 王琦.中医体质学[M].北京:人民卫生出版社,2008.
[2] 王琦.论中医体质研究的3个关键问题[J].中医杂志,2006,47(4):250-252.
[3] 孙艳.论基因与体质的相关性[J].长春中医药大学学报,2009,25(1):3-4.
[4] 王济,李英帅,李玲孺,等.9种中医体质类型的基因组学研究[J].中华中医药杂志,2014,29(12):3871-3873.
[5] 童福易,赖仁胜,薛博瑜.试论中医体质与疾病的发生[J].现代中西医结合杂志,2012,21(10):1128-1130.
[6] 刘明,王米渠,丁维俊,等.表达谱芯片数据的基因功能富集分析[J]. 生物医学工程学杂志,2010,27(5):1166-1168,1196.
[7] HUANG D W, SHERMAN B T, LEMPICKI R A. Systematic and integrative analysis of large gene lists using DAVID Bioinformatics Resources[J]. Nature Protoc,2009,4(1):44-57.
[8] 周珊珊.湿热体质人群差异表达基因的筛选及其功能初探[D].广州:广州中医药大学,2016.
[9] 田栓磊.血瘀体质理论及其外周血基因表达谱的研究[D].北京:北京中医药大学,2009.
[10] 王睿林.过敏体质理论及其外周血基因表达谱研究[D].北京:北京中医药大学,2009.
[11] 高京宏.痰湿体质机制及基因表达谱研究[D].北京:北京中医药大学,2005.
(收稿日期:2017-06-26)
(修回日期:2017-07-27;编辑:向宇雁)