黄继康,刘斌
(暨南大学附属顺德医院 感染科,广东 佛山 528000)
肺结核是一种具有高度传染性的疾病,其病原菌为结核分枝杆菌。据WHO报道,2018年全球范围内约有1000万结核新增病例,超过120万人死于结核及其并发症[1]。早期诊断率低和传染性强是肺结核高死亡率的首要原因[2],因此肺结核的生物标志物和分子机制尚需开展进一步研究。miRNA是一类单链非编码RNA,长度约等于22个核苷酸,分子量较小。它能结合靶基因mRNA的3'非翻译区,其调节蛋白的表达水平的作用机制主要为降解mRNA或者抑制mRNA的翻译[3]。此外,miRNA在细胞生长发育的诸多过程,如凋亡、代谢、免疫中均发挥着不可或缺的作用[4]。近年来,不同的循环miRNA参与并调控肺结核的发生和发展过程这一观点已被多项研究证实,其中有望成为诊断肺结核的生物标志物的是has-miR-29a、has-miR-144和hsa-miR-768-3p等[5-7]。
本研究利用GEO公共数据库中肺结核患者外周血中miRNA表达谱芯片数据GSE34608[8],比较肺结核患者血液与健康者血液的miRNA并筛选出差异表达miRNA(differentially expressed miRNAs,DE-miRNAs),对其靶基因进行预测,并富集分析靶基因功能,利用Cytoscape软件构建蛋白相互作用(protein-protein interaction,PPI)网络,筛选Hub基因,并构建miRNA-Hub gene 网络,为肺结核筛选分子标志物及进一步研究其发病的分子机制提供理论依据。
通过对GEO数据库中肺结核miRNA表达谱数据进行筛选,选取GSE34608 miRNA表达谱芯片数据为研究对象。该芯片数据集包括8例肺结核患者外周血样本和8例正常人外周血样本。
应用R软件中的“Limma”包对GSE34608数据集进行分析,对比两组实验条件相同的样本,筛选出差异表达的miRNA,并对其进行聚类分析,并绘制热图,阈值为log2(fold change)的绝对值>2和伪发现率(false discovery rate,FDR)<0.05。
通过TargetScanHuman网站[9]分别预测上调幅度和下调幅度最显著的两个miRNA的靶基因。
应用FunRich软件对筛选所得的2个DE-miRNAs预测的靶基因数据进行功能注释和包括GO分析和KEGG通路分析在内的通路富集分析,P<0.05差异具有统计学意义。
分别构建PPI网络和miRNA-Hub gene网络。首先将所有靶基因输入到STRING网站[10],以评估靶基因之间的功能关联,选择评分大于0.9的交互作用进行下一步研究。利用Cytoscape软件分析PPI网络的连通性,获取Hub基因,建立miRNA-Hub gene网络。
使用上述诸多数据分析软件,对所得的各种数据信息进行统计学分析。
使用R软件分析GSE34608数据集,结果显示共筛查出253个DE-miRNAs,其中上调的201个,下调的52个,并绘制火山图和热图(图1),其中上调幅度最大的10个miRNA和下调幅度最大的10个miRNA均已列出(表1、表2)。根据fold change的值,has-miR-144上调幅度最大,而hsa-miR-768-3p下调幅度最大。通过TargetScanHuman网站预测出has-miR-144和hsa-miR-768-3p潜在的靶基因1450个。
图1 A为火山图,蓝色代表下调的miRNA,红色代表上调的miRNA,黑色为表达无差异的miRNA,B为差异基因表达的热图
将上述靶基因数据依次导入FUNRICH软件,对其生物学过程(BP)、细胞组成(CC)和分子功能(MF)共三类GO功能进行功能富集分析。如图2所示,hasmiR-144的靶基因主要参与核苷酸代谢,表观遗传,信号转导等生物学过程;细胞核、细胞质 是其主要参与的细胞组成;而调控转录因子的活性、核糖核酸的绑定则是其主要分子功能。图3展示了hsa-miR-768-3p靶基因主要参与调节细胞的生长周期,代谢等生物学过程;参与合成核仁,肌动蛋白骨架的细胞成分组成;参与的分子功能为结合DNA、RNA等。为进一步分析这些靶基因的富集途径,我们进行了KEGG通路富集分析。has-miR-144的靶基因富集到KEGG通路有雌激素受体相关通路,磷脂酰肌醇聚糖通路,内皮素通路等;hsa-miR-768-3p靶基因富集到KEGG通路有白介素6信号通路,TGF-β信号通路等,见图4。
表1 正常人外周血和肺结核患者外周血中差异表达miRNA上调前10位
表2 正常人外周血和肺结核患者外周血中差异表达miRNA下调前10位
图2 has-miR-144的靶基因富集分析图
图3 hsa-miR-768-3p的靶基因富集分析图
图4 has-miR-144(A)和hsa-miR-768-3p(B)的KEGG通路图
将has-miR-144和hsa-miR-768-3p的靶基因输入STRING网站,构建PPI网络。进一步应用Cytoscape软件分析靶基因之间的连通度,并筛选出前十名为Hub基因。has-miR-144的Hub基因为STAT6,MAPK1,TCEB1,FBXW11,FBXW7,H2AFV,CUL3,VHL,FBXL3,FBXO30,hsa-miR-768-3p的Hub基因为STAT6,TP53,HSP90AA1,VEGF,ESR1,RHOA,CDC42,IL2,TP53BP1,UBE2D1。STAT6在上述基因中节点度最高,表明STAT6可能是肺结核的关键靶点。随后,利用Cytoscape软件构建miRNA-Hub gene网络,如图5所示。这些数据支持has-miR-144和hsa-miR-768-3p可能是肺结核的两个潜在调控因子。
图5 has-miR-144和hsa-miR-768-3p及Hub基因的调控网络
随着生物科学技术的进步,越来越多的新技术被应用到了医学领域,尤其是在基因芯片和NGS测序技术。通过生物信息学方法分析肺结核相关的大数据,可以为结核病防治提供帮助。本研究通过GEO数据库下载的肺结核miRNA表达谱芯片数据集GSE34608,分析差异表达miRNAs,筛选出差异最大的2个与肺结核相关的miRNA,预测其靶基因,并对靶基因进行GO和KEGG富集分析。结果显示,hasmiR-144的靶基因主要参与核苷酸代谢,表观遗传,信号转导等生物学过程;细胞核、细胞质是其主要参与的细胞组成;调控转录因子的活性、核糖核酸的绑定等则是其主要的分子功能。hsa-miR-768-3p靶基因主要参与调节细胞的生长周期,代谢等;并参与组成核仁,肌动蛋白骨架等;其参与的分子功能主要为结合DNA、RNA等。为进一步分析这些靶基因的富集途径,我们进行了KEGG通路富集分析。has-miR-144的靶基因富集到KEGG通路有雌激素受体相关通路,磷脂酰肌醇聚糖通路,内皮素通路等;hsa-miR-768-3p靶基因富集到有白介素6信号通路,TGF-β信号通路等KEGG通路。由此推测得出,细胞的免疫机制、炎症反应、趋化因子、细胞自身的生长周期及凋亡等均与肺结核的发生发展密切相关。
差异表达最显著的miRNA分别是has-miR-144和hsa-miR-768-3p。研究表明has-miR-144在肺结核患者外周血中表达上调,起着保护机体的作用,其作用机制为转录后利用调控机制抑制如CXCL2,和IL-2等中性粒细胞趋化因子的表达,大量中性粒细胞趋化至肺组织过程受阻而避免继发的病理性损伤的产生[11-12]。但陈再旺等研究则认为肺结核患者中高表达量的has-miR-144抑制了机体产生TNF-α、INF-γ以及阻碍了T细胞进一步增殖,说明hasmiR-144抵抗结核感染过程中机体的免疫力是通过调节T细胞的增殖和细胞因子的产生而引起的[13]。M K研究证明hsa-miR-768-3p可以削弱机体的抗结核免疫,主要机制为抑制巨噬细胞内核因子kB的活性,降低促炎症因子的表达,以及抑制巨噬细胞凋亡等[14]。
在has-miR-144和hsa-miR-768-3p的靶基因中,本研究选择了10个重要的靶基因,这些基因在肺结核中起到了关键作用。其中STAT6分别受到上述两个miRNA的调控,STAT6作为Th2细胞分化过程中的特异性转录因子之一,除了可以促进Th2细胞增殖分化以外,其自身还可分泌细胞因子如IL-4,IL-10等[15]。实验发现,敲除特异性STAT6基因后,IL-4作为炎症因子,不能抑制γ-干扰素诱导的分枝杆菌自噬体形成,即IL-4等细胞因子不能发挥正常的生物学功能[16]。以上证据表明,在结核分枝杆菌感染免疫调节过程中,STAT6基因发挥重要作用。
本研究选取的数据集为单一研究所提交的,该研究包含了肺结核患者和健康对照人群,重点在于探讨外周血中miRNA和肺结核的相关性,并筛选、预测出特异性miRNA的主要靶基因,对靶基因进行生物信息学功能分析。该结果可能有助于理解肺结核发生发展中涉及的调控机制。同时这些靶基因也可能作为未来治疗肺结核的潜在靶点,为日后进一步的研究提供理论依据。