丁丽丽, 刘轩绮, 孙晓林, 高雅静, 武志慧, 王永福
(包头医学院第一附属医院, 1. 风湿免疫科, 2. 中心实验室/内蒙古自治区自体免疫学重点实验室, 内蒙古 包头, 014010)
转化生长因子-β(TGF-β)是转化生长因子超家族中的一员,在调节细胞分化、增殖、迁移、免疫反应和细胞外基质(ECM)沉积中发挥至关重要的作用[1]。TGF-β通常以前体的形式合成,需要进一步激活以触发其下游的经典或非经典途径[2-3]。研究[4-6]表明, TGF-β可通过激活经典的Smads通路来促进纤维化相关分子转录,包括α-平滑肌肌动蛋白(α-SMA)、Ⅰ型胶原和基质金属蛋白酶组织抑制剂(TIMP), 其可诱导成纤维细胞活化和ECM沉积,导致组织器官纤维化。TGF-β介导的非经典的Smads信号通路也可以上调促纤维化因子的表达,导致ECM过度产生,参与到纤维化过程中[7]。系统性硬化症(SSc)是一种局限性或弥漫性皮肤及内脏结缔组织纤维化、硬化及萎缩的结缔组织疾病,该病较罕见,女性多见。30%的SSc患者可并发间质性肺病(ILD)。ILD是SSc患者最常见的死亡原因, 10年病死率高达40%[8-11]。SSc的发病机制较为复杂,其中TGF-β及相关细胞因子启动的细胞信号转导可促进SSc纤维化的形成[12]。TGF-β通路可直接作用于成纤维细胞,促进2型先天淋巴样细胞向促纤维化表型转化,导致白细胞介素-10 (IL-10)产生减少,胶原合成增加,促进SSc纤维化[13]。
TGF-β生成增加不仅能诱导成纤维细胞向肌成纤维细胞分化,还可导致细胞内钙调节失调,上调纤维化标志物α-SMA、纤维连接蛋白和波形蛋白的表达,加重SSc肺纤维化[14]。特发性肺纤维化(IPF)是一种病因不明的慢性、进行性、纤维化性间质性肺病,诊断IPF后,患者的中位生存期为2~4年[15]。目前研究[16]认为肺纤维化是肺泡上皮反复微损伤的结果。肺泡上皮细胞在修复过程中,释放过多的TGF-β等促纤维化因子[17]。促纤维化介质激活并促进驻留的成纤维细胞分化为肌成纤维细胞,产生过量的ECM[18]。成纤维细胞/肌成纤维细胞的聚集和ECM的沉积,破坏了正常的肺结构,阻碍了气体交换,进而加重IPF[19]。虽然上述两种疾病的具体发病机制尚不清楚,但TGF-β信号的异常均可诱发或促进系统性硬化症间质性肺病(SSc-ILD)和IPF发展。本研究分析SSc-ILD、IPF、TGF-β诱导的肺纤维化模型重叠基因的相关性,探讨TGF-β介导的信号通路是否可以作为SSc-ILD和IPF共同的致病途径,现报告如下。
本研究利用Gene Expression Omnibus (GEO)数据库 (https://www.ncbi.nlm.nih.gov/geo/)[20]获取GSE76808、GSE135099基因芯片数据,研究类型均为Expression profiling by array, 2个数据源分别在GPL570和GPL13534平台上检测。
1.2.1 数据处理: 通过R软件“tidyverse”包将GSE76808、GSE135099原始数据中的“ID-REF”转换为“Gene Symbol”。使用R软件的“limma”包筛选出差异性表达的基因,筛选标准为adj.Pvalue<0.05和|logFC|>1。利用R软件将差异基因进行处理并绘制火山图。
1.2.2 获取重叠基因: 对差异基因交互制作韦恩图,利用R软件对重叠基因进行基因本体(GO)功能注释、京都基因与基因组百科全书(KEGG)通路富集及可视化。
1.2.3 构建蛋白质互作(PPI)网络并筛选分析hub基因: 从String数据库[21]搜索重叠基因间的相互作用关系,将PPI关系导入Cytoscape构建PPI网络,根据Degree值将重叠基因排序,利用“GO”插件筛选出hub基因。通过在线网站TISIDB(http://cis.hku.hk/TISIDB/)[22]对hub基因功能和通路富集进行分析。
本研究对GEO数据库收录的GSE76808、GSE135099数据进行差异分析发现,与健康对照组(NC组)相比, SSc-ILD中有279个基因表达上调,362个基因表达下调; 与NC组相比, IPF中存在820个高表达的基因, 1 350个低表达的基因; 与NC组相比, TGF-β诱导的肺纤维化模型中存在1 562个上调的基因, 2 416个下调的基因。见图1。
A: 与NC组相比, SSc-ILD中差异性表达的基因; B: 与NC组相比, IPF中差异性表达的基因; C: 与NC组相比, TGF-β诱导的肺纤维化模型中差异性表达的基因。图1 SSc-ILD、IPF、TGF-β诱导的肺纤维化模型中差异性表达的基因
将上述筛选出的SSc-ILD中279个高表达基因与TGF-β诱导的肺纤维化模型中1 562个高表达基因进行交互分析,得到41个上调的重叠基因; SSc-ILD中362个低表达基因与TGF-β诱导的肺纤维化模型中的2 416个低表达基因交互结果显示,有67个下调的重叠基因。对上述重叠基因进行GO分析发现,重叠的上调基因可能参与了早期内体的形成; 重叠的下调基因可能在白细胞介素-17(IL-17)信号通路、非酒精性脂肪肝病等方面具有重要的调节功能。见图2。
A、B: 分别为SSc-ILD与TGF-β诱导的肺纤维化模型中高表达、低表达基因的重叠基因韦恩图; C、D: 分别为SSc-ILD与TGF-β诱导的肺纤维化模型中高表达、低表达的重叠基因GO分析结果。图2 SSc-ILD差异性表达的基因与TGF-β诱导的肺纤维化模型差异性表达的基因中的重叠基因
对筛选出的IPF中820个上调的基因与TGF-β诱导的肺纤维化模型中的1 562个上调基因进行交互,获得391个高表达的重叠基因; IPF中下调的1 350个基因与TGF-β诱导的肺纤维化模型中的2 416个下调基因进行交互,获得957个低表达的重叠基因。对上述重叠基因进行GO分析发现,重叠的上调基因主要富集在中性粒细胞激活、中性粒细胞脱颗粒、蛋白翻译后修饰、蛋白在内质网内的加工与运输等方面; 重叠的下调基因可能在氧化磷酸化、ATP酶活性等方面发挥关键的调节作用。见图3。
A、B: 分别为IPF与TGF-β诱导的肺纤维化模型差异表达基因中的重叠基因韦恩图; C、D: 分别为IPF与TGF-β诱导的肺纤维化模型中上调和下调的重叠基因GO分析结果。图3 IPF差异性表达的基因与TGF-β诱导的肺纤维化模型差异性表达的基因中的重叠基因
分别将SSc-ILD&TGF-β重叠基因与IPF&TGF-β重叠基因进行交互,发现在上调基因中存在12个重叠基因,在下调基因中存在34个重叠基因。见图4。
A: SSc-ILD、IPF、TGF-β诱导的肺纤维化模型之间共同上调基因的韦恩图; B: SSc-ILD、IPF、TGF-β诱导的肺纤维化模型之间共同下调基因的韦恩图。图4 SSc-ILD、IPF、TGF-β诱导的肺纤维化模型之间的重叠基因韦恩图
对SSc-ILD、IPF、TGF-β诱导的肺纤维化模型之间的重叠基因进行PPI网络分析发现,上调12个基因在蛋白水平没有出现相互作用,下调的34个基因中存在PPI并得到hub基因ELAVL1。见图5、表1。
图5 重叠基因PPI分析结果
表1 PPI网络分析中前21个基因
GO分析结果显示,ELAVL1基因参与RNA剪接、加工、翻译等多种转录后修饰过程见表2、表3; KEGG分析结果显示,ELAVL1基因仅在腺苷酸活化蛋白激酶(AMPK)信号通路中存在富集。
表2 GO分析ELAVL1基因
表3 GO分析ELAVL1基因
肺纤维化是多种间质性肺病的终末期,会引起不可逆性肺损伤,其特征是正常肺泡结构被破坏, ECM过度沉积导致患者肺部气体交换受阻,呼吸功能不全,甚至死亡。SSc-ILD和IPF患者在人口学特征和致病因素上有所不同,但这两种疾病均可导致肺实质纤维化,最终进展为呼吸衰竭,其中持续存在的异常TGF-β信号在肺纤维化中起着关键作用[23]。SSc-ILD中,先天免疫系统和获得性免疫系统的过度激活可导致血管内皮细胞和肺泡上皮细胞损伤。同时, TGF-β信号的异常激活可诱导内皮细胞和上皮细胞间充质转化,以及成纤维细胞向肌成纤维细胞的转化,导致ECM过度积聚,促进SSc-ILD[24]。IPF的形成起源于肺泡上皮的慢性损伤和(或)老化,导致异常的伤口愈合反应以及持续产生促炎和促纤维化因子,这最终导致血管周围和间质内间充质细胞的活化和分化。TGF-β信号升高是IPF的重要标志,其可促进成纤维细胞向肌成纤维细胞转化,上调胶原蛋白相关基因的表达,导致ECM产生增多[25]。
家族性肺纤维化的存在和罕见的遗传性疾病中肺纤维化的发生促使研究人员关注到宿主遗传背景在影响SSC-ILD和IPF患者病程和病情发展中的重要作用[26]。2019年由10 000名欧洲患者组成的全基因组关联研究(GWAS)确定了23个与SSc相关的独立基因座,使得已知的SSc风险基因座总数增加到28个,并且这些SSc风险位点相关的大多数基因产物与炎症和自身免疫有关[27]。此外,与普通人群相比, SSc患者和家庭聚集性强的患者的一级亲属罹患SSc的风险更高,估计风险约为1.6%, 表明SSc具有基因遗传倾向[28]。在IPF中,端粒相关基因(TERT、TERC、PARN、RTEL1、DKC1、TINF2)、表面活性物质编码基因(SFTPC、SFTPA1、SFTPA2)的罕见变异和20个独立基因座的单核苷酸多态性(SNPs)在散发性IPF疾病风险中增高,占25%~30%, 并且在IPF的发病机制中,与这些位点相关的基因在对端粒完整性、细胞黏附、纤维化和宿主防御途径方面扮演着重要的角色[29-30]。基于TGF-β在纤维化过程、SSc-ILD和IPF中的作用,以及SSC-ILD和IPF发生的基因遗传背景,本研究利用GEO数据库获取SSc-ILD、TGF-β和IPF相关基因数据,通过生物信息学技术对上述数据分析发现, SSc-ILD、IPF分别与TGF-β诱导的纤维化模型存在相同的基因。SSc-ILD与TGF-β诱导的纤维化模型共同上调的基因参与早期内体的形成,而共同下调的基因在调节IL-17信号通路中发挥重要作用。IPF与TGF-β诱导的纤维化模型共同的上调基因参与了中性粒细胞激活、中性粒细胞脱颗粒、蛋白翻译后修饰、加工与运输等的调节; 共同的下调基因可能在氧化磷酸化、ATP酶活性等过程中发挥关键作用。TGF-β信号可能通过调控基因的上述功能分别参与SSC-ILD和IPF的发病过程。
本研究将SSc-ILD&TGF-β重叠基因与IPF&TGF-β重叠基因进行交互,发现存在12个重叠高表达基因; 在下调基因中存在34个重叠基因。上述重叠基因的PPI分析发现,在重叠的12个高表达基因中不存在蛋白互作,但在34个低表达基因中存在蛋白互作,并获得hub基因ELAVL1。ELAVL1基因可以编码胚胎致死性异常视觉(ELAV)家族中的人抗原R(HuR), 即ELAVL1蛋白,其是一种RNA结合蛋白(RBP)。HuR广泛表达于多种组织中,通过转录后机制参与调控细胞内多种分子的表达[31]。在静息细胞中, HuR主要定位于细胞核,当受到紫外线辐射、营养耗竭或免疫激活等应激条件的刺激时, HuR结合并将靶mRNA运送到细胞质,起到调节靶mRNA的稳定性和(或)翻译的作用[32]。研究[33]发现, HuR能够调节促炎细胞因子(肿瘤坏死因子-α、白细胞介素-6、转化生长因子-β和干扰素-γ)、促炎介质INOS和趋化因子MCP-1mRNA的表达,这些因素大多参与了肝纤维化的发病过程。TGF-β通过影响HuR对mRNA稳定性和翻译率的调节在肝纤维化发展中的基因表达调控方面起着重要作用。本研究GO功能分析同样发现,ELAVL1基因参与调节RNA剪接、加工、翻译等多种转录后修饰; 同时,ELAVL1能够与双链DNA、mRNA结合,发挥至关重要的分子功能,表明ELAVL1基因可能通过编码ELAVL1蛋白(HuR)参与SSC-ILD和IPF多种纤维化分子mRNA转录后调控。
在IPF中,人肺成纤维细胞经TGF-β处理后, HuR由胞核向胞浆转位明显增加。在肺纤维化小鼠模型中,肺组织细胞的胞浆HuR显著高于对照组。HuR可能通过促进肌成纤维细胞的分化以及增加易感个体ECM的产生参与肺纤维化[34]。本研究TGF-β诱导的纤维化模型、IPF和SSc-ILD中均出现差异性表达的ELAVL1基因,表明TGF-β可能通过诱导IPF与SSc-ILD肺成纤维细胞中的HuR从胞核向胞浆移动,调节纤维化相关因子mRNA的表达,导致ECM产生异常,参与两种疾病的发展。AMPK是多条代谢途径的中枢调节因子,作为TGF-β/Smads通路的上游信号分子,对成纤维细胞的增殖、分化和ECM的产生的调节是必不可少的[35]。血管紧张素Ⅱ可诱导心肌纤维化并伴有TGF-β过度表达、Smad2/3高磷酸化和Smad4表达上调。黄芩苷可通过激活AMPK, 抑制TGF-β/Smads通路,从而抑制成纤维细胞增殖和ECM积聚,缓解心肌纤维化[36]。本研究KEGG通路分析发现,ELAVL1基因富集在AMPK信号通路中。一项探究HuR是否参与气道平滑肌增殖的研究[37]指出, HuR是唯一一个在真核细胞中普遍表达的蛋白; HuR的表达或活性可能受到多种上游刺激的影响,如炎症介质、生长因子、活性氧蔟(ROS)和缺氧。另外,激活AMPK可有效抑制血小板衍生生长因子(PDGF)诱导的HuR胞浆易位,揭示了ELAVL1蛋白与AMPK信号通路之间的潜在联系。因此,作者推测在SSc-ILD和IPF中, AMPK信号异常可能导致TGF-β产生增多,过度产生的TGF-β可能通过诱导HuR由胞核向胞浆转位,进而参与肺纤维化的调节。但确切的调节机制尚不清楚,需要进一步开展大样本的研究,对本研究中的关键结论进行验证,为阐明SSc-ILD和IPF共同的发病机制提供科学依据。