刘 通,杨 丽,陈 赢,唐 静,林 源,马国荣,杨延辉
(宁夏医科大学基础医学院,银川 750004)
结核病(tuberculosis,TB)是一种慢性传染性疾病,亦是全球十大死亡原因之一。它的病原体是结核分枝杆菌(mycobacterium tuberculosis,MTB)。2019年世界卫生组织发布的TB报告显示,全球约25%的人口曾感染过MTB,每年约有1000万人患TB,约145万人死亡[1]。如果诊断及时,用一线抗结核药物经过6个月的治疗,大多数肺结核患者可以治愈,但耐药TB仍然是严重的公共卫生问题。2017年新发TB患者对利福平(rifampin,RIF)耐药人数达55.8万,其中82%发展为耐多药结核病(MDR-TB)[2-4]。传统认为RIF的耐药基因主要为rpoB、rpoC、rpoA及rpoZ,但耐药形成的分子机制报道较少[5-9]。本文用Illumina HiseqTM3000高通量测序平台对1/2最小抑菌浓度(minimal inhibitory concentration,MIC)的RIF处理前后MS MC2155的总RNA进行测序,通过比对筛选获得差异表达基因(difference expressed gene,DEG),并对DEG的功能进行聚类富集分析发现,使用RIF后能调控分枝杆菌万古霉素耐药、氧化磷酸化和共生体调节的关键基因,为进一步探讨RIF耐药机制的形成过程及寻找潜在的新型抗耐药MTB的靶标奠定了基础。
MS MC2155由中国医学科学院医药生物技术研究所肖春玲研究员惠赠。7H9、7H10培养基、OADC(美国BD公司);RIF、刃天青(北京博奥拓达科技有限公司)。
37℃培养箱(上海琅玕实验设备有限公司,HF240);酶标仪(Thermo Scientific-Multiskan GO);紫外分光光度计(上海光明电子仪器厂,721型);台式高速冷冻离心(德国Eppendorf公司,5424 R);生物安全柜(Heal Forec力康生物技术有限公司,900B2);高压灭菌锅(Tomy Digital Biology公司,SX-500);核酸电泳仪和紫外切胶仪(北京六一仪器厂,WD-9403F);恒温摇床(上海旻泉仪器有限公司,LPL-24);核酸凝胶成像仪(美国Bio-Rad公司,Gel DocTMXR+)。
MS MC2155菌株于7H10培养基中划线涂板,37℃温箱培养72 h,挑取单克隆接种于5 mL 7H9培养基中,在37℃、200 r·min-1的摇床中,培养至对数生长期。用分光光度计测得OD600=0.68。将MS MC2155菌液按1∶1000的比例稀释于7H9培养基中。取两个96孔板,在其最外一周各孔加入100μL的7H9培养基,在两个96孔板的B2、F2孔各加2.56μL的RIF(浓度10 mg·mL-1)和187.44μL稀释后的菌液,并吹打混匀,其余各孔均加入90μL稀释后的菌液,取B2混合液100μL于B3孔吹打混匀,再取B3混合液100μL于B4孔吹打混匀,依此类推,B11中弃去100μL;F行方法同B行。加样完成后将96孔板放入37℃恒温箱孵育24 h后取出,在每孔中均加入10μL 10%的刃天青,再次放入37℃恒温箱孵育6 h,取出观察、拍照并用酶标仪测定。
挑取MS MC2155单克隆接种于5 mL 7H9培养基中,37℃,200 r·min-1振荡培养72 h。取上述0.2 mL菌液分别接种于4瓶200 mL的7H9培养基中,在其中3瓶中各加入80μL浓度10 mg·mL-1的RIF储存溶液,并用相同体积的DMSO溶液设立空白对照组,依照上述方法平行实验3次,于37℃,200 r·min-1摇床中振荡培养72 h。5000×g离心10 min,收集菌泥冻存于-80℃环境。
用Trizol(TaKaRa,T9108)试剂提取细菌的总RNA,并用DNaseI(TaKaRa,D2215)去除样品中的DNA。分别用1%的琼脂糖凝胶电泳和Nano Drop(Agilent Technologies,美国)检测RNA质量和完整性,使用QubitR 2.0 Flurometer(Life Technologies,美国)测定总RNA浓度。
将得到的总RNA进行反转录一链的合成,随后进行反转录二链的合成和末端修复。在末端修复产物cDNA的3'末端加碱基A,加测序接头。链接产物经胶回收后进行PCR反应及产物回收。文库构建完成后,分别使用QubitR2.0和Agilent 2100对文库的浓度和插入片段大小进行检测,使用q-PCR法对文库的有效浓度进行准确定量,以保证文库质量。建好的文库采用Illumina 3000测序平台,2×151测序模式进行测序。
利用FPKM(Fragments Per Kilobase per Million reads)方法计算基因的表达量,利用DESeq2软件针对有重复样本的不同样本组之间筛选差异表达基因,利用DESeq 2软件针对无重复样本的不同样本组之间筛选差异表达的已知基因,以|log2FC|≥1和P≤0.05为阈值,筛选两组之间的差异基因。
把所有得到的差异表达基因和背景基因映射到GO数据库(http://www.geneontology.org),计算每个条目的基因数目,采用超几何检验方法得到P值,并将差异基因进行GO注释,找出与整个基因组背景相比,在差异表达基因中显著富集的GO条目。以P≤0.05为阈值,满足此条件的GO term定义为在差异表达基因中显著富集的GO term。通过GO功能显著性富集分析确定差异表达基因行使的主要生物学、细胞、分子功能。并将差异表达基因序列在KEGG数据库(Kyoto Encyclopedia of Genes and Genomes)中进行注释,同样的方法得到P值。以P≤0.05为阈值,通过pathway分析确定差异表达基因的显著性富集通路。
利用在线数据库STRING(http://string-db.org)筛选存在蛋白互作网络(Protein-Protein Interaction,PPI)的DEGs。利用Cytoscape软件(http://www.cytoscape.org/)构建蛋白质互作关系网络,并进一步分析候选DEGs编码蛋白在MS MC2155中的相互作用关系。
使用刃天青法经过3次生物学重复,测得RIF对MS MC2155菌株的MIC值为8μg·mL-1。分别使用4、6μg·mL-1的RIF培养MS MC2155菌株,发现6μg·mL-1的RIF导致细菌生长速度极慢,样品量不足,最终确定RNA-seq的药物处理浓度为4μg·mL-1。
图1显示出三条清晰的条带、无杂带、无拖尾或弥散现象,说明RNA样本其大小和条数有物种特异性,无降解情况,不含其他杂质,OD260/OD280=2.13,满足测序要求。
图1 1%琼脂糖凝胶电泳图
表1是MS MC2155与RIF处理后MC2155的原始序列和预处理序列的统计结果和Reads的参考基因组比对分析统计结果;CGC1~3是指MS MC2155样品名称,CGL1~3是指RIF处理后MS MC2155样品名称。利用FastQC软件对预处理数据进行质量控制分析,结果显示测序样品Q20的质量值为97.79%~98.85%,满足进行后续数据分析的标准。
表1 样品质量检测(%)
对RIF处理后的MC2155与野生型差异表达结果分析如图2所示,A为差异基因火山图,B为差异基因散点图。共832个基因的表达水平差异有统计学意义(P≤0.05,|log2FC|≥1),其中457个上调,375个下调。差异倍数在10倍以上的基因有76个,其中41个下调,35个上调。差异基因主要集中在万古霉素耐药、氧化磷酸化及氮代谢等通路中,其中万古霉素耐药差异表达基因有190个,氧化磷酸化差异表达基因有23个,氮代谢差异表达基因有9个。表2为差异倍数在10倍以上的部分DEGs,其中nrdB、mysB、ruvC、proW、sigM和cspA属万古霉素耐药通路相关基因;nuoF和nuoB属氧化磷酸化通路相关基因。
图2 RIF处理MC2155后的差异表达基因分析
对RIF处理后的耻垢分枝杆菌差异表达基因进行GO富集分析(图3)。在GO数据库中,表达基因根据功能分为生物学过程(biological process),细胞组分(cellular component)和分子功能(molecular function)三大类,其中氧化还原酶活性、呼吸链复合物等分子功能以及外来生物刺激、共生体调节等生物学过程是差异表达基因最多的路径。对RIF处理后的耻垢分枝杆菌差异表达基因进行KEGG富集分析(图4)。结果表明,差异表达基因主要集中在万古霉素耐药(vancomycin resistance)、氧化磷酸化(oxidative phosphorylation)通路。
表2 利福平处理后的主要差异基因
图3 RIF处理MS MC2155后的差异表达基因GO富集柱状图
图4 KEGG差异表达基因富集
STRING分析结果显示,共有371个差异基因编码的蛋白质存在相互作用,图5A为其中50个中心节点基因。图5B为差异倍数在10倍以上且存在互作关系的典型基因,其中MS0559为cspA。这些基因的异常表达可能在利福平调控中具有重要作用。
图5 显著差异基因所表达蛋白的互作分析
STRING检索发现显著差异基因sigM、mysB和rplM确与rpoB存在密切关联(图6A),但RIF处理后分枝杆菌nrdB基因表达量降低超过16倍,gmk和guaB等核苷酸代谢相关基因表达同样显著降低,这说明RIF可能通过降低nrdB的表达来抑制核苷酸转化为脱氧核糖核苷酸,减少DNA合成所需原料,从而直接阻断分枝杆菌DNA及蛋白的合成。且STRING检索表明nrdB、gmk和guaB存在明显互作关系(图6B)。提示nrdB可能是一个全新的RIF治疗及耐药关键靶点。
TB治疗的难题在于日益严重的TB耐药性,然而常用一线抗结核药物RIF的耐药基因是如何形成的尚不明了[10-11]。在分枝杆菌的作用机制研究中,MS与MTB的基因同源性高,生长速度快,生物安全要求低,在新型药物开发和耐药机制研究方面是MTB研究的理想模式菌之一[12-13]。RIF是首选的一线抗结核药物,临床中常采取联合用药的方式加强疗效,也同时避免单用易产生耐药性的问题[3,14-15]。转录组测序(RNA-seq)指利用高通量测序技术,在转录组水平上进行深度测序的一项技术。它能从整体水平上更加全面地揭示药物干预后细菌为适应环境所发生的基因转录水平的变化,有利于筛选发现RIF干预MS后所调控的基因[16-18]。
图6 RpoB和nrdB相关蛋白网络关系
有研究结果显示,RIF耐药的分子机制涉及多个生物合成网络和途径中的多个基因[19-20]。RIF的作用机制目前认为是RIF与依赖DNA的RNA多聚酶的β亚单位牢固结合,阻断RNA转录过程,使DNA和蛋白的合成停止;RIF还可以通过抑制酪氨酸酶活性来抑制细菌的生长[21-23]。RpoB是一种DNA依赖的RNA聚合酶,nrdB是一种核糖核苷二磷酸还原酶。RIF通过与rpoB结合,干扰DNA转录和RNA延伸,从而抑制分枝杆菌生长;而RIF耐药也与rpoB结合位点突变密切相关[21-23]。目前认为rpoB基因突变是RIF耐药的主要原因,其中最常见的突变密码子是531、526和516[22]。但在耐药基因的发生和发展方面尚无更全面的整体性研究。
本研究首次使用RIF在模式菌MS MC2155构建了细菌的RNA-seq cDNA文库,经全转录组分析发现了cspA、sigM、nrdB、nuoF、nuoB和mysB等表达水平差异较大的基因,与已知的耐药基因rpoB、rpoC、rpoA及rpoZ等完全不同。通过同MS MC2155的参考基因预测发现RIF有类似于万古霉素的作用机制。研究表明,本文筛选得到的nrdB可与nrdA共同催化核糖核苷酸还原成相应的脱氧核糖核苷酸,该基因的低表达可直接影响细菌DNA的合成[24];nuoF和nuoB同属醌氧化还原酶亚基,均为NDH-1的外围臂组成部分,在NDH-1的结构稳定性中起关键作用,该基因的低表达可直接影响NADH脱氢酶片段的组装,引起分枝杆菌的能量传递紊乱[25-27];sigM属于RNA聚合酶因子,能调节Esx分泌的蛋白质和非核糖体肽合成酶基因,并向下调节与毒力相关的表面脂质合成,该基因的高表达可降低分枝杆菌毒性[28-30];cspA属于冷休克蛋白,能调控细菌对低温的适应、影响细胞壁结构的形成以及调控RIF的药敏,研究表明,结核分枝杆菌的cspA是一种分泌蛋白,能引起细胞免疫,是一种可能的T细胞抗原[31-33]。以上新的关键基因的获得为研究RIF影响分枝杆菌所涉及的早期调控分子机制提供了全新的靶标分子。