苗成利 孙春艳 黄梅 郎元君 陈伟达 陈小兵 罗成华
(1北京大学国际医院腹膜后肿瘤外科,北京 102206;2北京源宜基因科技股份有限公司)
近年来,我国各地空气污染的情况愈加严重〔1〕。造成空气污染的污染物质往往是由多种不同的化合物组成的混合物,包括颗粒物(PM)、有毒气体、有机化合物及有毒金属等〔2〕,其中PM2.5(PM≤2.5 μm,空气动力学直径≤2.5 μm的大气悬浮颗粒物)是一种对人体健康威胁最大的空气污染物〔3〕。PM2.5不仅能增加人体呼吸系统疾病的发病率,引起哮喘、肺功能下降、呼吸系统炎症〔4,5〕,还能够沉积于肺泡表面并通过肺呼吸屏障进入循环系统〔6〕,对组织细胞造成损害,引起心血管疾病、糖尿病、恶性肿瘤等〔7,8〕。研究发现,PM2.5自身带有大量活性氧(ROS),能够激活细胞氧化反应信号通路,引发炎症反应的同时导致细胞功能障碍,从而引发组织损伤和疾病的发生〔9〕。也有研究报道,PM2.5能够刺激机体内的免疫分子,通过刺激Th2细胞因子表达,引起机体的炎症反应〔10,11〕。
近年来,转录组测序分析被广泛应用于疾病的研究中,转录组是细胞在特定状态下所有RNA的总和,其中除mRNA外,均为非编码RNA〔12〕。全转录组测序分析能够捕获编码RNA和非编码RNA,并能够量化细胞、组织乃至整个机体中基因表达的异质性,为基因的功能性研究提供参考〔13〕。所以利用转录组测序分析能够快速准确地找到与正常组织相比差异性表达的基因并进行分析〔14〕。
本研究利用小鼠模型,将处理的PM2.5硅胶颗粒掺杂到小鼠饲料中,通过饲喂方式使PM2.5直达肠道,取不同时期小鼠的大肠黏膜组织进行转录组测序,从基因表达水平探究PM2.5对小鼠肠道疾病发生的影响。
1.1样品的收集与处理 收集直径≤2.5 μm的硅胶颗粒,置于北京室外顶楼1个月后回收。BALB/c品系小鼠6~8周龄,18~20 g,将小鼠随机分为对照组(C1、C2组)和实验组(P1、P2组)。对照组采用正常饮食,实验组在食物中混入处理的PM2.5硅胶颗粒(每天18 μg/g)。C1和P1组喂食10 d,C2和P2组喂食30 d,每组取3只,取其肠黏膜进行转录组测序。
1.2转录组文库的制备与上机测序 使用NEBNext RNA 超快速文库制备试剂盒构建转录组文库,主要步骤如下:①mRNA 分离和片段化;②第一链 cDNA 合成;③第二链 cDNA 合成;④纯化双链cDNA;⑤末端修复;⑥连接接头;⑦片段筛选;⑧文库富集;⑨文库纯化;⑩文库质检;使用 Qubit Fluorometer检测文库 DNA 质量浓度;使用 Qseq100 DNA Analyzer 检测文库 DNA 长度分布;使用 KAPA Library Quantification Kit 对文库 DNA 的摩尔浓度进行定量。
上机测序(Sequencing)将文库混合、变性后,加入到 Illumina HiSeq测序平台进行高通量并行测序,具体操作参考使用说明书。测序时,对文库两端分别进行测序,因此每个样本会生成测序片段1和测序片段2两个数据文件。
1.3转录组数据的分析 ①将高通量测序的下机数据进行过滤得到高质量数据。②参考基因组比对:把高质量数据与指定的参考基因组比对,计算测序数据与参考基因组的比对效率,评估测序数据的饱和度和基因的覆盖度。测序的饱和度是测序量与检测到基因数量的关系,转录组测序检测到的基因数目与测序数据量呈正相关性,但随着测序量的增加,检测到的基因数目会趋于一个稳定值。在饱和度的分析结果中,用检测到的剪接数来评估。基因覆盖度分析使用RSeQC分析比对测序片段在各基因上的位置分布,模拟 RNA 片段化结果,检验 RNA 片段化的随机性。
1.4基因差异表达的分析 在不同样本分组中筛选差异基因,并对差异基因进行聚类分析及火山图等可视化展示,对差异基因进行 GO/KEGG 功能注释及功能富集分析,KEGG信号通路分析能够更好地了解蛋白的功能注释及基因在信号转导中的生物学作用〔15〕,发掘差异基因差异化表达的功能和调控关系,采用F检验。
1.5RT-PCR 对4组小鼠转录本进行分析,挑选其中差异表达且富集到炎症相关信号通路上的基因设计引物,进行RT-PCR验证,选用GAPDH为内参基因,验证基因引物为CD3e正向:5′-ACGATGCCGAGAACATTGAA-3′,反向:5′-TGGGTTGGGAACAGGTGGTG-3′;CD4正向:5′-CAGATTCCCAACCAACAAG-3′,反向:5′-AACCACTGACAACTTTACCCT-3′;Lat正向:5′-TCATCAAGCCACCTCAAATAA-3′,反向:5′-GAGAAGGCACTGTCTCCAAG-3′;Lcp2正向:5′-CCACAGCCGTCACTACCTT-3′,反向:5′-AGCGGATTTGGATGTTGTAAACT-3′;Ptprc正向:5′-TCATCGCCAG-CATCTATCC-3′,反向:5′-AGTCTGCGTTGTCCCACAT-3′;Syk正向:5′-CTCTGGCAGCTAGTGGAACA-3′,反向:5′-TTGGGAAGGAGTAGGATTTGA-3′;Vav1正向:5′-CTAACAATGGCCGATTCAC-3′,反向:5′-TTTGAGGTCGTAAGAGTCCC-3′,Zap70正向:5′-GCCTGCGTGATGCTATGGT-3′,反向:5′-CCTTCAAGCGGTAAATTAGTCC-3′;GAPDH正向:5′-GTGGCAAAGTGGAGATTGTT-3′,反向:5′-TCTTCTGGGTGGCAGTGAT-3′。
1.6统计学处理 基因覆盖度分析使用RSeQC分析,用Goseq软件做富集,并应用FDR进行分析。
2.1转录组测序数据的质量评估 共得到原始测序片段502.298 M,原始碱基数75.346 G,过滤后C1、C2、P1、P2组分别得到123.278 M、124.489 M、102.584 M、89.417 M过滤后测序片段。不同喂食时期的实验组和对照组能比对到小鼠参考基因组上的测序片段平均比例为84.69%,其中比对到唯一位置的测序片段的平均比例为76.26%,见表1。
表1 不同喂食条件下小鼠转录组测序与参考基因组比对情况(n=3)
测序饱和度曲线(图1A)可以看出,随着测序片段数量的增加,检测到的剪接的数量逐渐增加,并趋于稳定,测序的数据量达到分析要求。测序片段在基因 5′端到 3′端分布相对均匀,满足转录组数据分析的要求,见图1B。
2.2差异表达基因 C1组与P1组共353个差异基因,其中319个处于下调水平,34个处于上调水平。C2组与P2组共1 018个差异基因,其中437个处于下调水平,581个处于上调水平。其中共同差异基因共171个。
2.3差异基因GO富集分析 C1组与P1组的353个差异基因富集到GO数据库3大类(生物过程、细胞组分和分子功能)的38个类别中(图2),与C1组相比,P1组小鼠的转录组分析显示,很多基因的表达量处于下调状态,这说明短时间内接触PM2.5硅胶颗粒能够引起机体内一定程度的基因表达异常。C2组与P2组的1 018个差异基因富集到GO数据库3大类的43个类别中(图3),转录组分析显示,与C2组相比,P2组在生物过程中的免疫过程、细胞定位、代谢过程及细胞组分中的细胞、细胞膜部分基因表达情况有显著上调,提示在短期接触PM2.5硅胶颗粒的时候,机体内的部分基因会出现表达下调的现象,长时间接触PM2.5硅胶颗粒后,机体内相关的炎症基因与疾病相关基因的表达量都会有明显上调,说明PM2.5硅胶颗粒在体内的积累是诱发炎症反应的关键因素。
图1 转录组测序质量评估
图2 C1 vs P1组差异表达基因GO富集分析
图3 C2 vs P2组差异表达基因GO富集分析
2.4KEGG差异基因富集分析 C1组与P1组和C2组与P2组中共同的差异基因共富集到22条显著性差异的代谢途径,见表2,经统计发现,C1组与P1组和C2组与P2组中共同的差异基因富集到的有显著性差异KEGG通路中,其大部分信号通路都与炎症发生和疾病相关,说明在P2组中其炎症与疾病相关的信号通路被显著性激活。
表2 C1组与P1组中下调、C2组与P2组中上调的共同差异表达基因
2.5PM2.5喂食过的小鼠体内其炎症信号通路的相关基因上调 见图4。
图4 炎症相关基因的RT-PCR
通过KEGG信号通路富集分析发现,喂食PM2.5硅胶颗粒30 d的小鼠大肠黏膜组织中的炎症相关和疾病相关的信号通路被显著激活,为验证测序结果,挑选了几个炎症相关信号通路中的相关基因:Lat,Lcp2,Ptprc,Vav1,Zap70,Syk,CD3e,CD4,设计引物用GAPDH作为内参,在RNA水平上进行验证,RT-PCR实验结果显示,这些炎症相关基因的表达情况与转录组测序结果相一致,在P1组中其表达量有部分下调,但在P2组,其表达量有一定程度上调,说明在P2组中,小鼠体内的炎症相关基因表达量有明显升高,激活了炎症相关信号通路并诱发炎症反应。
研究表明,长期暴露于空气污染会促使大脑结构的损伤,损伤中老年个体的认知功能〔16〕,不仅如此,环境污染的程度与儿童支气管炎症状的加剧有关,表明减少空气污染有益于哮喘的控制〔17〕。PM2.5作为空气污染中最重要的致病成分,也受到了高度重视。研究表明,PM2.5在空气中浓度增高会增加一些疾病的患病风险〔18〕,会使肺炎的发病率显著升高,由于生物体生理结构的特点,呼吸道与食道相通,所以当PM2.5在吸入机体的时候,也会有一部分PM2.5进入食道,通过食道进入机体中,而且鉴于肠道的特殊结构,PM2.5在到达肠道之后,能够在此累积,本文中通过利用PM2.5硅胶颗粒喂食小鼠的实验方法探讨了PM2.5对于肠道疾病发生的影响。
转录组测序近年来被广泛应用于基因表达水平的研究〔19〕,相较于传统的基因组测序而言,转录组测序更能体现基因表达的差异性,特别是基因在时间和空间表达的差异性〔20〕。本研究结果发现,PM2.5会在肠道中累积,少量的PM2.5会引起基因表达的普遍下调,总体影响不明显,但积累到一定量的时候就会激活机体免疫相关信号通路,引发炎症反应并可能进一步导致疾病的发生,但其具体的作用机制目前还不明确。由于很多疾病的发生是由于免疫失调导致的,肠道黏膜内炎症因子与炎症抑制性因子的平衡失调导致了肠道炎症的发生及慢性炎症的出现。有研究表明,慢性黏膜炎症和组织损伤易使炎症性肠病患者发展为结直肠癌,且风险随着炎症的持续时间和严重程度而增加〔21〕。本研究结果还说明,长期暴露于PM2.5浓度较高的环境下,不仅会导致呼吸系统疾病,也可能会引起肠道或机体内其他组织疾病,而且会使结直肠癌的患病率大大增加。