程诺 陈凤媛 楚艳 沈云海 冯洁 潘勤聪△
(1.复旦大学附属上海市第五人民医院消化内科,上海 200240;2.上海市浦南医院,上海 200125)
结直肠癌(colorectal cancer,CRC)是世界上常见的消化道恶性肿瘤,其发病率占肿瘤中的第三位,也是第二大癌症死亡原因[1]。在中国,结肠癌也是癌症发病率及死亡率前五位的恶性肿瘤之一[2]。随着我国人民生活水平和饮食习惯的提高,结直肠癌在我国的发病率也呈上升趋势。从1990年到2016年,中国年龄标准化CRC的患病率估计从1990年的14.25/10万增加到2016年的25.27/10万[3]。它严重威胁着社会的发展以及人们的健康和生活。早期发现和治疗可有效改善大肠癌患者的预后和长期生存率。目前,结直肠癌除内镜检查和病理检查外,尚缺乏有效的早期诊断和干预治疗。深入探讨结直肠癌的分子机制,确定有效的治疗靶点,对提高患者的生存率和生活质量至关重要。近年来研究认为长链非编码RNA(Long NON-Coding RNA,lncRNA)在结肠癌中起到重要作用。lncRNA被定义为不编码蛋白质的长度大于200个核苷酸的RNA转录本,它们本身就是功能单位,因此它们的亚细胞定位对其功能至关重要[4]。根据功能不同,lncRNA分为3种类型:(1)lncRNA是功能性生物分子并与细胞中的其他成分相互作用,例如DNA、蛋白质或RNA;(2)基因调控元件嵌入在lncRNA基因的转录体中,并且其活性lncRNA基因指导调控元件的活性;(3)转录过程影响基因组,从而影响基因活性[5]。LncRNAs参与了广泛的细胞机制,从基因表达的几乎所有方面到蛋白质翻译和稳定性。关于lncRNA作用的研究增加证明了这些转录物在表达调控中的关键作用。迄今为止,已经发现许多lncRNA在结肠癌中具有显着异常表达,其中包括MEG3、H19、SNHG6、BCYRN1、LINC01535等[6-10]。由于其癌症特异性表达谱,lncRNAs的异常表达可作为结肠癌诊断和治疗分层的可靠预后指标。LncRNA生物学的许多方面还不清楚,可能为我们提供一个新的视角的复杂性调控网络。因此,本研究旨在深入了解与结肠腺瘤和结肠癌相关的lncRNA。同时就其中表达显著差异的lncRNA NONHSAT017458进行组织学上验证及临床相关性分析。报告如下。
1.1一般资料 收集2021年1月至2021年12月在上海市第五人民医院消化内科接受肠镜检查的结肠腺瘤及结肠癌患者(各10例,剔除2例结肠腺瘤组质检不合格)。分别留取其肿瘤组织及相邻正常组织的样本,取完立即放入RNA保存液中并放置于-80℃冰箱保存。所有患者在检查前都没有接受任何其他治疗且未患有其他系统肿瘤及严重疾病。所有患者疾病诊断严格经上海市第五人民医院病理科的两名病理学专家明确。本研究经复旦大学附属上海市第五人民医院伦理委员会批准,伦理审批号为(2020)伦审(010备)。所有患者均签署知情同意书。见表2。
表1 结肠腺瘤患者基本信息
表2 结肠癌患者基本信息
1.2方法
1.2.1高通量测序技术 本研究中高通量测序技术由上海欧易生物医学科技有限公司完成。运用TRIZOL的方法对样本进行total RNA的提取,纯化总RNA,抽取全部带多聚A尾的RNA,进行genes的分离或者对rRNA进行去除及片段化、应用随机引物和逆转录酶合成cDNA,随后进行3’末端加A、连接接头以及末端修复等一系列测序实验步骤,从而完成测序样本的文库构建。选用paired-end程序,进行双端测序,将带有簇的flow cell上机并按照HiSeq 2 500提供的指南进行测序试剂的准备工作。由数据搜集软件来进行数据分析以及控制测序的过程。
1.2.2LncRNA NONHSAT017458与mRNA共表达分析 将样本的转录组测序数据结果进行包含数据预处理、基因组比对、基因表达定量及表达分析、并对其进行GO/KEGG富集分析。GO/KEGG富集分析显著性可用P值表示,当P≤0.05时,差异有统计学意义。P值越小,功能富集越显著。此外,运用超几何累积分布函数计算共表达mRNA注释中的功能性术语的富集,并通过方法计算假发现率(false discoveryrate,FDR)。当P<0.05且FDR<0.05时被认为有统计学意义。
1.2.3定量反转录聚合酶链反应验证分析 实时荧光定量PCR(qRT-PCR)检测lncRNA NONHSAT017458在大肠癌样本中的表达。根据制造商的规格,使用TransScript All-in-One第一链cDNA合成SuperMIX从我们的样品中提取总RNA用于qPCR试剂盒。使用NanoDrop 2000光谱仪(Thermo Scientific,USA)测定RNA的产量,并使用用凝胶电泳染色的琼脂糖溴化乙锭评估完整性。使用2-ΔCt方法计算基因的相对表达水平。PCR在384孔光学板(罗氏,瑞士)进行30个循环,每个循环在94℃下30秒,然后进行45个在94℃下5秒及60℃30秒的循环。使用的引物包括:
表3 qRT-PCR的引物序列
1.3统计学方法 本研究数据采用SPSS 22.0(IBM SPSS Statistics,USA)进行分析。使用 Pearson’s chisquare检验来评估lncRNA NONHSAT017458表达与临床病理参数之间关联的统计学意义。独立样本的t检验用于评估lncRNA NONHSAT017458的表达水平,P<0.05为差异有统计学意义。
2.1lncRNA NONHSAT017458高通量测序筛选及lncRNA-mRNA共表达分析 在结肠癌组织与正常对照组中,利用高通量测序筛选出表达差异lncRNA NONHSAT017458(FC>50,P<0.05)。将差异表达的标准化数据制作成热图(图1A)。我们对lncRNA-mRNA进行共表达分析发现其中与lncRNA NONHSAT017458相关的前20位基因分别列举如下(图1B):H19、THBS2、POMP、C6orf223、MMP11、CTHRC1、AP000349.1、SULF1、COL4A1、AQP1、IL-8、MZT1、SMCO2、SPON2、FSTL1、SPARC、GTF2F2、IGFBP7、COL4A2、EXOSC8。其中IL-8呈现表达差异最明显。
注:图A:lncRNA差异表达热图;红色代表高表达,蓝色代表低表达;图B:lncRNA NONHSAT017458共表达基因图。图1 结肠癌组织中差异lncRNA表达谱及lncRNA NONHSAT017458共表达基因
2.2lncRNA NONHSAT017458的功能分析 为了探索介导结肠癌发生发展的生物学过程,对差异表达基因进行了分子功能分析。其揭示了多种生物过程,细胞组分和分子功能的参与。使用基因本体(GO)分析,我们通过P值确定lncRNA NONHSAT017458每个结构域中10个最显着富集的术语。在结肠癌中,这些结构域分为生物过程、细胞组成及分子功能三部分(图2)。其中细胞成分的重要术语包括含胶原蛋白的细胞外间质、细胞外空隙、内质网、基膜和胞外区等成分。对于分子功能,重要术语包括钙整合素结合蛋白、蛋白质绑定、细胞外间质装订及血小板衍生生长因子结合等。生物过程最重要的术语包括类血管生成的阳性调节、内皮细胞的正向调节、胶原分解代谢过程、细胞蛋白质代谢和细胞外间质拆卸等过程。KEGG通路分析显示(图3),lncRNA NONHSAT017458涉及相关的通路,其中细胞外基质(extracellular matrix,ECM)受体相互作用通路呈现明显富集性,另外还包括有PI3K-Akt信号通路、HIF-1信号通路、IL-17信号通路,NF-kappaB(NF-kB)信号通路及TNF信号通路等。这些通路均可能参与结肠癌的致癌作用。见图3。
2.3lncRNA NONHAST017458的qRT-PCR验证 基于高通量测序结果,本研究使用qRT-PCR进一步验证lncRNA NONHAST017458表达水平。结果显示在结肠癌组织中,lncRNA NONHAST017458表达水平明显高于结肠癌旁正常组织(P<0.05)(图4A)。与高通量测序中结肠癌中lncRNA NONHAST017458表达上调结果基本一致。在结肠腺瘤组织中,lncRNA NONHAST017458表达水平与腺瘤旁正常组织中无明显差异(P>0.05)(图4B),故与高通量测序中结肠癌中lncRNA NONHAST017458表达上调结果不一致。见图4。
注:图A:CRC-normal代表结肠癌旁正常组织,CRC-Tumor代表结肠癌组织;图B:CRA-normal代表结肠腺瘤旁正常组织,CRA-Tumor代表结肠腺瘤组织;与对照组相比:*P<0.05。图4 结肠癌组织中lncRNA NONHSAT017458的qRT-PCR验证
2.4lncRNA NONHAST017458表达与结肠癌临床病理参数的关系 lncRNA NONHAST017458表达情况与结肠癌患者性别、年龄、肿瘤直径、肿瘤有无淋巴结转移及远处转移均无明显相关性(均P>0.05)(表4)。
表4 患者临床特征分布与lncRNA NONHSAT017458表达量的相关性
结肠癌是世界上常见的消化道恶性肿瘤,也是导致癌症发病率和死亡率的第四大常见原因。目前研究认为饮食、微生物及其代谢物与结肠癌发生有关,但结直肠癌发生发展的机制尚不明确。LncRNA是那些有超过200个核苷酸(nt)并且不会被翻译成蛋白质的RNA[11]。它显示了在调节关键细胞功能,包括基因调控的转录,转录后和表观遗传机制的作用[12]。许多肿瘤的发生和发展与lncRNA表达的异常调节有关。LncRNA在结肠癌中具有复杂的生物学功能,其具体的调控机制尚不清楚,有待进一步研究。
在本研究中,我们进一步运用高通量测序技术分析了结肠癌组织、结肠腺瘤组织以及正常对照组中的lncRNA表达谱,我们发现结肠癌与正常对比中呈现明显基因表达差异。在对照组与结肠癌组中对比中,表达上调的lncRNA有35个(P<0.05,FDR<0.05)。其中lncRNA NONHSAT017458表达倍数是5.35*1011倍。在结肠腺瘤与结肠癌组中,表达上调的lncRNA有50个(P<0.05,FDR<0.05)。其中lncRNA NONHSAT017458表达倍数是4.56倍。对照组与结肠腺瘤组中,表达上调的lncRNA有2个(P<0.05,FDR<0.05),其中lncRNA NONHSAT017458(1.17*1011倍)。通过以上结果发现在结肠肿瘤中lncRNA呈现明显表达差异,其中lncRNA NONHSAT017458表达差异最明显。我们由此假设结肠癌的发生可能与lncRNA NONHSAT017458的异常调控密切相关。目前lncRNA NONHSAT017458的功能机制尚不明确,我们通过GO分析和KEGG通路注释分析lncRNA NONHSAT017458的潜在功能。GO分析显示lncRNA NONHSAT017458参与生物过程、细胞组成及分子功能三部分。包括钙整合素结合蛋白、蛋白质绑定、内皮细胞的正向调节、胶原分解代谢过程、细胞蛋白质代谢等过程。lncRNA NONHSAT017458异常调节通过这些生物学过程从而引起结肠癌发生发展。KEGG通路富集分析显示lncRNA NONHSAT017458与PI3K-Akt信号通路、NF-kappaB(NF-kB)信号通路及TNF信号通路等通路相关,而这些通路在以往研究已充分证实与结肠癌的发生发展密切相关[13-15]。我们针对我们进一步通过高通量测序筛选发现lncRNA NONHSAT017458有众多的共表达基因,其中IL-8相关性最高。
白介素-8(IL-8,也称为CXCL8)是结肠癌中常见的一种细胞因子,属于弹性蛋白样重组体(ELR)+CXC趋化因子家族[16]。它通过对中性粒细胞、淋巴细胞和单核细胞的趋化作用及刺激中性粒细胞活性而引发炎症反应[17]。IL-8启动子的转录活性与NF-kB结合相关[18]。因此IL-8在肿瘤增殖、迁移和侵袭中起到重要作用。研究认为CXCL8(即IL-8)可通过PI3K/AKT/NF-kB信号轴诱导激活结肠癌诱导上皮间质转化(EMT)的作用[19]。目前lncRNA在结肠癌中行使复杂生物学功能,其详细的调控机制尚不明确,仍有待深入研究。因此,本研究将进一步研究lncRNA在结肠癌中的调控作用,以明确与相关转录因子及通路之间的联系。针对前期研究结果,我们通过高通量测序筛选出结肠癌中异常表达的lncRNA NONHSAT017458,并同时筛选出与lncRNA NONHSAT017458相关的转录因子及参与通路。我们可以将lncRNA NONHSAT017458其作为结肠癌发病机制的研究对象,研究lncRNA NONHSAT017458表达异常是否通过调控NF-kB通路中IL-8的表达从而引起结肠癌的发生发展。这可成为后续研究重点。目前我们已经在结肠癌组织中验证其表达水平的变化。但它是否为结肠癌特异的lncRNA仍需要更多病例样本来验证,同时其在细胞中的表达情况以及如何参与通路并与转录因子作用的机制仍需进一步体内外实验来明确。lncRNA NONHSAT017458在结肠癌中起到重要作用,后续有望成为结肠癌的早期诊断的分子标志物及预后评价指标,并为结肠癌的早期治疗提供新的思路。