高元峰,王瑞颖,易柳,李珊,肖望重
1湖南中医药大学第一附属医院,长沙410007;2湖南中医药大学
胶质瘤为中枢神经系统常见的原发性恶性肿瘤之一[1],其发病年龄多见于20~50岁,以30~40岁为最高峰,另外在10岁左右儿童中亦较多见。患者多表现为头痛、恶心呕吐、癫痫、视物模糊等症状,严重可导致死亡。临床上,胶质瘤以星形细胞瘤最为常见,其次是多形性胶质母细胞瘤和室管膜瘤[2-3]。2016版WHO中枢神经系统肿瘤分类标准引入了分子学特征,构建了分子时代中枢神经系统肿瘤诊断的新理念[4]。然而目前作为诊断的特定基因数量有限,如p53、IDH-1、GFAP、EGFR等,未知且重要的基因靶点仍有待开发,探讨新的分子靶标是胶质瘤基础研究和临床治疗的新契机。长链非编码RNA(lncRNA)是指长度大于200个核苷酸的非编码RNA。研究显示,在多种细胞生理过程中,lncRNA与关键组件的基因或蛋白质相互作用,改变基因表达或蛋白的一级或二级结构,从而导致肿瘤细胞增殖、侵袭和迁移[5-7]。目前共有20多个异常表达的lncRNA被证实与胶质瘤的发生发展密切相关,如HOXA11-AS、Linc-POU3F3和HULC等[8-9],然而还有许多未知的lncRNA及其功能尚未明确。本研究采用高通量测序法筛选胶质瘤组织与正常脑组织中存在差异表达的lncRNA,并进一步扩大样本进行验证,旨在寻找新的胶质瘤生物标志物,为胶质瘤的早期诊断和治疗提供新的靶标。
1.1 临床资料 收集2018年1月—2019年12月在中南大学湘雅附属肿瘤医院行手术切除的89例脑胶质瘤患者的胶质瘤组织,25例脑外伤患者的脑组织样本。纳入标准:药物治疗前未进行过放疗或生物疗法的胶质瘤患者及脑外伤患者。排除标准:伴有非神经系统的恶性肿瘤;合并肝、肾、造血系统等严重原发性疾病及心血管疾病;肝肾功能不全;怀孕或哺乳期妇女。本研究经临床伦理机构审查委员会审核并批准(注册号:ChiCTR1800019217)。
1.2 脑胶质瘤组织中lncRNA高通量测序 采用LncRNA-Seq基因组高通量测序法。取19例脑胶质瘤组织和5例脑外伤组织,提取组织总RNA,去除rRNA。制备缺失rRNA的RNA特异性文库。使用随机引物、逆转录酶、DNA聚合酶Ⅰ和RNase H合成cDNA。将DNA片段腺苷酸化后,进行杂交,用Ampre XP系统(Beckman Coulter,Beverly,MA)纯化文库片段,再利用Illumina HiSeq进行双端测序,测序工作由北京博奥生物技术有限公司完成。
1.3 脑胶质瘤组织中差异表达lncRNA的筛选 应用edgeR软件分析胶质瘤组织与脑外伤组织差异表达的lncRNA,获得P值后进行两轮多重假设检验校正,通过控制错误发现率(FDR)来决定P值的阈值,校正后的P值即Q值。采用FPKM公式计算差异倍数(FC)。以P<0.05、FC≥2或≤0.5为标准,筛选差异表达的lncRNA。计算欧式距离矩阵,以完全连锁方法对差异lncRNA进行聚类,以聚类图进行展示。将筛选出的差异表达lncRNA以火山图的形式进行可视化。
1.4 脑胶质瘤组织中差异表达lncRNA的验证 采用qPCR法对上述筛选出的部分差异lncRNA进行验证。选取胶质瘤组织70例和正常脑组织20例,加入TRIzol试剂提取总RNA,采用超微量核酸分析仪(NANODrop2000,日本岛津公司)测定RNA浓度和纯度,满足A260/A280在1.8~2.0。以提取的RNA为模板,逆转录合成cDNA,使用实时荧光定量PCR仪(7300 plus,美国ABI公司)进行实时定量扩增。SYBR反应体系(20µL):gDNA 10.0µL,5×Prime script Buffer 4.0µL,Prime Script RT Enzyme MixⅠ1.0µL,RT primer Mix 1.0µL,RNase free H2O补足至20µL。反应条件:95℃30 s;95℃5 s,55℃30 s,72℃30 s,40个循环;95℃15 s,60℃1 min,95℃15 s。取所有样本最终Ct值的平均值。根据熔解曲线分析引物的特异性,以U6为内参,采用2-ΔΔCt法计算目的基因的相对表达量。
1.5 统计学方法 采用SPSS22.0统计软件。计量资料先行正态性检验,符合正态分布的采用独立样本t检验,不符合正态分布的采用非参数检验Mann-WhitneyU检验;计数资料比较采用χ2检验。P<0.05为差异有统计学意义。
2.1 脑胶质瘤组织中差异表达lncRNA的筛选结果 根据高通量测序结果,基于lncRNA表达矩阵,绘制聚类图,见OSID码。横坐标代表不同分组,N为脑外伤组织,T为脑胶质瘤组织;红色表示该lncRNA含量高表达,蓝色表示该lncRNA含量低表达。结果表明两组lncRNA表达存在明显差异。为将差异lncRNA可视化,以FC变化为横坐标,以P值变化的统计学意义为纵坐标,按前述差异基因筛选条件(P<0.05、FC≥2或≤0.5),绘制火山图,见OSID码。与脑外伤组织相比,胶质瘤组织中存在明显差异表达的lncRNA共3 040个,其中表达上调1 233个、表达下调1 807个。差异表达的lncRNA按FC排序,前10位分别见表1。
2.2 脑胶质瘤组中中部分差异表达lncRNA的验证结果 对脑胶质瘤组织中表达上调和下调前3位的lncRNA进一步扩大样本量进行验证,PCR引物设计序列见表2。结果显示,与正常脑组织比较,脑胶质瘤组织中TCONS_00 0 1 09 6 1、ENST 0 0 0 00 4 4 35 4 6.1、ENSG00000262119.1表达升高,ENST00000531508.1、TCONS_00004034、ENST00000504876.1表 达 降 低(P<0.05或<0.01),与基因组高通量测序结果一致。见表3。
表1 脑胶质瘤组织中差异表达的lncRNA(前10位)
表2 lncRNA引物序列(5'→3')
表3 部分差异表达lncRNA的验证结果
非编码RNA指的是不编码蛋白质的RNA,大部分属于“管家RNA”或“监管RNA”。非编码RNA与疾病的发生发展密切相关,尤其在肿瘤的预测、诊断及治疗预后等方面具有重要价值,成为近年来国内外研究的热点之一[10-12]。lncRNA是指长度大于200个核苷酸的非编码RNA,其功能主要涉及以下4个方面:①表观遗传调控:如lncRNA ZEB1-AS1启动子区具有低甲基化现象[13];lncRNA Xist能促进染色质修饰复合物的表达[14];lncRNA HOTAIR能调整母体基因HOXD在HOXD基因簇的空间位置[15]。这些表观遗传调控能直接或间接影响肿瘤发生发展。②基因转录水平调控:如lncRNA TSLC1-AS1能与其母体的TSLC1 mRNA形成复合体,增加母体mRNA的稳定性,避免被酶解,从而影响TSLC1蛋白表达[16]。③蛋白水平调控:非编码RNA不具有编码蛋白的能力,但可以调控某些蛋白的活性。如lncRNA FOXD1-AS1能结合到eIF5a蛋白的特定结构域,影响其活性,从而影响eIF3a蛋白的表达水平[17]。④miRNA竞争调控:如lncRNA TUG1的功能与miR-21有关,并通过lncRNA-miRNA-mRNA轴发挥作用[18-19]。
本研究通过基因组高通量测序方法,筛选出胶质瘤组织中差异表达的lncRNA共3 040个,其中表达上调1 233个、表达下调1 807个。这些差异表达的lncRNA可能与胶质瘤的发生发展有一定关联。为了验证基因组高通量测序结果,我们进一步扩大了样本量,利用qPCR法检测脑胶质瘤组织与正常脑组织中TCONS_00010961、ENST00000443546.1、ENSG0 0 0 0 02 6 2 11 9.1、ENST 0 0 0 00 5 3 15 0 8.1、TCONS_00004034、ENST00000504876.1的表达情况,结果显示脑胶质瘤组织中前3个lncRNA表达显著升高、后3个lncRNA表达显著下降,与测序结果一致。
综上,本研究利用基因组高通量测序初步筛选出胶质瘤组织中差异表达的lncRNA,并进一步扩大样本进行验证,二者结果相符。本研究发现了更多未知的与胶质瘤发生发展相关的lncRNA,但作为临床标志物可能还存在一定的局限性,无法真正应用于临床,且不同地区、不同种族之间是否具有同样的差异尚未可知。下一步我们将从细胞凋亡、自噬等方面进行胶质瘤细胞实验,寻找与lncRNA相关的miRNAs以及相关靶基因。