李建祺,张晶,甄亚男,魏飞力,欧阳雅博,肖瑞雪,徐忠法
(1济南大学 山东省医学科学院医学与生命科学学院,济南250022;2山东省医学科学院附属医院;3首都医科大学附属北京佑安医院 北京市肝病研究所)
现阶段对结直肠癌的筛查多依靠糖类抗原检测,其特异性较理想,但敏感性较低,早期诊断率较低,因此需要寻找一种更加有效的筛查及评价方法。环状RNA(circRNA)是一种调节基因表达的内源性非编码RNA(ncRNA)[1]。circRNA存在数量众多,作用机制丰富,影响范围广泛,在结直肠癌、肺癌、胃癌、肝癌等恶性肿瘤的发生发展中均发挥重要作用[2,3],因此可能成为反映结直肠癌发生、进展的新的生物标志物。2016年5月~2018年10月,本研究对不同分期结直肠癌组织及相应癌旁组织的circRNA表达进行比较,筛选差异性表达的circRNA,并分析其在结直肠癌发生发展中的作用。现报告如下。
1.1 组织标本来源及分组 结直肠癌组织及癌旁正常组织来源于2016~2018年在山东省医学科学院附属医院行结直肠癌根治手术且经病理证实的9例原发性结直肠癌患者,男5例、女4例,年龄54~64(59±6)岁,直肠癌8例、乙状结肠癌1例,病理分型均为腺癌。患者纳入标准:病理诊断为原发性结直肠腺癌;无远处转移。排除标准:术前接受过化疗、放疗、免疫治疗;同时合并其他类型的恶性肿瘤;临床资料不完整。根据TNM分期将组织标本分为A(T1~3N0M0)、B(T4a~bN0M0)、C(T4a~bN1~2M0)组。入组患者均签署相关知情文件,同时本研究已得到山东省医学科学院附属医院伦理委员会批准。
1.2 样本RNA的提取及质控 获取结直肠癌组织标本后立即剪成直径<0.5 cm的小块,浸没在5倍体积的RNAlater中,4 ℃浸泡过夜,转移至-80 ℃冰箱保存。利用定容RNA的RNAse-free Water作为空白对照,每个样品吸取1 μL,用分光光度计测定RNA溶液在260 nm、280 nm波长处的吸光度值,检测RNA的浓度和纯度。每个样品吸取400~700 ng的总RNA,用1.5%甲醛变性凝胶电泳(120 V)15 min,在凝胶成像仪下检测总RNA中28 S和18 S的完整性。
1.3 结直肠癌组织中差异表达circRNA的筛选 各组RNA样品依次进行添加多聚腺苷酸、标记、杂交、洗脱、扫描等操作,后用Affymetrix Scanner3000 7G激光共聚焦扫描仪对杂交后的Affymetrix Clariom D芯片进行扫描。最后对杂交信号值进行本底分离及标准化操作。以调整后P<0.05、|log2FC|>2作为筛选标准,根据circRNA在每个样本中的表达值进行聚类分析,采用Cluster3.0软件制作聚类图。按照TNM分期逐渐增高的顺序设计序列实验,筛选出随TNM分期表达变化最显著、最主流的基因群,对差异circRNA进行表达趋势分析。将呈主流表达趋势的circRNA作为进一步研究的目标基因。根据circRNA与mRNA的实测值,通过共表达计算方式构建网络,按基因属性评分,得到处于调控网络中心的circRNA(共表达调控网络基因属性评分前10位),再与目标基因群进行交集处理,筛选出与结直肠癌进展密切相关的circRNA。
1.4 差异表达circRNA对应mRNA的功能分析 通过circRNA周边与其共表达的mRNA来预测未知mRNA的功能。对差异表达基因通过DAVID6.7网站整合的数据库进行基因本体论(GO)分析和京都基因与基因组大百科全书(KEGG)信号通路描述分析,筛选功能最显著的基因。以P<0.05为差异有统计学意义。
2.1 结直肠癌组织中差异表达circRNA筛选结果 初步分析发现,A组癌组织与癌旁组织比较,有424个差异表达circRNA,其中表达降低165个、表达升高239个;B组差异表达circRNA共计560个,表达降低284个、表达升高276个;C组差异表达circRNA共计409个,表达降低190个、表达升高220个(P<0.05,FC>1.5)。对各组差异表达circRNA进行聚类分析。之后将A组的差异表达circRNA在B组、C组中进行验证,并进行表达趋势分析。对差异表达circRNA的表达丰度进行多次验证,发现circRNA表达随结直肠癌的进展而降低为主流趋势。编号0~15组circRNA群中,仅编号1、2、6、7、8、9组表达差异有统计学意义(图1),其中编号第7组差异表达circRNA的表达变化趋势既符合主流趋势同时更具有统计学意义(P<0.05,且值更小),故选定第7组的差异表达circRNA为主要研究对象。第7组circRNA共有103条,与共表达调控网络基因属性评分前10位的circRNA(表1)进行交集处理,筛选出与结直肠癌进展密切相关的8个circRNA,分别为hsa_circ_0000007、hsa_circ_0001111、hsa_circ_0006977、hsa_circ_0079656、hsa_circ_0023608、hsa_circ_0024508、hsa_circ_0026694、hsa_circ_0029903。通过预测筛选出500余个相关mRNA,并非均具有重要生物学作用,因此进一步进行GO分析和KEGG分析。
图1 差异表达circRNA的表达趋势图
表1 共表达调控网络基因属性评分前10位的circRNA
2.2 差异表达circRNA对应mRNA的GO分析和KEGG分析结果 对8个circRNA相对应的所有mRNA进行GO功能注释分析(图2)及KEGG通路富集分析发现,被富集的大部分基因及hsa03010通路(P<0.05)主要参与核糖体RNA的加工与代谢、RNA的剪切与加工处理等细胞基础功能过程。在8个与结直肠癌进展密切相关的circRNA中,hsa_circ_0079656与HINFP基因存在显著生物学功能关系,HINFP基因可能与细胞有丝分裂周期G1/S期的转录调控有关。确定hsa_circ_0079656为最终目标基因。
circRNA是通过套索驱动环化或内含子配对驱动环化形成的环形RNA,该RNA早在1976年在植物病毒中发现,但一直认为是转录的副产品,并不存在生物学作用。近年来随着研究水平的不断提高,大量高精度探针及检验仪器投入使用,circRNA被发现广泛存在于不同生物的细胞质中,具有高度稳定的特性[4],在真核生物细胞中发挥重要作用[5]。
研究发现,circRNA与糖尿病、动脉粥样硬化及心力衰竭、心肌梗死等多种疾病进展均有一定的相关性[6,7]。胃癌、肝癌、乳腺癌、结直肠癌等恶性肿瘤相关研究发现,circRNA利用miRNA应答元件结合相应miRNA,阻止miRNA抑制目标基因的表达,进而影响恶性肿瘤的进展[8~12]。另有研究发现,与相邻的正常组织相比,多种恶性肿瘤组织中存在异常表达的circRNA。Zhang等[13]发现,hsa_circ_0091579在肝癌组织中的表达水平显著升高,可能作为肝癌诊断及预后评估的标志物。Chi等[14]发现,hsa_circ_0000285在膀胱癌组织中的表达水平显著降低,可能作为膀胱癌的诊断及预后评估标志物。Chen等[15]研究表明,hsa_circ_0000190诊断胃癌具有更好的敏感性和特异性。本研究同样发现,在结直肠癌组织中circRNA表达水平随肿瘤进展而降低,说明circRNA有可能成为结直肠癌的新型生物标志物。
图2 差异表达circRNA相对应mRNA的GO分析结果
本研究发现,各组circRNA的表达存在不同程度变化。之后按照结直肠癌TNM分期顺序设计序列实验,筛选出随TNM分期变化最显著、最主流的基因群,对样本的差异表达基因进行表达趋势分析。选取表达变化与结直肠癌进展程度具有显著联系的基因,结合主流表达趋势,筛选出进一步研究的目标基因。本研究中差异表达circRNA的主流变化趋势为随病情进展而表达降低,有学者在肝癌及结直肠癌相关研究中也有类似发现[15,16]。
借助共表达网络可发现circRNA与mRNA之间可能存在的作用关系,找到影响mRNA表达的circRNA,从而发现网络中起中心调控作用的circRNA及可能存在的新作用机制。我们依据基于芯片的实测值运算,突破了传统分析中基因注释不齐全的限制,增加了研究的创新性。本研究发现,在共表达网络中存在500余个circRNA位于共表达网络核心位置,筛选其中评分前10位者,与第7组差异circRNA群进行交集,得到8个与结直肠癌进展密切相关的circRNA,即hsa_circ_0000007、hsa_circ_0001111、hsa_circ_0006977、hsa_circ_0079656、hsa_circ_0023608、hsa_circ_0024508、hsa_circ_0026694、hsa_circ_0029903。
GO数据库是一个跨物种、综合性、描述性的数据库,目的在于建立一个适用于各种物种、对基因和蛋白功能进行限定和描述并能随着研究不断深入而更新的语义词汇标准。KEGG可提供整合代谢途径查询,包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解。通路富集分析可将本研究中得到的差异表达基因基于KEGG数据库进行信号通路注释,得到基因参与的所有信号通路后,利用Fisher精确检验和多重比较检验计算每个信号通路的显著性水平和误判率,从而筛选出基因参与的重点信号通路。我们分别对8个差异表达circRNA所预测的mRNA用GO功能注释分析及KEGG通路富集分析,发现被富集的大部分基因及hsa03010通路主要参与核糖体RNA的加工与代谢、RNA的剪切与加工处理等细胞基础功能,其中hsa_circ_0079656与HINFP基因存在显著生物学关系,而HINFP基因主要参与细胞有丝分裂周期中G1/S期的转录过程的调控。
总之,经筛选与分析,本研究发现hsa_circ_0079656在结直肠癌组织中低表达且随病情进展表达降低,该circRNA可能通过作用于HINFP基因从而调控细胞有丝分裂周期中G1/S期的转录过程,影响结直肠癌的进展。同时,本实验存在一些不足:由于实验时间限制,未进行后续验证,相关作用机制仅为预测结果;由于实验分组需均衡各临床病理分期组织样本,导致样本收集工作存在困难,未能取得充足实验样本;本研究仅针对结直肠癌浸润深度进行研究,未考虑其他分期因素。因此,今后仍需增加后续实验,逐步完善其他样本数据,并进行生物信息学分析验证上述结果。