肾透明细胞癌中长链非编码RNA 的鉴定及验证

2020-07-29 11:56马慧敏冯钢
沈阳医学院学报 2020年4期
关键词:共表达编码病理

马慧敏,冯钢

(1. 皖南医学院研究生院,安徽 芜湖 241002;2. 皖南医学院弋矶山医院检验科)

大量基因组测序和转录组分析的研究表明,人类转录组不仅包括蛋白编码RNA,还包括大量的非编码 RNA[1]。非编码 RNA 根据其长度分为长、短两种。microRNA(miRNA)是目前研究最多的短非编码RNA,在多种癌症中表达不同,其种子序列与 mRNA 的 miRNA 应答元件(miRNA response element,MRE)之间的碱基配对可抑制mRNA 翻译并介导 mRNA 衰减[2]。长链非编码RNA(long non-coding RNA,lncRNA)被广泛定义为长度超过200 个核苷酸的非编码 RNA[3]。越来越多的研究报道,lncRNA 可以作为竞争性内源RNA(competing endogenous RNA,ceRNA),与miRNA 的MRE 结合,保护目标mRNA 转录物不被降解。根据 ceRNA 理论,一些 lncRNA-miRNA-mRNA 网络已经在一些人类肿瘤中被发现,包括卵巢癌、肺腺癌和头颈鳞癌[4-6]。lncRNA-miRNA-mRNA 网络的发现为我们进一步了解肿瘤的增殖和转移提供了重要线索[7-9]。

肾癌是泌尿系统肿瘤中发病率最高的肿瘤之一。肾透明细胞癌(kidney renal clear cell carcinoma,KIRC)是肾癌中最常见的亚型,是一种恶性侵袭性肾癌,预后不良[10]。过去,人们一直致力于研究KIRC 生物标志物,以提高KIRC 患者的早期诊断和预后,但近年来研究的重点转变为蛋白编码基因或 miRNA[11-13]。有研究报道 lncRNA 在KIRC 中异常表达[14-15],但 lncRNA 在 KIRC 中的临床意义和生物学作用尚未得到充分研究。

癌症基因组图谱(TCGA)数据库为分析不同基因组改变的高通量数据提供了便利,包括非编码RNA。本研究从TCGA 数据库中获取了KIRC 患者的 lncRNA、miRNA 和 mRNA 的表达谱,利用edgeR 工具包检测 KIRC 中差异表达的 lncRNA、miRNA 和mRNA,通过权重基因共表达网络分析(WGCNA)选择与临床信息相关的lncRNA 模块。为了阐明lncRNA-miRNA-mRNA ceRNA 网络中的交互作用,我们利用生物信息学分析预测了lncRNA-miRNA之间的相互作用,以及 miRNA-mRNA 之间的相互作用,同时利用TCGA KIRC 数据集和 KIRC 的临床样本,验证了 lncRNA 在ceRNA网络中的临床意义。

1 材料与方法

1.1 TCGA KIRC 数据集 从TCGA 下载了mRNA表达芯片(72 个正常组织,539 个肿瘤组织)和miRNA 表达芯片(71 个正常组织,545 个肿瘤组织),网址为 https://portal.gdc.cancer.gov/,同时下载并提取 KIRC 患者相应的临床信息。lncRNA表达谱的鉴定根据GENCODE 的注释确定,网址为 http://www.gencodegenes.org。由于 TCGA数据(TCGA_KIRC_exp_HiSeqV2-2015-02-24)是公开的,我们的研究完全符合TCGA 提供的发布指南,因此不需要获得当地伦理委员会的额外批准。

1.2 KIRC 中 差 异 表 达 的 mRNA、miRNA 和lncRNA的鉴定 使用 edgeR 工具包检测 TCGA KIRC 数据集中差异表达的 mRNA、miRNA 和lncRNA[16],阈值设置为 log2(肿瘤组织/正常组织)≥2,伪发现率< 0.01。

1.3 权重基因共表达网络构建 使用WGCNA R包把所有差异表达的lncRNA 纳入权重基因共表达网络分析[17],根据无尺度网络分布,软件自动筛选的软阈值选择与KIRC 患者临床信息最相关的lncRNA 模块进行进一步探讨。

1.4 验证lncRNA 的临床作用 通过受试者工作特征(ROC)曲线评估所选模块中所有lncRNA 的诊断效能,通过 Spearman 相关分析探讨 lncRNA表达与临床病理因素的关系,采用Kaplan-Meier法检测这些lncRNA 的预后作用,并进行log-rank检验。我们还对这些lncRNA 进行了单因素和多因素Cox 回归分析。双侧P<0.05 为差异有统计学意义。统计分析均采用 SPSS 13.0(SPSS Inc.,Chicago,IL,USA)软件进行。

1.5 ceRNA 网络构建 MiRcode 测定lncRNA-miRNA的相互作用,网址为 http://www.mircode.org/[18],从 miRTarBase、TargetScan、miRDB 中 检 索 到miRNA的靶向 mRNA,网址分别为http://mirtarbase.mbc. nctu. edu. tw /、http://www. targetscan. org/vert_71/、http://www.mirdb.org/。利用 Cytoscape v3.6.1 构建 ceRNA 网络并进行可视化[19]。

1.6 基于KIRC 的临床样本验证ceRNA 网络中的lncRNA 为了进一步验证TCGA 数据库中lncRNA的作用,利用RT-qPCR 检测了临床样本中lncRNA的表达,收集 33 例 2018 年 1 月至 2018 年 7 月在皖南医学院弋矶山医院行无辅助治疗的肾切除术(根治性或部分性)患者的癌组织和癌旁组织标本。本研究经皖南医学院伦理委员会审核通过,并获得所有参与者的知情同意。相对表达式计算使用 2ΔCT方法[ΔCT = CT(β-actin)-CT(目标基因)]。引物序列见表 1。配对t检验比较癌组织和癌旁组织lncRNA 的表达。

2 结果

2.1 KIRC 中差异表达的 lncRNA、miRNA 和mRNA 通过对lncRNA 表达谱的分析,共发现了1 821 个差异表达的lncRNA,其中包括1 211 个上调表达的 lncRNA 和 610 个下调表达的 lncRNA(图1)。此外,我们还发现了27 个上调表达和29个下调表达的 miRNA,以及1 587 个上调表达和799 个下调表达的mRNA。

表1 引物序列

图1 癌组织和癌旁组织中差异表达的lncRNAs

2.2 权重基因共表达网络的构建和关键模块的识别 为了得到差异表达的lncRNA 的功能簇,我们使用WGCNA 进行了基因共表达网络分析,权重参数 β =3(scale-free R2= 0.95),最小模块大小设定为30。共检测到7 个模块(图2A),分别为蓝色、棕色、绿色、灰色、红色、蓝绿色和黄色,这些模块中 lncRNA 的数量分别为 109、90、57、154、41、361 和 89。如图 2B 所示,蓝色模块与病理分期(cor= 0.314,P<0.01)、转移(cor=0.224,P<0.01)、分级(cor= 0.396,P<0.01)相关性最好。

图2 权重基因共表达网络的构建和关键模块的识别

2.3 蓝色模块中lncRNA 的临床价值 如表2 所示,蓝色模块中有15 个lncRNA 的ROC 曲线下面积在0.9 以上,提示这些lncRNA 可能在KIRC 的发生中发挥了重要作用,并对KIRC 患者具有较高的诊断价值,lncRNA 和临床病理之间的关系见表3。AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC019069.1、AC114803.1、AC156455.1、AL161937.2、LINC00475、LINC01358、LINC01615、LUCAT1 和NPSR1-AS1 可以预测KIRC 患者病理分期为晚期分 期。AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC019069.1、AC114803.1、AC156455.1、AL161937.2、AL355102.4、LINC00475、LINC01358、LINC01615 和 LUCAT1 可以辨别高病理分级的KIRC 患者。单因素 Cox 分析显示,AC004817.3、AC009549.1、AC011352.1、AC011352.3、AC156455.1、AL161937.2、AL355102.4、LINC00475、LINC01615、LUCAT1、NPSR1-AS1 与 KIRC 患者的总体生存期相关,多因素 Cox 分析显示,AL161937.2 和 LUCAT1 可能是 KIRC 的独立预后指标(P= 0.032,P=0.019),见表 4。如图 3A、3B 所示,Kaplan-Meier 分析显示,高表达 AL161937.2 和 LUCAT1的KIRC 患者的总体生存期明显低于低表达AL161937.2 和 LUCAT1 的 KIRC 患者(P均 <0.01)。

表2 具有KIRC 重要诊断价值的lncRNA 分析结果

表3 lncRNA 的表达与KIRC 的临床病理因素的关系

2.4 ceRNA 网络构建 通过MiRcode 一共预测到5 个靶向 AL161937.2 的 miRNA 和 39 个靶向 LUCAT1 的 miRNA。之后,我们根据 ceRNA 机制选择了 6 个下调表达的 miRNA。通过 TargetScan、miRDB、miRTarBase 等工具进一步预测这 6 种miRNA 的39 个上调表达的靶基因。最后,我们使用 2 个 lncRNA、6 个 miRNA 和 39 个 mRNA 构建lncRNA-miRNA-mRNA ceRNA 网络,见图 4。

2.5 临床样本验证ceRNA 网络中lncRNA 的临床意义 在 33 例配对的 KIRC 组织样本中,AL161937.2 在癌组织中的平均表达水平(0.012±0.009)明显高于其癌旁组织(0.004±0.002)(P<0.01,图 5A),AUC 为 0.898(P< 0.01,图5B)。LUCAT1 在癌组织中的平均表达水平(0.021±0.015)明显高于其癌旁组织(0.006±0.004)(P<0.01,图 5D),AUC 为 0.924(P<0.01,图 5E)。如图 5C 和 5F 所示,AL161937.2和LUCAT1 的高表达与KIRC 的晚期病理分期和病理高分级相关。

表4 单因素和多因素分析预测KIRC 患者的总体生存期

图 4 lncRNA-miRNA-mRNA ceRNA 网络

图5 临床样本验证ceRNA 网络中lncRNA 的临床意义

3 讨论

已有报道称lncRNA 在肾癌中异常表达,提示其可能作为癌基因或肿瘤抑制因子[20-21]。此外,也有研究表明,lncRNA 可能适用于KIRC 的诊断,甚至用于预测预后[22-23]。虽然在 KIRC 中有学者研究了单个lncRNA,但基于高通量RNA-seq 数据的研究鲜有报道。本研究利用TCGA 数据库中的基因表达芯片对KIRC 的差异表达mRNA、miRNA和lncRNA 进行了鉴定,所有差异表达的lncRNA被用来构建权重共表达网络,通过WGCNA 本研究共鉴定出7 个模块。其中蓝色模块与肿瘤分期和分级的相关性最好,蓝色模块中的 109 个lncRNA,15 个 lncRNA 对 KIRC 的诊断价值极高,其AUC 均大于0.90。这些lncRNA 的表达与临床病理因素之间的关系也通过Spearman 相关检验得到了验证,进一步支持了WGCNA 的结果。此外,生存分析表明,AL161937.2 和 LUCAT1 是 KIRC 患者的独立预后因子,提示其预后价值。

到目前为止,只有少数研究报道了lncRNA 与mRNA,或 lncRNA 与 miRNA 在 KIRC 中的相互作用,关于KIRC 中ceRNA 交互作用的研究报道更少。根据ceRNA 假说,本研究通过生物信息学分析预测了lncRNA-miRNA 相互作用和miRNA-mRNA相互作用,并且构建了一个包含 2 个 lncRNA(AL161937.2 和 LUCAT1)、6 个 miRNA 和 39 个mRNA 的 ceRNA 网络。

LncRNA AL161937.2(也称 LOC101927512),位于染色体20q13.13。虽然目前还没有文献报道,但本研究发现 AL161937.2 在临床 KIRC 组织和TCGA KIRC 组织中均较正常组织有明显上调。此外,AL161937.2 在本研究中被确定为KIRC 新的诊断和预后标志物。基于对 MiRcode 的预测,AL161937.2 有 3 个 MREs,可以与 5 个 miRNA 结合。在这些 miRNA 中,只有 hsa-miR-138-5p 在KIRC 组织中显著下调[24]。有研究报道,hsa-miR-138-5p 的靶基因 VIM、TERT 和 ZEB2 在 KIRC组织中明显上调[25-27],并且 VIM、TERT、ZEB2和hsa-miR-138-5p 之间的相互作用分别被Yamasaki等[28]、Zhang 等[29]和 Ding 等[30]证实。因此,本研究推测当 AL161937.2 高表达时,hsa-miR-138-5p会被抑制,导致在KIRC 中VIM、TERT 和ZEB2 的表达增加。

位于 5q14.3 号染色体的 LncRNA LUCAT1(肺癌相关转录1)在非小细胞肺癌中首次被发现[31]。最近,已有报道称 LUCAT1 在某些肿瘤中发挥作用[32-33]。本研究发现 LUCAT1 在临床 KIRC组织和TCGA KIRC 组织中均有上调,并与肿瘤进展相关,这与 Zheng 等[34]的报道一致。本研究通过MiRcode 预测了 39 个靶向 LUCAT1 的 miRNA,其中 hsa-miR-200c-5p、hsa-miR-506-5p、hsamiR-429、hsa-miR-363-5p、hsa-miR-141-5p 在TCGA KIRC 数据集中均有明显的低表达[35-37]。已有研究报道,这些miRNA 的靶基因包括VEGFA、TIMP1 和 CXCL10 在 KIRC 中显著上调[38-40]。此外,hsa-miR-200c-5p、hsa-miR-141-5p、hsa-miR-429、hsa-miR-200c-5p 与 VEGFA 的相互作用、hsa-miR-363-5p 与 TIMP1 的相互作用、hsamiR-200c-5p 与ZEB2 的相互作用已分别得到了前人研究的验证[41-43]。这些结果表明,LUCAT1 可能与 hsa-miR-200c-5p、hsa-miR-506-5p、hsamiR-429、hsa-miR-363-5p 和 hsa-miR-141-5p产生竞争,从而调控 KIRC 中 VEGFA、TIMP1 和CXCL10 的表达。

在本研究中,我们利用TCGA KIRC 数据集中的大规模样本,筛选到 2 个潜在的 KIRC 的 lncRNA 生物标志物,并通过 RT-qPCR 验证了2 种lncRNA 在 KIRC 中的表达。更重要的是,我们构建了 lncRNA-miRNA-mRNA ceRNA 网络,这为更好地理解KIRC 中的ceRNA 调控提供了新的视角。然而,我们的研究也有一些局限性。首先,我们在33 个临床样本中只验证了2 个lncRNA 的表达,我们的研究结果是否可以推广到一般人群还有待确定。其次,我们的研究并没有验证所有lncRNA与miRNA 之间的相互作用,lncRNA(AL161937.2和LUCAT1)在KIRC 中的功能作用还需要通过实验进一步验证。

猜你喜欢
共表达编码病理
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
生活中的编码
病理诊断是精准诊断和治疗的“定海神针”
3例淋巴瘤样丘疹病临床病理分析
肿瘤病理:从检查到报告
高世代回交玉米矮秆种质的转录组分析
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare