杨达平,黄婉英,罗嘉嫄,何娟
(1.广西贵港人民医院/广西医科大学第八附属医院 病理科,广西 贵港 537100;2.广西医科大学第一附属医院 病理科,广西 南宁 530021)
微小RNA(microRNA,miRNA)是一种具有调节功能内源性的非编码RNA[1-2]。miR-182-5p是miRNA家族中重要的一员,既往研究表示miR-182-5p在胰腺癌、肠癌、卵巢癌、肝癌、前列腺癌等多种肿瘤组织中呈高表达状态,且其高表达是患者预后的不良因素[3-4]。肺癌在全球范围内每年造成近179万人死亡,在肿瘤相关死亡中排首位[5]。80%的肺癌可以归类为非小细胞癌(non-small cell lung cancer,NSCLC)[6]。研究显示,尽管化疗、放疗、靶向治疗等在肺癌领域中的广泛应用,患者的5 a生存率有所上升,但仅有少数早期肺癌患者在确诊时可接受根治性手术,所以肺癌患者总体生存率依然不高[7]。因此,探索新的生物标志物对肺癌的诊治及改善肺癌患者预后尤为重要。虽然既往研究已表明miR-182-5p在NSCLC中呈高表达状态[8-10],但存在以下不足:如大部分研究使用单一的检测方法;大部分研究基于单研究中心的数据;部分研究使用了高通量技术,由于大数据的飞速增长[11-12],miR-182-5p在NSCLC中的表达需要更新;既往研究揭示的miR-182-5p靶基因有限[13-15],但miRNA潜在靶基因众多,仍需进行深入研究。因此,本研究整合了多中心的大样本数据,尝试探索miR-182-5p在NSCLC中的表达情况及该分子在NSCLC的潜在靶基因,并探讨miR-182-5p在NSCLC中的临床意义以及潜在作用机制。
在GEO、ArrayExpress、SRA、Oncomine、TCGA以及各种文献数据库使用以下检索词获得RNA测序及基因芯片等相应高通量数据:(cancer or carcinoma or adenocarcinoma or tumor) and (lung or pulmonary or respiratory or NSCLC)。检索时间范围为2021年12月22日前。纳入标准为:(1)癌症组样本病理诊断为NSCLC;(2)每个芯片需包含NSCLC组和非癌对照组;(3)提供miR-182-5p的表达数据;(4)物种为人类。排除标准为:(1)用于分析的NSCLC样本或对照组样本数量小于3例;(2)细胞系样本;(3)体液等非组织样本。将所获得的各个数据集的miRNA表达值进行log2(x+ 1)变换,继而运用limma软件包[16]进行标准化。运用R语言(v4.1.0),将相同平台的数据集进行合并、去除批次效应(借助SVA软件包[17])后组成合并数据集。例如,将GPL11154平台下的GSE110907和GSE175462数据集重组后的合并数据集命名为GPL11154合并数据集。获取以上高通量数据后,将miR-182-5p表达值提取备用。在R语言(v4.1.0)中,采用Wilcoxon秩和检验对比两组间的miR-182-5p表达水平差异,P<0.05时差异有统计学意义。
除高通量技术外,逆转录定量聚合酶链反应(real time quantitative polymerase chain reaction,RT-qPCR)、印迹杂交检测、原位杂交及扩增克隆测序等技术也可以对组织内的miRNA表达进行检测。在多个数据库中检索2021年12月22日之前的报道并提取其中的miR-182-5p表达值及病例数,这些数据库包括PubMed、Cochrane Central Register of Controlled Trials、Web of Science、Google Scholar、EMBASE、Ovid、LILACS、Wiley Online Library、中国知网、重庆维普、万方数据及中国生物医学文献数据库。英文检索词: (cancer or carcinoma or adenocarcinoma or tumor) and (lung or pulmonary or respiratory or NSCLC) and (miR-182 or miRNA-182 or microRNA-182 or miR182 or miRNA182 or microRNA182 or miR 182 or miRNA 182 or microRNA 182 or miR-182-5p or miRNA-182-5p or microRNA-182-5p)。中文检索词:肺癌和miR-182-5p。纳入文献标准同高通量技术部分描述。
为了获取NSCLC中全面的miR-182-5p表达情况,将所有数据进行标准化均值差(standard mean difference,SMD)的计算以及绘制综合受试者工作特征(summary receiver operator characteristic,SROC)曲线。使用R语言(v4.1.0)计算SMD及95%置信区间(confidence interval,CI)。使用I2统计量检验法进行异质性检验,当研究存在显著异质性(I2>50%或P<0.1)时,使用随机效应模型,否则使用固定效应模型。同时,R语言(v4.1.0)还被用于绘制敏感性分析森林图以及检测发表偏倚的漏斗图(P>0.1提示未发现明显的发表偏倚)。使用Stata 15.0软件绘制评估miR-182-5p在NSCLC中的潜在诊断效能的SROC曲线、敏感度及特异度森林图。miR-182-5p在NSCLC中的潜在诊断效能根据曲线下面积(area under the curve,AUC)分为低效能(>0.5~0.7)、中效能(>0.7~0.9)及高效能(>0.9~1.0)。
使用miRWalk 3.0在线预测工具进行靶基因的预测,选取总评分≥1的基因作为预测靶基因。同时,课题组前期通过全面收集GEO、ArrayExpress、SRA和Oncomine等高通量数据库,收集包含肺腺癌(115个数据集)、肺鳞癌(98个数据集)和非癌对照肺样本基因表达矩阵的基因芯片和测序数据集进行SMD计算。基于肺腺癌数据集,具有SMD<0及其95% CI不包含0的基因被鉴定为肺腺癌低表达基因,并以相同方法筛选肺鳞癌低表达基因。肺腺癌低表达基因与肺鳞癌低表达基因交集所得的基因即为NSCLC低表达基因。因miR-182-5p在NSCLC中呈增高的趋势,本研究将预测获得的靶基因与NSCLC中低表达基因进行交集,缩小miR-182-5p在NSCLC中特异的潜在靶基因的范围。借助R语言(v4.1.0)的clusterProfiler软件包[18]对预测的潜在靶基因进行基因体论(gene ontology,GO)和京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,同时使用该程序包进行可视化。使用网络在线工具STRING (https://string-db. org)对miR-182-5p的潜在靶基因构建蛋白互作网络(protein-protein interaction network,PPI)。基于课题组前期准备的NSCLC相关的GPL6244测序数据集(包含LUAD-GSE31552、LUAD-GSE43458、LUSC-GSE30979、LUSC-GSE31552、LUSC-GSE44077以及LUSC-GSE50627数据集),运用Spearman相关系数的ρ值评估miR-182-5p与潜在靶基因与的表达相关性。
共有20个源自GEO数据库的数据集被纳入本研究(图1)。经过合并相同平台的数据集,最终形成17个数据集,含1 090例NSCLC及630例非癌肺组织样本。另外课题组使用RT-qPCR检测125例NSCLC组织及对应非癌肺组织miR-182-5p表达数据亦纳入分析[11]。在分析结果有统计学意义的9个数据集中,与对照组织相比,miR-182-5p表达在LUAD组织和LUSC组织中均高表达(P<0.05),RT-qPCR实验结果也表明miR-182-5p在NSCLC中表达水平升高(P<0.05)。见图2。此外,对各个数据集进行了SMD计算,以综合探讨miR-182-5p在NSCLC中的表达水平,结果显示,基于715例LUAD样本和380例对照样本,miR-182-5p在LUAD中表达上调[SMD=1.35(0.71~1.98)];基于250例LUSC样本和125例正常肺组织样本,miR-182-5p在LUSC中表达升高[SMD=1.31(0.54~2.08)]。RT-qPCR实验结果也证实了miR-182-5p在NSCLC中表达水平升高的现象[SMD=1.44(1.16~1.71)]。综合上述结果以及总SMD结果[(SMD=1.33(0.93~1.74)],与对照组相比,miR-182-5p在NSCLC组中高表达,且差异有统计学意义(P<0.05)。见图3。
图1 miR-182-5p在NSCLC中表达数据集获取流程图
图2 miR-182-5p在NSCLC组织及其对照组织中的表达量
A中森林图表明LUAD组、LUSC组及NSCLC组的miR-182-5p表达水平比各自对照组更高;B中敏感性分析提示剔除任何一个数据集后SMD仍有统计学意义,表明森林图的SMD结果稳健;C中漏斗图提示未发现SMD结果存在明显的发表偏倚。
18个数据集(含RT-qPCR)ROC曲线的AUC大小不一,表明miR-182-5p表达水平在不同数据集分析结果中显示出不同的NSCLC诊断效能(图4)。其中AUC>0.9的数据集有7个,分别是LUAD-GPL11154、LUAD-GSE51853、LUAD-GSE74190、LUSC-GSE16025、LUSC-GSE19945、LUSC-GSE51853以及LUSC-GSE74190,表明miR-182-5p具有显著地区分NSCLC组织和正常肺组织的效能。为了验证这一结果,绘制了SROC曲线。结果显示,miR-182-5p表达水平展示出很强的鉴别LUAD[AUC=0.95(0.92~0.96);敏感度和特异度均≥0.79](图5A)、LUSC[AUC=0.95(0.93~0.97);敏感度和特异度均≥0.86](图5B)两种NSCLC与正常肺组织的能力。基于LUAD、LUSC数据集与RT-qPCR的总SROC也支持了miR-182-5p的表达水平具有很强地区分NSCLC的能力[AUC=0.95(0.93~0.97);敏感度和特异度均≥0.81](图5C)。综上,无论是单纯的LUAD亚组、LUSC亚组,还是总体NSCLC,miR-182-5p的表达水平均显示出显著的NSCLC诊断效能。
图4 miR-182-5p在NSCLC组织中的表达ROC曲线以及曲线下面积
A为miR-182-5p区分LUAD与非癌肺组织的能力;B为miR-182-5p区分LUSC与非癌肺组织的能力;C为miR-182-5p区分NSCLC与非癌肺组织的能力。
经SMD计算,筛选出5 683个LUAD低表达分子以及5 703个LUSC低表达分子(SMD<0,95% CI不包含0)。通过miRWalk 3.0在线工具预测获取了5 122个预测靶基因。此外,基于NSCLC的RNA-Seq数据集筛选出1 869个miR-182-5p的负表达相关分子(Spearmanρ<-0.2,P<0.05)。将NSCLC低表达分子(即LUAD低表达分子和LUSC低表达分子)、预测靶基因以及miR-182-5p负表达相关分子取交集,获得165个miR-182-5p在NSCLC中的潜在靶基因(图6A)。
A为miR-182-5p潜在靶基因筛选;B为EPS15是Lysosome通路相关基因所组成的PPI网络的核心基因;C为miR-182-5p与EPS15表达存在负相关;D为潜在靶基因的GO功能分析;E为潜在靶基因的KEGG通路富集分析。
将165个miR-182-5p的潜在靶基因进行GO聚类分析以及KEGG通路分析,按照P值升序对GO的生物过程(biological process,BP)、细胞组成(cellular component,CC)、分子功能(molecular function,MF)以及KEGG通路分别进行排序,其中BP、CC、MF、KEGG各种富集方式排名首位的条目分别是negative regulation of cellular protein localization、endocytic vesicle、Sh3 domain binding及Lysosome信号通路(表1、图6D、图6E)。
表1 miR-182-5p潜在靶基因的各分类富集分析中显著的前5项条目
选择富集到KEGG结果排名第一的Endocytosis(内吞作用)通路的基因进行PPI网络构建,其中9个蛋白中,EPS15最有可能为PPI网络的核心基因(图6B)。据GPL6244测序数据集的分析结果,miR-182-5p与EPS15表达存在负相关性(ρ=-0.235,P=0.001)(图6C),提示EPS15很有可能是miR-182-5p的潜在靶基因。由此推断,miR-182-5p可能通过靶向EPS15而参与细胞内吞作用。
长期以来,肺癌的死亡病例未见明显下降,其死亡病例更是一直远高于其他肿瘤[5],致使该病成为威胁人类健康的重要因素。随着多种治疗手段如化疗、放疗、靶向治疗等在临床中逐渐得到广泛应用,肺癌患者的5 a生存率有所上升。然而,确诊延误、晚期治疗手段受限等问题导致肺癌患者总体生存率未得到明显改善[7],仍需探寻新的思路以提高对该病的诊治水平。NSCLC是最常见的肺癌病理亚型,占肺癌病例的80%,故聚焦于NSCLC的研究显得尤为重要。此前,miR-182-5p在多种肿瘤中显示出重要的临床意义,但其在NSCLC的表达水平及临床意义尚存争议。因此,本研究旨在探讨miR-182-5p在NSCLC中的表达水平、潜在的临床意义和分子机制,从而挖掘可能有助于NSCLC诊治的新生物标志物,为改善NSCLC乃至肺癌患者的预后提供新的思路。
miR-182-5p在NSCLC中高表达,且具有区分NSCLC组织和正常肺组织的能力。既往的大多数研究提示,与对照组织相比,miR-182-5p在NSCLC组织的表达水平上调[8-10]。然而,亦有报道提示与非转移性NSCLC细胞对比,转移性NSCLC细胞中可检测到miR-182-5p的低表达状态[19]。由此可见,有必要通过分析源自多中心的大样本数据来明确miR-182-5p在NSCLC中的表达水平。本研究在前期研究[11]的基础上进行了高通量数据和文献调研数据的更新整合,纳入了全球范围内多中心的1 470个样本,明确了miR-182-5p在NSCLC的2个最主要病理亚型(即LUAD和LUSC)中的表达水平比正常肺组织更高。同时,RT-qPCR实验数据也证实了miR-182-5p在NSCLC中表达上调的状况,进一步发现了miR-182-5p表达水平具有显著区分NSCLC组织与对照肺组织的能力,提示该分子具有筛检NSCLC患者的潜力。事实上,既往已有学者指出miR-182-5p可与数个miRNA分子联合组成具有早期诊断NSCLC效能的标志物[20]。本研究首次报道了单一的miR-182-5p分子具有显著的鉴别NSCLC的潜力。这一发现揭示了miR-182-5p在NSCLC的潜在临床意义,同时在一定程度上表明了本研究的新颖性。综合前述,miR-182-5p在NSCLC中表达上调,且该分子具有成为筛检NSCLC分子标志物的潜力。
高表达的miR-182-5p可能通过多种机制参与NSCLC的发生和发展。已有多项报道指出高表达的miR-182-5p可能促进肿瘤细胞增殖和抑制细胞凋亡,从而通过参与调控NSCLC细胞的生长继而影响NSCLC的发生和进展[21-22]。例如,Yang等[8]认为miR-182-5p可能通过调节Caspase 2的表达来调节NSCLC细胞的增殖和凋亡,且抑制miR-182-5p的表达可检测到NSCLC细胞的增殖抑制和凋亡增强。Zhang等[23]也基于细胞实验结果指出miR-182-5p在NSCLC的促癌作用。然而,亦有学者持相反观点,即认为miR-182-5p在NSCLC中发挥抑癌作用。其中,一项报道指出miR-182靶向NSCLC中的CTTN基因并抑制NSCLC细胞的伪足(赋予癌细胞侵袭能力)形成,从而抑制NSCLC转移[24]。无独有偶,Li等[19]也认为miR-182-5p的过表达抑制了NSCLC细胞的迁移和侵袭,并指出这可能与该分子促进E-钙黏素表达有关。由此可见,miR-182-5p在NSCLC中的生物学作用及其机制十分复杂,远未完全阐明。
本研究通过计算生物学方法,聚焦于miR-182-5p在NSCLC中的潜在靶基因,探索了miR-182-5p在NSCLC中的潜在分子机制。结果提示,miR-182-5p的潜在靶基因可能与细胞内蛋白定位的调控及细胞内吞作用的调控等生物学进程相关,参与构成内吞囊泡等细胞成分以及Sh3功能结构域(该结构域涉及细胞增殖、细胞运动等功能)结合等生物学功能。同时,KEGG信号通路结果也提示了miR-182-5p的潜在靶基因与细胞内吞作用信号通路相关。本研究还发现了miR-182-5p可能通过靶向该信号通路的EPS15(该分子已被证实参与内吞作用[25-26])而影响细胞的内吞作用。细胞内吞作用通常指受体介导下的内吞作用以及非受体介导的吞噬作用和吞饮作用,被认为是调节肿瘤细胞转移的关键途径,多种癌症转移抑制分子即通过内吞作用参与癌症转移的负调控[27-28]。基于此,并结合本研究结果,猜想NSCLC中的miR-182-5p高表达导致其潜在靶基因低表达,继而影响了细胞内吞作用,从而利于癌细胞的转移等生物学过程,但该猜想需要将来开展实验进一步验证。
本研究证实了miR-182-5p在NSCLC中的高表达状态,并揭示了该分子筛检NSCLC的潜力。此外,miR-182-5p可能通过影响细胞内吞作用而在NSCLC中发挥生物学作用,且EPS15可能是该过程中miR-182-5p的靶点。然而,miR-182-5p在NSCLC中的作用及分子病理机制非常复杂,仍需大量更深层次的研究。