雌激素受体阳性乳癌lncRNA 的差异性表达研究

2021-07-22 09:45弭苗苗姜慧慧魏晓楠刘杰辛钰孙成铭
青岛大学学报(医学版) 2021年3期
关键词:基因芯片乳癌细胞株

弭苗苗,姜慧慧,魏晓楠,刘杰,辛钰,孙成铭

(1 青岛大学附属烟台毓璜顶医院检验中心,山东 烟台 264000;2 青岛市妇女儿童医院)

乳癌是目前导致女性癌症死亡的主要原因之一[1-2]。根据雌激素受体(ER)、孕激素受体(PR)和人表皮生长因子受体(HER2)的表达,乳癌被分为不同的亚型[3],其中ER 阳性乳癌约占75%。长链非编码RNA(lncRNA)是一种转录本长度>200个核苷酸的非编码RNA[4-5]。已有多项研究结果表明,lnc RNA 在多种癌症的发展和进程中起着重要的作用[6-8]。但目前关于ER 阳性乳癌中lnc RNA的生物学作用和功能却鲜见报道。本研究通过基因芯片技术与生物信息学分析相结合方法,筛选影响ER阳性乳癌预后的lnc RNA,并初步探讨其可能的作用机制,以期为ER 阳性乳癌的诊断、治疗提供参考。现将结果报告如下。

1 材料和方法

1.1 样本来源

2019年12月—2020年10月,选择在青岛大学附属烟台毓璜顶医院乳腺外科确诊并行乳癌切除术病人40例,均为女性,年龄33~70岁,平均(57.0±8.7)岁。符合以下纳入标准:①术前快速穿刺病理结果为浸润性乳癌;②术前均未接受放疗、化疗等针对肿瘤的治疗;③术中切除乳癌组织病理免疫组化结果示ER 阳性。排除标准:①既往有其他恶性肿瘤病史病人;②病理资料不完善者;③具有免疫系统疾病或高血压等全身疾病等病史病人。术中留取200~300 mg乳癌组织和距病灶边缘≥5 cm 的癌旁正常组织,放入冻存管后置于液氮中保存。本研究经医院伦理委员会审批通过。

1.2 基因芯片表达谱的构建及差异基因的筛选

在40例ER 阳性乳癌标本中选取4对癌组织及其癌旁正常组织标本,应用CapitalBio Technology Human LncRNA Arrayv4,4×80 K 基因芯片(北京博奥晶典生物技术有限公司提供),分别检测lncRNA 及mRNA 的差异性表达;4 例均为女性、绝经后、单侧发病乳癌病人,术后病理为浸润性导管癌Ⅱ级,免疫组化结果提示ER 阳性率>80%、Ki-67阳性率≥14%,临床确诊为Luminal B 型乳癌。使用Trizol方法(Invitrogen,USA)从4对样本中提取总RNA,应用NucleoSpin®RNA clean-up 试剂盒(MACHEREY-NAGEL,德国)进行纯化,用Nanodrop定量检测纯化后总RNA 的浓度及纯度,并用琼脂糖凝胶电泳检测其完整性。使用First Strand Enzyme Mix合成First strand cDNA,再用Second Strand Enzyme Mix 将其转化为Second Strand cDNA,通过CbcScriptⅡ酶进行反转录并进行纯化,最后以Random Primer为引物,用Klenow Fragment酶合成c DNA 互补链并掺入带有荧光基团的d NTP,再次纯化后定量标记产物用于芯片杂交,标记过程采用晶芯®生物芯片通用标记试剂盒。用Agilent Feature Extraction(v10.7)软件对杂交图片进行分析并提取数据,然后使用Agilent Gene-Spring软件对数据进行归一化和差异分析,以差异倍数FC≥2、P<0.05 为显著差异表达的lncRNA及mRNA 的筛选标准。lncRNA 及mRNA 的参考数据库主要为Ensemble数据库。

1.3 差异聚类分析

通过对4对乳癌病人的癌组织及其癌旁正常组织进行基因芯片检测,对具有差异表达的lncRNA及mRNA 进行监督聚类分析,以展示不同组织样本中所测基因的表达情况;通过监督聚类分析反映样本和基因间的相似性,观察各组织样本的表达模式相关性及离群样本的存在情况。

1.4 基因注释富集分析

对于通过基因芯片技术检测到的m RNA 中差异表达基因分别进行GO、KEGG 通路富集分析及疾病注释富集分析。GO 富集分析又分为细胞学组件、生物学途径、分子功能3个部分,对筛选出的具有差异表达的m RNA 通过富集分析,预测其在乳癌疾病发生、发展中可能发挥的作用途径。

1.5 lnc RNA与m RNA的共表达分析

共表达分析是以相关性为基础,从基因表达层面寻找表达谱相似的lncRNA-m RNA 关系对。其方法为以各个探针在各个样品中的标准化后信号值作为数据源进行两两相关性计算和假设验证,采用Pearson相关性分析计算相关系数(r)和P值。筛选标准为:r>0.99或<-0.99,且P<0.05。

1.6 q RT-PCR 方法验证ER 阳性乳癌组织及癌旁组织中lncRNA 的表达

为验证基因芯片结果的可靠性,在收集的40对ER 阳性乳癌癌组织和癌旁正常组织(包括进行芯片检测的4对组织),选择芯片结果中表达差异倍数最大的7 个lnc RNA 应用qRT-PCR 方法进行验证。通过Trizol法提取组织的总RNA,按照说明书方法使用HiScript®Ⅲ1stStrand cDNA Synthesis Kit(+gDNA wiper)试剂盒将从组织中提取的总RNA反转录成cDNA,然后使用Cham Q Universal SYBR qPCR Master Mix进行qRT-PCR,内参照基因为U6。反应完成后,应用溶解曲线确定引物特异性,使用2-ΔΔCt法计算lncRNA 的相对表达量。其中PCR 引物由Thermo Fisher公司合成,其序列见表1。

表1 PCR 引物及其序列

1.7 qRT-PCR 验证ER 阳性乳癌细胞株MCF-7中lnc RNA 的表达

乳癌细胞株MCF-7(由青岛大学附属烟台毓璜顶医院中心实验室馈赠)培养在含体积分数0.10胎牛血清DMEM 培养基中,正常乳腺上皮细胞MCF-10A(购于赛百慷(上海)生物技术股份有限公司)培养在专用完全培养基中,并分别加入10 g/L青链霉素双抗。细胞培养瓶置于含体积分数0.05 CO2的37 ℃培养箱中。应用TRIZOL 法提取MCF-7 及MCF-10A 的总RNA,逆转录后应用q RT-PCR 方法检测LINC01614、AC044784.1、CTD-2510F5.4等lncRNA 在细胞中的表达水平。

1.8 lncRNA 表达与乳癌疾病预后关系分析

通过TCGA 在GDC 数据库中下载相关数据,筛选出ER 阳性的乳癌病人共791例,根据病人的lncRNA 的表达水平进行分组,以平均值为界分为高表达组和低表达组;通过R 语言编辑器进行转换包“survival”;对所选择的lncRNA 行Kaplan-Meier曲线分析,与疾病预后的关系使用long-rank 检验进行分析。

1.9 统计学方法

应用Graph Pad Prism 8软件进行统计学分析。计量资料结果以形式表示,数据间比较采用t检验。以P<0.05为差异有统计学意义。

2 结果

2.1 ER 阳性乳癌组织中m RNA 以及lnc RNA 的表达

通过基因芯片技术在4对ER 阳性乳癌组织及癌旁正常组织中共筛选出3 949个具有差异表达的m RNA,其中,在癌组织中差异表达上调的m RNA有2 448个,差异表达下调的有1 501个,上调最明显及下调最明显的m RNA 为CST2 和CSF3,FC值分别为70.3和-14.4。用同样的方法在癌组织中共筛选出4 050个具有差异表达的lncRNA,其中有1 589个lncRNA 差异性高表达,而显著性低表达lncRNA 有2 461个。将差异表达的m RNA 以及lncRNA 标准化数据分别制作成聚类图(图1)。按差异倍数排序,选取前7位差异表达的lncRNA进行验证。见表2。

图1 ER阳性乳癌组织中lncRNA和mRNA差异表达谱

表2 按差异倍数排序前7位的差异表达lncRNA

2.2 m RNA 的功能分析

通过GO、KEGG 及疾病富集通路分析,选取排名前30个最明显富集的通路来进一步预测具有差异表达的m RNA 的功能。GO 细胞学组件分析显示,具有差异表达的m RNA 多分布在核小体、DNA包装复合体、蛋白质-DNA 复合体、细胞外基质、细胞外膜、细胞质膜等(图2A);GO 生物学功能分析表明,差异表达m RNA 生物学过程主要在细胞黏附、生物黏附、核小体装配、单细胞黏附、DNA 包装、染色体聚集等富集明显(图2B);GO 分子功能分析显示,具有差异表达的m RNA 可能涉及的致病机制及通路极其丰富,如蛋白质异二聚体活性、糖胺聚糖结合、蛋白质二聚体活性、细胞黏附分子结合、MHC Ⅱ类受体活性等(图2C)。KEGG 富集通路分析显示,m RNA 主要通过T 细胞激活、整合素信号通路、血液凝固、纤溶酶原级联激活、FAS信号通路、半胱氨酸的生物学合成等在乳癌疾病的发生、发展中发挥作用(图3A);疾病富集通路分析显示,在ER 阳性乳癌中具有差异表达的m RNA 主要在免疫系统疾病、过敏及自身免疫疾病、埃-当二氏综合征、骨骼肌疾病、成骨不全病、原发性免疫缺陷病中明显富集(图3B)。

图2 GO富集通路分析

2.3 差异表达的lnc RNA 与m RNA 的相关性

通过对差异表达的lncRNA 及m RNA 进行共表达分析,共筛选出关联度最大的前1 000个关系对,用Cytoscape软件绘制其网络图,见图3C。对网络图分析显示,WDR55、CEP85、OR5L2、GRIK2等mRNA 和众多具有差异表达的lncRNA 存在显著相关性。

图3 KEGG和疾病富集通路分析及lncRNA与mRNA的共表达分析网络

2.4 q RT-PCR 验证

基于基因芯片筛选具有差异表达的lncRNA,选择了差异表达最大的前7个,应用q RT-PCR 方法对40例ER 阳性乳癌组织及癌旁正常组织进行进一步验证,结果显示LINC01614(t=10.380,P<0.01)、AC044784.1(t=3.490,P<0.01)、CTD-2510F5.4(t=3.235,P<0.01)共3个lncRNA 在癌组织中表达较癌旁正常组织上调,与本研究芯片结果一致;CTD-2116N17.1、KIAA0101、linc-BCL2A1-3、AL365436.2 lnc RNA 虽然在乳癌组织中表达上调,但差异无统计学意义(P>0.05)。见表3。将上述具有差异性高表达的3个基因在ER 阳性乳癌细胞株MCF-7及正常乳腺上皮细胞MCF-10A 中验证,结果显示LINC01614(t=3.714,P<0.05)、AC044784.1(t=5.827,P<0.01)、CTD-2510F5.4(t=4.415,P<0.05)在乳癌细胞株MCF-7中同样具有显著性高表达。见表4。

表3 ER 阳性乳癌组织及癌旁组织lncRNA表达结果比较(n=40,)

表3 ER 阳性乳癌组织及癌旁组织lncRNA表达结果比较(n=40,)

表4 lncRNA 在乳癌细胞株MCF-7 和正常乳腺细胞MCF-10A中的差异性表达(n=3,)

表4 lncRNA 在乳癌细胞株MCF-7 和正常乳腺细胞MCF-10A中的差异性表达(n=3,)

2.5 lncRNA 与ER 阳性乳癌预后的关系

根据Kaplan-Meier生存曲线法,在纳入791例ER 阳性乳癌病人中,将LINC01614、AC044784.1、CTD-2510F5.4在ER 阳性乳癌病人的表达水平与疾病的总存活率进行相关性分析。研究结果显示,LINC01614表达水平的高低与疾病的预后生存显著相关(χ2=7.50,P<0.01),LINC01614表达水平低的病人较LINC01614表达水平高者具有更长的无病生存期(图4)。

图4 不同LINC01614 表达水平ER 阳性乳癌病人Kaplan-Meier生存曲线

3 讨 论

本文研究通过基因芯片技术,选取4例较Luminal A 型乳癌预后更差、恶性程度更高的Luminal B型乳癌组织及其癌旁正常组织,筛选ER 阳性乳癌具有差异表达的m RNA 及lncRNA,结果显示,上调及下调最明显的m RNA 为CST2 和CSF3。已有研究通过对6对乳癌的癌组织及癌旁组织进行转录组的高通量测序,证实CST2基因在乳癌组织中高表达,并推测可能与ECM-受体相互作用信号相关[9-10],但其具体作用机制尚有待进一步研究证实。CHEN 等[11]对MCF-7乳癌细胞株进行成骨细胞培养基(OCM)及未分化成骨细胞条件培养基对照培养,然后用细胞因子抗体阵列进行筛选,结果显示OCM 处理的MCF-7 细胞株中CSF3 表达显著性上调,且OCM 和乳癌细胞的迁移相关,推测CSF3可能与乳癌的远处骨转移有关。

对于本文组织验证所选取的7 个lncRNA,后续通过对TCGA 数据库中乳癌数据分析显示,它们均在乳癌组织中具有差异性高表达,与本文芯片结果相吻合。有研究者通过TCGA 数据库对837个浸润性乳癌组织及105个正常组织的lncRNA 基因谱进行分析,结果显示LINC01614在PR 阳性、ER阳性和HER2阳性乳癌高表达,而在三阴性乳癌中呈现低表达,即在Luminal B/HER2阳性亚型乳癌中具有高表达;并通过生物信息学和通路分析发现,LINC01614可能通过TGFβ和FAK 信号的调控在乳癌疾病中发挥作用[12]。本研究基因芯片检测结果同样提示,LINC01614在ER 阳性乳癌组织中具有差异性高表达,并且后续在ER 阳性乳癌组织及细胞株中得到验证;LINC01614可能成为预测ER阳性乳癌病人整体生存期的预后标志物,并在临床中对判断预后和预测乳癌的治疗效果可能存在价值。另外有研究指出,KIAA0101在乳癌中起着中心体数目调节剂的作用,敲低该基因可通过促进乳癌中p53/Sp1复合物的形成来抑制细胞增殖和细胞周期的进程[13],并推测该基因可能与雌激素的表达相关[14-17]。本文基因芯片技术检测的研究结果也证实,KIAA0101在ER 阳性乳癌中同样具有高表达;后续组织验证结果提示该lncRNA 在癌组织中虽有高表达,但差异无统计学意义。究其原因,可能为组织标本个体差异性大,导致结果出现偏差。

综上所述,本文证实LINC01614、AC044784.1、CTD-2510F5.4在ER 阳性乳癌组织及细胞中具有显著性高表达。而LINC01614 在ER 阳性乳癌组织中的高表达可能与预后不良有关,其具体的细胞功能及作用机制需要进一步研究。这些在ER 阳性乳癌组织中差异表达的lnc RNA 可能作为新型的生物标记物,为疾病的诊断及治疗提供新的方向。

猜你喜欢
基因芯片乳癌细胞株
安罗替尼对肺腺癌细胞株A549放射敏感性的影响及机制
miR-21负向调控宫颈癌HeLa细胞株中hTERT的表达
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
槲芪癥消汤对人肝癌细胞株HepG2.2.15增殖和凋亡的影响
基因芯片技术在生物研究中的应用进展
不健康的饮食习惯易致乳癌吗?
基因芯片快速检验细菌的临床应用
慢病毒载体法建立乳腺癌GFP-ST3稳定细胞株
LAMP联合基因芯片技术在肺炎衣原体检测中的应用
警惕男性乳癌