肺腺癌关键基因的鉴别及预后

2022-02-14 09:57黄河李成长彭燕姜洪波
中国老年学杂志 2022年1期
关键词:差异基因腺癌关键

黄河 李成长 彭燕 姜洪波

(1新乡市中心医院(新乡医学院第四临床学院)呼吸与危重症医学科一,河南 新乡 453000;2新乡医学院基础医学院生理学与病理生理学系;3新乡医学院第三附属医院营养科)

肺癌是临床常见的恶性肿瘤,是全球范围内癌症相关死亡的主要病因。肺癌分为小细胞肺癌(SCLC)和非小细胞肺癌(NSCLC), 肺腺癌是最常见的NSCLC亚型〔1〕。肺腺癌的发病率为(283~ 489)/10 万人。 尽管癌症治疗取得了进展,但肺腺癌的5年生存率仅为14.6%〔2〕。肺腺癌初期症状不明显,往往容易被忽视,等疾病症状明显时已经处于晚期。晚期的治疗手段有放疗、化疗、免疫检查点抑制剂治疗和分子靶向治疗等,其中分子靶向治疗是晚期肺腺癌的一个重要的治疗手段。阿来替尼和吉非替尼是晚期肺腺癌治疗的常见分子靶向药物。尽管这两种药物上市时间相差近20年,但临床研究发现两者在腺癌患者中都出现了不同程度的耐药〔3,4〕。出现这种现象的原因是肿瘤具有异质性,在不同空间和时间条件下,即使同一种肿瘤其生物学特性也会有很大不同〔5,6〕。基于此,需要开发更多的分子靶向药物对不同亚型的肺腺癌进行治疗。

为探索有效的肺腺癌分子治疗靶标,许多学者就该病的发病机制开展了大量探索。Yuanhua 等〔7〕的研究发现角蛋白16过表达通过促进上皮-间质细胞转化诱发肺腺癌,角蛋白16因此可作为肺腺癌发生发展及预后标志物。Yerukala 等〔1〕利于优化支持向量的方法对miRNA表达谱芯片进行分析,结果发现了18个miRNA肿瘤标志物,这些标志物与腺癌的发生密切相关。Richardson等〔8〕的研究表明波形蛋白是成纤维细胞活动导致肿瘤细胞侵袭所必需的物质,它通过肿瘤细胞-成纤维细胞的相互作用参与肺腺癌转移。综上,肺腺癌方面的研究很多,每个学者都强调自己所研究的信号分子可作为肺腺癌分子治疗的靶标,但癌症是一种多因素诱发多基因突变引起的疾病,参与其发生发展的基因很多,要从大量信号分子中找到关键作用的靶标仍然是一件非常困难的事,传统的动物实验方法效果不佳,只能揭示该疾病发生发展的冰山一角。基于此,本课题利于生物信息学方法构建导致腺癌发生发展的蛋白互作网络,利用图论的相关算法寻找肺腺癌发病的关键基因。

1 材料与方法

1.1基因表达数据的获取 基因芯片表达数据集(GSE10072)来源于基因表达数据库(GEO,http://www.ncbi.nlm.nih.gov/geo/),实验样本取自肺腺癌组织(58例)和正常组织(49例),实验平台是GPL96(HG-U133A:Affymetrix Human Genome U133A Array)。

1.2差异基因分析 差异基因分析使用GEO提供的在线工具GEO2R(https://www.ncbi.nlm.nih.gov/geo/geo2r/)完成,该工具基于R语言的limma包和GEOquery包比较肺腺癌组织与正常肺组织的基因表达差异, 研究结果为根据显著性差异排序的基因列表。P<0.05且|Log2FC|>1为表达显著性变化的差异基因的筛选标准。

1.3差异基因的富集分析 用DAVID(http://david.abcc.ncifcrf.gov/)基因在线富集分析工具对所有差异基因进行基因本体论(GO)与京都基因与基因组百科全书(KEGG)富集分析。GO富集分析主要包括GO生物过程(biological process)、细胞组成(cellular component)和分子功能(molecular function)3个方面。KEGG富集分析主要对经典的生物学通路进行富集分析。

1.4利用STRING数据库构建差异基因的蛋白互作网络 STRING数据库(https://string-db.org/cgi/input.pl)是一个可用于搜寻蛋白质之间相互作用关系的数据库。互作关系的依据来源于实验数据、生物信息学方法预测及PubMed文献信息的数据挖掘。差异基因的蛋白互作网络构建比较简单,登陆STRING数据库,数据输入采用Multiple Proteins模式,参数均采用默认数值,可信度为0.40,物种为人。输入所有差异基因相应的基因名,即可生成蛋白互作网络。

1.5关键基因的鉴别 将STRING数据库所生成的互作网络数据导出,利用Cytoscape软件对互作网络进行可视化,CytoHubba是Cytoscape软件的一个插件,集成了11种可用于关键基因选择算法,这些算法分别基于节点的连接度(degree)、边缘渗出组件(EPC)、最大邻居组件(MNC)、最大邻居组件的密度(DMNC)、最大团中心性(MCC)、瓶颈值(BN)、紧密度(closeness)、偏心度(Eccentricity)、应力(stress) 、发散性(radiality)和中介性(betweenness)等进行关键基因的鉴别。研究表明MCC法准确度相对更佳,本课题因此采用MCC算法分析网络的拓扑结构,进而选取排名前十位的基因即关键基因。

1.6生存分析 生存分析(Survival analysis)是研究疾病影响因素与生存时间和结果相关关系的数据分析方法。肿瘤基因的生存分析使用Kaplan Meier plotter( http://kmplot.com/analysis/)在线工具完成,该数据库包含10 461个癌症及存活样本的数据,可用于评估54 675个基因对患者生存时间的影响。为研究MCC算法所选取的关键基因对预后是否有影响,本研究所选取的关键基因都利用该分析工具进行生存分析,数据分析参数均采用网站默认数值。

2 结 果

2.1差异表达基因 对58例肺腺癌和49例正常肺组织样本进行基因表达的差异分析,共产生855个差异基因,其中有558个下调基因,297个上调基因。

2.2GO和KEGG富集分析 肺腺癌和正常肺组织差异表达基因的 GO 富集分析结果显示:显著富集的生物学过程包括细胞黏附、细胞外基质组织、白细胞迁移、对药物的反应、胶原分解代谢过程、对机械刺激的反应、对雌二醇的反应、对缺氧的反应、血管生成和基因表达的正调节。与肺腺癌发生相关的显著富集细胞组分有:细胞外空间、细胞外泌体、蛋白质性细胞外基质、细胞表面、细胞外区域、细胞外基质、细胞表面质膜的整体成分、胶原蛋白三聚体、膜筏和质膜。GO分子功能显著富集于肝素结合、蛋白质结合、蛋白质同源二聚化活化、钙离子结合、整合素结合、相同蛋白的结合、转录激活因子活化、RNA聚合酶Ⅱ核心启动子近端区序列特异性结合、蛋白激酶结合、肌动蛋白结合 。KEGG富集分析显示显著富集的生物学通路包括阿米巴病、癌症途径、细胞周期、磷脂酰肌醇-3激酶(PI3K)-蛋白激酶B(Akt)信号通路、细胞黏附分子通路、黏附斑通路、p53信号通路、蛋白消化与吸收、细胞外基质(ECM)-受体互作、补体与凝血级联通路。

2.3差异基因蛋白质互作网络的构建 利用显著富集在GO生物过程的相关差异基因,构建蛋白质互作网络,所构建网络节点数为334、边数为1 962、平均节点度为11.7、局部聚类系数为0.434、PPI富集P<0.001。见图1。图中节点代表蛋白,节点之间的连线代表蛋白之间的有直接互作关系。

图1 利于数据库构建的差异基因蛋白质互作网络

2.4关键基因选取 基于MCC算法对差异基因构建的蛋白互作网络的拓朴结构进行分析,连接度排名前十的基因,即我们选取的10个关键基因分别是:细胞周期蛋白(CCN)B1、纺锤体检测点蛋白(BUB1B)、极光激酶(AURK)A、生存素(BIRC5)、Xklp2靶蛋白(TPX2)、胞质分裂蛋白调节因子(PRC)1、细胞周期有丝分裂纺锤体检测点丝/苏氨酸激酶(BUB1)、有丝分裂阻滞缺陷2样蛋白(MAD2L)1、着丝粒蛋白(CENP)F和周期素依赖性激酶抑制因子(CDKN)3。见图2。

这些节点为根据MCC算法选取的关键基因,颜色越深,代表基因的重要度越高,颜色越浅,代表基因的重要性越低图2 基于MCC算法所选取的关键基因

2.5生存分析 利用Kaplan Meier生存分析分别对选取的10个关键基因进行分析,结果表明这些基因高表达,肺癌患者的总体存活时间显著缩短(P<0.05)。见图3。

图3 关键基因的Kaplan Meier生存分析结果

3 讨 论

本课题分析的差异基因均是与肺癌的发生与发展密切相关,10个关键基因的过表达与患者生存时间显著减少密切相关。Gao等〔9〕利用生物信息学方法结合实时定量PCR发现CCNB1、CCNB2、CCNA2、神经元PAS结构域蛋白(NPAS)2、鸟嘌呤核甘酸结合蛋白γ-7(GNG7)、几丁质酶(CHIA)和葡萄糖转运体(SLC2A)1是肺腺癌发生发展的关键基因,最重要的基因CCNB1跟本研究一致,但其余的基因明显不同,肿瘤的空间和时间异质性是造成这种差异的重要原因。Chen等〔10〕的研究发现BUB1B基因敲除可抑制肺腺癌离体细胞系的增殖。Song等〔11〕的研究表明BUB1B可能是肺腺癌发生发展的关键基因,目前尚未发现BUB1B在体方面的临床研究。Zhang等〔12〕研究表明AURKA和TPX2的mRNA水平升高与吸烟相关肺腺癌的预后不良相关。Cao等〔9〕研究表明BIRC5在肺腺癌中的表达显著上调并与患者的预后明显相关。Zhan等〔13〕研究表明PRC1可能通过Wnt/β-catenin信号传导途径参与肺腺癌的肿瘤发生。He等〔14〕通过基因集富集分析和荟萃分析显示BUB1是调节和控制肺腺癌预后的关键基因。Shi等〔15〕发现MAD2L1对肺腺癌的预后具有重要的意义。整合分析发现CENPF和BUB1B在肺腺癌的发生和发展中可能发挥了重要的作用,并具有一定的预后价值〔11〕。细胞和组织水平的研究表明CDKN3可能通过促进有丝分裂活性增强,引起肺腺癌的发生〔16〕。

综上,本课题研究的肺腺癌关键基因跟此前的报道既有相同之处,又有区别,肿瘤具有异质性可能是造成本研究与前人成果差异的重要原因。本课题所筛选肺腺癌的关键基因大多数都得到前人研究结果的支持,这些关键基因高表达与肺腺癌患者较差的预后有明显的相关性,这些关键基因的发现将为肺腺癌治疗药物的开发提供新的重要分子靶标。

猜你喜欢
差异基因腺癌关键
硝酸甘油,用对是关键
云南地区多结节肺腺癌EGFR突变及其临床意义
十二指肠腺癌88例临床特征及相关预后因素
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
高考考好是关键
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
术后抗幽门螺杆菌治疗对Ⅲ期贲门腺癌预后的研究
SSH技术在丝状真菌功能基因筛选中的应用
蒋百里:“关键是中国人自己要努力”