张鑫利,李 毅
山西省运城市中心医院,山西 运城 043100
小细胞肺癌(Small Cell Lung Cancer)是肺癌的一种特殊类型,在所有肺癌亚型中恶性程度最高,分化程度最低。在全球范围内,小细胞肺癌占所有肺癌的15%,是全球男性癌症死亡的主要原因,也是女性癌症死亡的第二大原因[1]。令人遗憾的是,超过一半的小细胞肺癌患者在最初诊断时即显示出局部或远处转移,患者确诊后5年的生存率仅有7%[2]。引起小细胞肺癌的危险因素主要是吸烟[3],烟草致癌物诱导的小细胞肺癌有大量体细胞突变[4]。
由于小细胞肺癌对放化疗高度敏感,常采用全身化疗,并结合放疗和手术治疗。这种治疗可以降低小细胞肺癌患者的局部复发率,约25%的患者能够获得长期生存率和改善预后[4]。与非小细胞肺癌的治疗方法相比,小细胞肺癌的治疗选择在过去的40年中并没有明显的改善,也没有靶向治疗被批准。因此,阐明小细胞肺癌发病机制的进展可能是小细胞肺癌治疗方法发展的基础。探讨关键信号通路相关基因及其介导信号通路的发病机制是分析小细胞肺癌发生发展的重要过程,这可能有利于早期诊断及发现靶向治疗的分子标志物,也可能为治疗提供分子基础。
近年来,随着高通量测序的发展,生物信息学分析在生命医学领域得到了广泛的应用,已被广泛用于预测各种疾病的发生机制及潜在治疗靶点[5]。本研究借助基因表达综合(Gene Expression Omnibus,GEO)数据库,通过生物信息学分析进一步探究小细胞肺癌与正常组织之间的差异表达基因及相关的信号通路,蛋白互作(Protein-protein interaction,PPI)分析,以期从分子水平预测可能在小细胞肺癌疾病进展中发挥重要作用的相关基因,利用药物数据库筛选相关靶向药物,为小细胞肺癌发作的预防及靶向治疗提供新思路。
进入GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/),在搜索栏输入检索词“Small Cell Lung Cancer”,搜索后获得符合研究需求的基因表达芯片数据集GSE149507,由Ling Cai 等[6]于2020 年12 月上传至GEO 数据库的公共芯片数据集。GSE149507 以GPL23270 Affymetrix Human Genome U133 Plus 2.0 Array 为平台,通过全转录本微阵列芯片Microarray 将收集的肺组织样本进行基因表达分析,其中包含18对小细胞肺癌及配对癌旁组织样本。
将原始数据分Normal 组和Tumor 组,使用GEO2R 在线工具(https://www.ncbi.nlm.nih.gov/geo/geo2r/)对原始数据进行基因差异表达分析。差异基因以校正P<0.01,以|log2FC|>3 为上、下调基因的筛选标准。使用ggplot2绘制差异表达基因的火山图和热图。
提取上述筛选的差异表达基因,运用DAVID在线数据库[7](https://david.ncifcrf.gov/)进行背景为Homo sapiens的基因本体论(Geno ontology,GO)功能富集分析,其中包括生物过程(biological process,BP)、细胞组分(cellular component,CC)、分子功能(molecular function,MF);KEGG(kyoto encyclopedia of genes andgenomes)信号通路富集分析筛选相关的生物学通路,调整后以P<0.05 为阈值筛查差异基因的主要富集功能和通路。
在STRING(version 11.0)数据库[8](https://string-db.org/)的检索工具中上传上述筛选的差异表达基因,设置综合交互得分0.7 为显著性阈值。下载PPI 数据,使用Cytoscape对PPI网络进行可视化和关联性分析。采用MCODE插件对PPI 网络中的子模块进行分析,筛选出关键的蛋白表达分子。
以“CDK1”为关键词在Drugbank 数据库(https://www.drugbank.ca/) 和Herb 数 据 库[9](http://herb.ac.cn/)“Target name”项下,检索与CDK1相互作用的小分子化合物、中药及其单体化合物,作为小细胞肺癌的潜在治疗化合物。
在GEO2R 平台内对小细胞肺癌组(n=18)及其癌旁对照组(n=18)基因芯片数据进行分析,共获得10 676个差异基因,火山图如图1所示。以|log2FC|>3、P<0.01为筛选标准对所有基因进行筛选,最终获得153 个符合上述条件的基因,其中上调基因共104 个,下调基因共49个,见表1。排名前10的上调基因和下调基因,见图2。
图1 小细胞肺癌组与其癌旁对照组差异表达基因火山图
图2 差异表达最明显的前20位基因
表1 小细胞肺癌组与其癌旁对照组之间的差异表达基因
运用DAVID在线数据库对筛选得到的共同差异表达基因进行背景为Homo sapiens 的GO 富集分析和KEGG 信号通路富集分析。结果显示,差异基因富集到的BP 主要包括细胞分裂、有丝分裂姐妹染色单体分离和有丝核分裂等过程,见图3。在CC 方面,差异基因主要富集在纺锤体、染色体着丝粒和中间体等区域,见图4。而MF方面,则提示差异基因主要与微管结合、染色质结合等生物大分子的结合相关,见图5。在KEGG 信号通路富集分析中显示,差异基因的KEGG 通路主要涉及细胞周期通路和P53 信号通路等,见图6。
图3 差异表达基因GO生物学过程分析
图4 差异表达基因GO细胞组分分析
图5 差异表达基因GO分子功能分析
图6 差异表达基因KEGG信号通路富集分析
用STRING 对差异表达基因进行蛋白互作网络构建。并将得到的结果导入Cytoscape 软件对PPI 网络进行可视化分析与筛选。所得的PPI 网络如图7 所示。并利用Cytoscape 的MCODE 插件精确构建PPI 网络中关键基因模块,结果显示,共筛选出1 个关键基因模块,见图8。这表明了该模块内基因均与小细胞肺癌关系较为密切。进一步采用CentiScaPe 插件在该模块中筛选出与小细胞肺癌相关性最大的基因是CDK1。
图7 差异表达基因的PPI网络分析
图8 PPI网络中最显著的基因模块
以CDK1 为靶点在数据库中筛选潜在药物。Herb 数据库中一共有4个中药及9个中药单体作用于CDK1受体,包括草莓车轴草、大蒜和火炭母草等中药,还有葫芦素E、阿片碱和去氧地胆草素等中药单体。DrugBank数据库一共有9 个化学药物作用于CDK1 受体,包括Alsterpaullone、Alvocidib、 Hymenialdisine、 Indirubin-3'-monoxime、 Olomoucine、SU9516、AT-7519、Seliciclib和Fostamatinib。
本研究通过生物信息学分析,筛选出小细胞肺癌发生、发展过程中表达显著变化的153 个基因,对差异基因的GO 富集分析主要集中在细胞分裂、有丝分裂姐妹染色单体分离和有丝核分裂等过程,主要富集在纺锤体、染色体着丝粒和中间体等区域,提示差异基因主要与微管结合、染色质结合等生物大分子的结合相关。本研究通过KEGG 信号通路富集分析,发现与小细胞肺癌的发生发展相关的信号通路:细胞周期和P53 信号通路。细胞周期失调是肿瘤的关键特征之一。研究表明,在没有细胞周期阻滞时,DNA 损伤将无法修复,细胞将带着受损的DNA 进入有丝分裂,从而导致癌细胞死亡。肿瘤细胞必须突破控制细胞分裂的细胞周期阻滞。细胞周期调控相关基因在多种人类肿瘤中均有高表达,表明细胞周期在肿瘤发生、发展过程中发挥着重要作用。肿瘤抑制基因P53 是正常细胞中关键的细胞周期调节因子,在G1 和G2/M 期观察到P53在监测细胞周期中的调节作用。P53 基因在所有被发现的基因中与人类癌症病例的相关性排名第一,研究[10-11]发现50%的恶性肿瘤显示出P53 基因的突变,P53 异常表达可以导致肿瘤形成或细胞转化,而且是小细胞肺癌中最常见的基因突变。
研究通过STRING 进行蛋白互作网络分析,得到了最可能与小细胞肺癌的发生发展相关的基因CDK1。该蛋白属于Ser/Thr蛋白激酶家族的成员,在真核细胞周期控制中发挥重要的调节作用[12]。CDK1 是多效性最强的细胞周期调节蛋白,CDK1 在整个细胞周期中与9 种不同的细胞周期蛋白相互作用。这些与细胞周期蛋白的相互作用对于激活其激酶活性,以及下游蛋白的招募和选择都很重要[13]。因此,选择性抑制CCNB1 或CDKs 可以限制细胞周期的进展和/或诱导细胞凋亡。已有多项研究表明,P53 的下游分子包括CDK1,通过肿瘤细胞中的p53/Bax凋亡通路,抑制CCNB1 或CDK1 的表达可抑制肿瘤的发生发展[4,14]。因此,CDK1可能是抗肿瘤治疗的治疗靶点。
近年来,相对于非小细胞肺癌靶向药物发展迅速,小细胞肺癌靶向药物研究进展缓慢,难点在于尚未找到直接的治疗靶点[15]。因此,研究小细胞肺癌的治疗方案具有重要意义。基于网络药理学的分析为筛选和发现多靶点药物提供了一种新的方法[16]。研究通过网络药理学数据库发现,可以抑制CDK1 表达的潜在药物有:草莓车轴草、大蒜、火炭母草等中药,葫芦素E、阿片碱、去氧地胆草素等中药单体,Alsterpaullone、Alvocidib、Hymenialdisine等化学药物。有研究[17]报道,来源于火炭母草的酚类化合物抑制宫颈癌SiHa细胞生长和诱导其凋亡。多篇研究发现大蒜素可抑制肺癌细胞侵袭转移、增殖及诱导其凋亡[18-19]。同时,有研究[20]发现葫芦素E 通过靶向EGFR/MAPK信号通路对A549细胞具有抗增殖作用。在小鼠模型中,葫芦素E 可抑制Yes 相关蛋白信号通路并抑制人类非小细胞肺癌脑转移[21]。
综上所述,本研究通过对GEO 小细胞肺癌芯片数据GSE149507 进行生物信息学分析,发现P53 和细胞周期可能参与小细胞肺癌发生发展过程,这可能有助于了解小细胞肺癌发生的潜在机制。构建差异表达基因的PPI 网络,并鉴定了关键基因CDK1,并以此为靶点筛选治疗小细胞肺癌的潜在药物,为小细胞肺癌的治疗提供新的思路。