非小细胞肺癌组织中CAV1表达与患者预后的相关性*

2022-07-08 07:40杨凯杨明苏学会温辉单娜
贵州医科大学学报 2022年6期
关键词:差异基因肺癌数据库

杨凯,杨明,苏学会,温辉,单娜

(秦皇岛市第二医院 呼吸科,河北 秦皇岛 066600)

原发性肺癌(简称肺癌)是全世界发病率、死亡率最高的恶性肿瘤之一[1-2],占癌症相关死亡人数近五分之一[3]。按照病理形态的不同,肺癌可以分为非小细胞肺癌(non-small Cell Lung Cancer,NSCLC)和小细胞肺癌,其中NSCLC最为常见,约占肺癌总发病率的80%,此类患者总体预后较差[4]。NSCLC的肿瘤标志物主要有癌胚抗原(carcino-embryonic antigen,CEA)、糖类抗原125、鳞状上皮细胞癌抗原(squamous cell carcinoma antigen,SCC-Ag)等蛋白[5-6],但目前在临床上仅对不到百分之一的肿瘤标志物进行了相关研究,绝大部分肿瘤标志物目前还未进行系统的临床验证。所以,进一步筛选出灵敏度高、特异性高的新型标志物,可以帮助医生在第一时间掌握病人的病情,为尽早治疗奠定良好基础[7-10]。随着大数据的快速发展,肿瘤相关的组学数据不断累积、更新,为科研人员研究肿瘤发病机制、医生临床诊治提供了数据支持[11-12]。本研究首选通过基因表达汇编(gene expression omnibus,GEO)数据库和肿瘤基因组图谱(the cancer genome atlas,TCGA)数据库筛选出NSCLC中的差异表达基因,对100例NSCLC临床样本行进一步验证分析,以期找到肺癌的新型预后标志物。

1 资料与方法

1.1 差异基因、核心基因的筛选与分析

1.1.1数据收集及差异基因的筛选 在GEO数据库中选择GSE19804芯片数据,分为NSCLC组织和癌旁组织,每组各60个样本,该数据由Lu等[13]提供。利用R语言中“limma”以及“impute”包对芯片数据进行处理分析,进行贝叶斯显著性检验,以LogFC(Fold Change)绝对值>1且P<0.01作为显著性差异表达,对差异基因进行聚类分析、制作热图。

1.1.2蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络构建及核心基因筛选 利用STRING网站(http//string-db.org/),以medium confidence>0.4为条件构建差异基因的蛋白互作网络,利用Cytoscape软件中CentiScape和MCODE插件,对PPI网络进行可视化处理,分析基因网络节点的连接度,得到连接度较高的关键基因。

1.1.3核心基因与NSCLC患者预后的关系分析 利用TCGA数据库,通过Firehose网站和cBioPortal肿瘤基因组网站下载数据,保留其中含有完整临床数据和生存数据的994例NSCLC患者肿瘤组织样本和301例NSCLC患者癌旁组织样本所对应的临床病理数据以及预后数据,分析核心基因与临床NSCLC患者生存期的关系,核心基因在男性NSCLC患者和女性NSCLC患者肿瘤组织中的表达水平差异,核心基因在NSCLC患者肿瘤组织与癌旁组织中的表达水平差异,以及核心基因与肿瘤增殖、转移相关基因[增殖标志蛋白Ki-67基因(proliferation marker protein Ki-67 gene,MKI67)、转移标志蛋白波形蛋白基因(vimentin gene,VIM)]表达水平的关系。

1.2 检测核心基因相关蛋白的表达

1.2.1材料、主要试剂与仪器 NSCLC患者肿瘤组织和相应癌旁组织由课题组前期收集;CAV1蛋白抗体、二抗购于英国Abcam公司,石蜡包埋机、切片机为德国Leica公司产品,正置显微镜为日本Olympus公司产品。

1.2.2分组 收集100例NSCLC患者,分为NSCLC组织组和癌旁组织组,男53例、女47例,年龄31~75岁、平均(58.94±12.06)岁,肺腺癌64例、肺鳞癌36例。本研究获得病人及家属知情同意,且符合《世界医学协会赫尔辛基宣言》相关要求。纳入标准:(1)参照NSCLC的相关诊断标准;(2)首次确诊;(3)经细胞学或组织病理学证实为NSCLC;(4)预计生存时间超过3个月;(5)入院前未接受过相关抗肿瘤治疗;(6)无其他重要脏器功能障碍。排除标准:(1)合并脑转移;(2)病灶无法测量者;(3)妊娠期或哺乳期女性;(4)先前有或继发性恶性肿瘤;(5)曾接受过放化疗或免疫治疗;(6)有精神病史;(7)合并血液系统疾病。

1.2.3检测Caveolin1表达 取两组组织标本,经石蜡包埋、切片(厚度<5 μm,长度<10 μm)、固定、漂洗、脱水、透明、透蜡、包埋、整修、切片(厚度4 μm),利用免疫组织化学法检测小窝蛋白1(Caveolin1)的表达。

1.3 统计方法

2 结果

2.1 差异基因的筛选

利用R语言中“limma”安装包对芯片数据进行处理分析,以|LogFC|>1且P<0.01为筛选阈值,在NSCLC组织和癌旁组织中共筛选出256个差异基因,其中上调的基因有206个,下调的基因有50个,见图1。

注:A为差异基因火山图;B为差异基因聚类热图,红色点代表高表达的基因、蓝色点代表低表达的基因。图1 NSCLC组织和癌旁组织的差异基因分析Fig.1 Differential gene analysis of normal tissues and lung cancer tissues

2.2 PPI网络构建及核心基因筛选

PPI图中共有102个节点,连接线198个,见图2。通过Cytoscape软件中的CentiScape和MCODE插件进行分析,得到其中连通度最高的14个基因,分别是白细胞介素6基因(interleukin-6 gene,IL6)、α1-Ⅰ型胶原基因(alpha-1 type Ⅰ collagen gene,COL1A1)、鸟嘌呤核苷酸结合蛋白γ11基因(guanine nucleotide-binding protein gamma-11 gene,GNG11)、富亮氨酸重复激酶2基因(leucine-rich repeat kinase 2 gene,LRRK2)、DNA拓扑异构酶2α基因(topoisomerase Ⅱ alpha gene,TOP2A)、钙黏蛋白5基因(cadherin-5 gene,CDH5)、CXC受体2基因(CXC receptor 2 gene,CXCR2)、小窝蛋白1基因(caveolin1 gene,CAV1)、血小板碱性蛋白基因(platelet basic protein gene,PPBP)、金属蛋白酶组织抑制因子1基因(metalloproteinase inhibitor 1 gene,TIMP1)、血小板反应蛋白受体基因(thrombospondin receptor gene,CD36)、血小板反应蛋白2基因(thrombospondin 2 gene,THBS2)、CXC配体2基因(CXC ligand 2 gene,CXCL2)、基质金属蛋白酶1(matrix metallopeptidase 1 gene,MMP1),见表1。选择其中核心基因CAV1进行后续研究。

注:图中面积越大连接度越高。图2 差异基因的PPI分析Fig.2 PPI analysis of differential genes

表1 PPI网络中前14的核心基因Tab.1 List of 14 genes with the highest degree of connectivity

2.3 CAV1基因表达与NSCLC患者生存期分析

TCGA数据库数据分析显示,NSCLC肿瘤组织中高表达CAV1的肿瘤患者生存期短于低表达CAV1的肿瘤患者(P<0.05),见图3。NSCLC肿瘤组织中,不同性别间CAV1基因表达量比较,差异无统计学意义(P>0.05),见图4A;与癌旁组织比较,NSCLC 肿瘤组织中CAV1表达量明显升高,差异有统计学意义(P<0.01),见图4B。CAV1与MKI67、VIM的表达均呈正相关(R=0.15,P<0.05;R=0.29,P<0.05),说明CAV1与NSCLC的增殖、转移可能存在密切相关,见图5。

图3 CAV1表达水平与NSCLC患者预后生存分析(TCGA数据库数据)Fig.3 Expression level of CAV1 and prognostic survival analysis of NSCLC patients(TCGA database)

注:A为不同性别间比较,B为不同组织间比较;(1)与癌旁组织组织比较,P<0.01。图4 不同组织及不同性别间CAV1的表达(TCGA数据库数据)Fig.4 Expression of CAV1 in different human tissues and gender(TCGA database)

注:A为 CAV1与MKI67相关性分析;B为CAV1与VIM的相关性分析。图5 CAV1与MKI67、VIM的相关分析(TCGA数据库数据)Fig.5 Correlation between CAV1 and MKI67,VIM(TCGA database)

2.4 Caveolin1蛋白的表达

结果显示,NSCLC组中Caveolin1蛋白表达高于癌旁组织组,差异有统计学意义(P<0.05),见图6。

图6 NSCLC组与癌旁组织组中 Caveolin1蛋白的表达(SP法,×200)Fig.6 Expression of Caveolin1 protein in paracancerous tissues group and NSCLS group(SP,×200)

3 讨论

肺癌是呼吸系统最常见的肿瘤,因缺少用于早期诊断的指标且病情进展迅速,八成以上患者就诊时已经处于癌症晚期,使得许多患者错失最佳的治疗时间,目前手术治疗和放化疗手段都难以从根本上解决肿瘤复发和转移的问题[14-15]。虽然技术不断进步,近年来又推出了如物理消融、介入和生物疗法等一系列新的治疗手段[16],但 NSCLC总5年生存率仍然只有约10%,其中八成患者在确诊肿瘤时已经错失最佳手术时机,只有不到2%的肺癌在发现时处于早期[17-18]。早期肺癌手术切除肿瘤后的5年生存率达超过70%。因此,从基因水平对NSCLC的发生发展机制进行分析,筛选新型的肿瘤检测标志物对NSCLC的早期诊治具有重要意义。

本研究对GEO数据库中60例肺癌组织和相应的60例癌旁组织的表达谱芯片数据进行分析,通过对差异基因聚类、筛选、绘制互作网络等方法筛选出14个核心基因。在14个基因中,CXCR2、CD36、CXCL2、MMP1等基因均为目前报道较多且与肺癌有较为明确关系的基因,而GNG11、LRRK2、PPBP、THBS2、CAV1五个基因与肺癌的关系目前报道较少,本研究重点对CAV1进行了研究[19-22]。本研究利用TCGA数据库数据对CAV1在肺癌中的表达情况进行了分析,并对患者的生存期进行统计后,发现CAV1高表达的患者生存期低于低表达CAV1的患者。由于本研究分析的表达谱芯片数据均来自女性肺癌患者,为排除CAV1在不同性别人群中的表达差异,本研究利用TCGA数据库数据对CAV1在男性和女性肺癌患者的表达情况进行了分析,结果显示CAV1的表达与性别无显著关系。本研究还比较了CAV1在 NSCLC癌组织和癌旁组织中的表达情况,结果显示CAV1在 NSCLC肿瘤组织中的表达高于癌旁组织;进一步分析显示,CAV1基因与参与肺癌增殖和转移的MKI67和VIM基因表达呈正相关。这一系列结果与GEO数据库中的表达谱芯片数据结果相一致。本研究检测了100例NSCLC临床样本数据,结果显示,与相应癌旁组织相比,Caveolin1在NSCLC组织中高表达。

CAV1基因所表达的蛋白Caveolin1为细胞膜窖体(Caveolae)的主要构成蛋白,细胞膜窖体是细胞膜发挥功能的重要结构基础[23-24]。CAV1基因在细胞活动中发挥着多种重要作用,包括信号传导、物质运输等,参与细胞的增殖、凋亡、分化等过程[25]。CAV1在肿瘤萌芽期的表达明显增加,这显示CAV1可能与肿瘤的转移和预后密切相关[26-27]。但目前对CAV1在肿瘤发生、发展中的作用研究相对较少,特别是其在肺癌增殖转移中的作用尚不清楚。本研究结果显示,CAV1与NSCLC患者的生存期,肺癌增殖、转移等方面可能有着密切的关系。

本研究主要利用现有数据库的分析和本地临床样本进行分析,但暂时缺少在细胞水平、动物水平的机制研究和在临床样本上的机制验证工作,未来将对CAV1基因和Caveolin1在NSCLC中作用机制展开进一步研究,以期为临床上肺癌的早期诊断和治疗提供新的思路。

猜你喜欢
差异基因肺癌数据库
氩氦刀冷冻治疗肺癌80例的临床观察
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
近亲得肺癌自己早预防
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
数据库
北京新发恶性肿瘤 肺癌约占两成
数据库
数据库