利用数据挖掘技术分析HIF-1α在胃癌中的预后意义

2018-04-21 07:00孙美涛自加吉严长宝戴莉萍
大理大学学报 2018年2期
关键词:存活数据挖掘胃癌

孙美涛,自加吉,陈 莹,严长宝,戴莉萍,余 敏,熊 伟*

(1.大理大学基础医学院,云南大理 671000;2.大理大学第三附属医院病理科,云南大理 671000;3.云南大学生命科学学院,昆明 530061)

胃癌是消化系统最常见的恶性肿瘤之一,具有发病率高、转移率高和死亡率高等特点〔1〕。我国是胃癌高发区,发病率以中老年居多,目前有低龄化趋势,给家庭和社会带来极大危害〔2〕。胃癌的发生是多基因多阶段参与的涉及多种环境因素及遗传因素长期的相互作用〔3〕。因此,进行胃癌的病因学研究,对胃癌进行有效的病因预防,具有十分重要的意义。

缺氧诱导因子(Hypoxia-inducible factors,HIF)是介导细胞对缺氧微环境进行适应性反应的关键转录调控因子〔4〕。HIF-1α基因首先是由Semenza等在低氧处理肝癌细胞株Hep3B时发现的,第一个被证实的HIF-1α靶基因是人类促红细胞生成素(Human erythropoietin,HuEPO)基因。在细胞适应低氧环境和肿瘤发展的过程中HIF-1α扮演着重要的角色〔5〕。HIF-1α基因定位于人类第14q23.2,含有16个外显子,存在3个不同的转录本,其完整的转录本2(NM_001530.3)的全长cDNA为4 082 bp,编码的蛋白质由826个氨基酸残基组成。研究发现,HIF-1是由氧调节的α亚基和组成性表达的β亚基构成的异二聚体转录因子。其中HIF-1α亚基是感受氧和介导生理性或病理性缺氧反应的关键因子〔6〕。HIF-1作为低氧条件下最重要的调控因子,参与细胞多种缺氧反应。在缺氧的条件下,HIF-1α的表达水平增高,是调节细胞内氧代谢的关键因子之一,可以调节包括血管内皮生长因子、葡萄糖转运蛋白1在内的众多靶基因的表达。同时HIF-1α在能量代谢和细胞增殖等方面也起到重要的作用〔7-9〕。本研究基于Oncomine数据库、癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库以及Kaplan-Meier Plotter数据库进行数据挖掘,进而分析HIF-1α基因在胃癌中的表达水平及其预后意义,为阐明HIF-1α基因在胃癌发生发展中的作用奠定基础。

1 材料与方法

1.1 利用Oncomine数据库分析HIF-1α在胃癌的基因表达Oncomine v4.5数据库是一个基于基因芯片的数据库和整合数据挖掘平台,在此数据库中可根据自己的需要设定筛选条件。本研究中设定的筛选条件为:①“Gene:HIF-1α(200989_at)”;②“Analysis type:cancer vs.normal analysis”;③“Cancer type:gastric cancer”;④“Date type:mRNA”;⑤“Sample type:clinical specimen”;⑥ 临界值设定条件(P value<0.0001,fold change>2.0,gene rank=top 10%)。通过以上设定因素分析HIF-1α基因在胃癌中的表达。

1.2 利用cBioportal工具分析TCGA数据库中HIF-1α在胃癌的突变利用cBioportal(www.cbioportal.org)在线工具,在数据库类型中选择“TCGA database”,肿瘤类型选择“Stomach adenocarinoma”,数据类型选择“Mutation and CNA”,基因选择“HIF-1α”,分析HIF-1α在胃癌的突变情况。

1.3 利用Kaplan-MeierPlotter进行患者生存周期分析利用 Kaplan-Meier Plotter数据库( http:∕∕kmplot.com∕analysis∕)的胃癌数据集进行在线生存分析。筛选条件如下:①“Cancer:gastric cancer”;②“Gene:HIF-1α”;③“Survival:overall survival”;④“Lauren classification:all∕intestinal∕diffuse∕mixed”。

1.4 统计学分析正常胃和胃癌组织之间HIF-1α表达的差异采用t检验。HIF-1α基因表达与患者生存期的关系采用Kaplan-Meier模型进行生存分析,统计学分析采用SPSS 20.0软件进行,以P<0.05为差异有统计学意义。

2 结果

2.1 HIF-1α在所有肿瘤类型中的表达Oncomine v4.5数据库中共收集了998个不同类型的研究结果,其中关于HIF-1α表达有统计学差异的研究结果共142个,HIF-1α表达增高的研究有36个,HIF-1α表达降低的研究有106个。见图1。在人类消化道系统常见的恶性肿瘤中,食管癌中高表达的研究有1个,低表达的研究有2个;胃癌中高表达的研究有2个,低表达的研究有2个;肝癌中高表达的研究有2个;结直肠癌中高表达的研究有1个,低表达的研究有8个。见表1。

表1 HIF-1α基因在Oncomine数据库中所有肿瘤相关研究中的表达

2.2 HIF-1α在胃癌中的表达结果Oncomine v4.5数据库中检索发现,从2003年开始,共有12项研究涉及HIF-1α在胃癌和正常组织中的表达,共包括798个样本。文章分别发表于Mol Biol Cell〔10〕、Clin Cancer Research〔11〕、Nucleic Acids Research〔12〕、Eur J Cancer〔13〕、Med Oncol〔14〕。荟萃分析 12 项研究结果发现,与正常胃组织相比,HIF-1α在胃癌组织中呈现高表达,中位数值为701.5,P=0.000 216,表明其高表达且差异具有统计学意义。

2.3 HIF-1α在不同类型胃癌组织和正常胃组织的表达差异在Oncomine v4.5数据库数据挖掘结果显示,相比正常胃组织,HIF-1α基因在胃癌、弥漫型胃癌、肠型胃癌和混合型胃癌中均呈现高表达。见图1。

图1 Oncomine芯片数据库中HIF-1α在不同胃癌组织中的表达情况

2.4 HIF-1α在胃癌的突变分析利用cBioportal在线工具分析发现,HIF-1α由826个氨基酸组成,包含PAS、PAS-3和HIF 3种不同的结构域。HIF-1α在胃癌中的突变有错义突变、框移突变和剪接突变3种类型。其中错义突变包括477位的赖氨酸转变为苏氨酸(K477T)、690位的氨基酸转变为甲硫氨酸(V690M)、694位的丙氨酸转变为苏氨酸(A694T)、795位的亮氨酸转变为脯氨酸(L795P)。框移突变为613位的天冬酰胺到619位的丙氨酸发生了缺失(N613_A619del)。剪接突变为第553位氨基酸对应的mRNA发生了剪接错误。见图2。

图2 HIF-1α在胃癌中的突变情况

2.5 HIF-1α表达水平与胃癌患者预后的关系为进一步明确HIF-1α表达水平与胃癌患者预后之间的关系,本研究在Oncomine数据库中提取HIF-1α基因表达水平与胃癌患者预后相关的数据,通过Kaplan-Meier Plotter数据库分析发现:与HIF-1α高表达组相比,HIF-1α低表达组胃癌患者的累积存活时间缩短(HR=0.73,P=0.000 36)。在肠型胃癌患者中,HIF-1α高表达胃癌患者的存活时间延长(HR=0.54,P=0.000 13)。在弥漫型胃癌患者中,HIF-1α高表达胃癌患者的存活时间延长(HR=0.57,P=0.001 20)。在混合型胃癌患者中,HIF-1α高表达胃癌患者的存活时间延长(HR=0.33,P=0.038 00)。见图3。以上结果提示,在不同类型的胃癌中,HIF-1α基因表达水平越高,患者的存活时间越长。

3 讨论

胃癌发生、发展机制涉及一系列遗传学改变,包括原癌基因的激活和抑癌基因的失活,胃癌的发生演变涉及到多种环境因素及遗传因素长期的相互作用〔15〕。HIF-1α是目前发现的唯一一个高度特异性在缺氧状态下可以发挥活性的核转录因子,在哺乳动物组织中广泛存在,组织在处于缺氧状态时发挥转录和调控作用〔16〕。有研究认为,HIF-1α在肿瘤的发生、发展以及肿瘤的转移中起着核心功能。HIF-1α可防止肿瘤细胞凋亡,其高表达使肿瘤细胞耐缺氧的能力得到增强。研究表明,HIF-1α在评价肿瘤治疗及预后中发挥重要的作用〔17〕。近年来,国内外研究显示结肠癌、乳腺癌、肺癌、胰腺癌、前列腺癌等肿瘤中HIF-1α的表达显著增强,在一些癌前病变组织中也可以检测到HIF-1α的存在,而在正常组织中则无表达〔18〕。

图3 Kaplan-Meier Plotter数据库分析HIF-1α对胃癌患者预后的影响

Oncomine数据库是目前世界上最大的基因芯片数据和整合数据挖掘平台,本研究利用该数据平台避免了因为样本量的问题导致的误差,增加了结论的可信度〔19〕。TCGA数据库是最大的一个癌症基因信息数据库,为肿瘤医学研究者提供了海量的基因组数据和与其关联的临床数据,为进一步挖掘有意义的基因组变化和发现影响肿瘤发展、分化等分子机制提供了数据基础〔20〕。在Oncomine数据库提取HIF-1α基因mRNA在胃癌及正常组织中的表达情况,结果显示人HIF-1α基因mRNA表达在胃癌组织中高于正常组织,组间差异具有统计学意义(P=0.000 216)。

The Kaplan Meier plotter(http:∕∕kmplot.com ∕analysis∕)是目前世界上最广为接受的一个预后相关在线分析数据库,涵盖了10 188例肿瘤样本(4 142例乳腺癌样本,1648例卵巢癌样本,2437例肺癌样本和1 065例胃癌样本),可对54 675个基因进行相关预后分析,并得出真实可信客观的结果〔21〕。通过在Kaplan-Meier Plotter数据库进行生存分析发现,与HIF-1α高表达组相比,HIF-1α高表达组胃癌患者的累积生存时间延长,差异具有统计学意义(P<0.01)。在肠型胃癌患者中,HIF-1α高表达组胃癌患者的存活时间延长,差异具有统计学意义(P<0.01)。在弥漫型胃癌患者中,HIF-1α高表达组胃癌患者的存活时间延长,差异具有统计学意义(P<0.01)。在混合型胃癌患者中,HIF-1α高表达组患者的存活时间延长,差异具有统计学意义(P<0.05)。表明不同类型的胃癌中,HIF-1α基因表达水平增高,是胃癌患者预后的保护因素。

通过公开平台基因芯片数据分析方法进行数据挖掘,较传统实验方法有花费少、数据量大的特点,但数据信息多为基因mRNA表达水平的检测,所以还需要进行蛋白质水平的验证。但是通过基因芯片的数据分析,可以对课题可行性进行初步的探索,预测结果并提供理论证据。本研究中发现HIF-1α的表达水平与胃癌患者的累计生存期有明显的相关性,为下一步免疫组化验证提供了参考。综上所述,通过利用上述3大数据库的深入挖掘,发现HIF-1α在胃癌中高表达,且与胃癌患者的预后有强相关性,HIF-1α高表达是胃癌患者预后的保护因素。以上结果将为胃癌的临床基因治疗和新型抗肿瘤药物的开发提供潜在的靶标。

[参考文献]

〔1〕TORRE L A,BRAY F,SIEGEL R L,et al.Global cancer statistics,2012〔J〕.CA Cancer J Clin,2015,65(2):87-108.

〔2〕CREW K D,NEUGUT A I.Epidemiology of gastric can⁃cer〔J〕.World J Gastroenterol,2006,12(3):354-362.

〔3〕YANG L.Incidence and mortality of gastric cancer in Chi⁃na〔J〕.World J Gastroenterol,2006,12(1):17-20.

〔4〕韩毅力,程永毅,徐永刚.低氧条件下HIF-1α对HGF表达影响的观察〔J〕.中华肿瘤防治杂志,2012,19(18):1377-1379.

〔5〕SEMENZA G L,WANG G L.A nuclear factor induced by hypoxia via de novo protein synthesis binds to the human erythropoietin gene enhancer at a site required for tran⁃scriptional activation.〔J〕.Molecular and Cellular Biology,1992,12(12):5447-5454.

〔6〕LI L,ZHANG L,ZHANG X,et al.Hypoxia-inducible fac⁃tor linked to differential kidney cancer risk seen with type 2A and type 2B VHL mutations〔J〕.Mol Cell Biol,2007,27(15):5381-5392.

〔7〕SEMENZA G L.Hypoxia-inducible factors in physiology and medicine〔J〕.Cell,2012,148(3):399-408.

〔8〕VAUPEL P,MAYER A.Hypoxia in cancer:significance and impact on clinical outcome〔J〕.Cancer Metastasis Rev,2007,26(2):225-239.

〔9〕BROWN J M.The hypoxic cell:a target for selective cancer therapy-eighteenth Bruce F.Cain Memorial Award lec⁃ture〔J〕.Cancer Res,1999,59(23):5863-5870.

〔10〕CHEN X,LEUNG S Y,YUEN S T,et al.Variation in gene expression patterns in human gastric cancers〔J〕.Mol Biol Cell,2003,14(8):3208-3215.

〔11〕CHO J Y,LIM J Y,CHEONG J H,et al.Gene expression signature-based prognostic risk score in gastric can⁃cer〔J〕.Clin Cancer Res,2011,17(7):1850-1857.

〔12〕CUI J,CHEN Y,CHOU W C,et al.An integrated tran⁃scriptomic and computational analysis for biomarker iden⁃tification in gastric cancer〔J〕.Nucleic Acids Research,2011,39(4):1197-1207.

〔13〕D'ERRICO M,DE RINALDIS E,BLASI M F,et al.Ge⁃nome-wide expression profile of sporadic gastric cancers with microsatellite instability〔J〕.Eur J Cancer,2009,45(3):461-469.

〔14〕WANG Q,WEN Y G,LI D P,et al.Upregulated INHBA expression is associated with poor survival in gastric can⁃cer〔J〕.Med Oncol,2012,29(1):77-83.

〔15〕高燕,崔艳欣,姜相君.Dnmt1基因单核苷酸多态性与胃癌的关系〔J〕.中国癌症防治杂志,2015,7(6):394-397.

〔16〕CUNINGHAME S,JACKSON R,ZEHBE I.Hypoxia-in⁃ducible factor 1 and its role in viral carcinogenesis〔J〕.Vi⁃rology,2014(456∕457):370-383.

〔17〕窦鹏挥,胡春荣,马利峰,等.PTEN和缺氧诱导因子-1α在食管鳞癌组织中的表达〔J〕.黑龙江医药科学,2017,40(1):67-68.

〔18〕SEMENZA G L.Targeting HIF-1 for cancer therapy〔J〕.Nat Rev Cancer,2003,3(10):721-732.

〔19〕王巍,张志常,宋晓雯,等.基于数据挖掘分析PDCD5表达对胃癌预后的影响〔J〕.现代肿瘤医学,2016,24(24):3957-3959.

〔20〕黄震震.基于整合的TCGA数据库探索基因组学与临床数据关系〔D〕.杭州:浙江大学,2016.

〔21〕SZÁSZ A M,LÁNCZKY A,NAGY Á,et al.Cross-valida⁃tion of survival associated biomarkers in gastric cancer us⁃ing transcriptomic data of 1,065 patients〔J〕.Oncotarget,2016,7(31):49322-49333.

猜你喜欢
存活数据挖掘胃癌
探讨人工智能与数据挖掘发展趋势
病毒在体外能活多久
病毒在体外能活多久
基于并行计算的大数据挖掘在电网中的应用
飞利浦在二战中如何存活
P53及Ki67在胃癌中的表达及其临床意义
一种基于Hadoop的大数据挖掘云服务及应用
131I-zaptuzumab对体外培养肿瘤细胞存活的影响
胃癌组织中LKB1和VEGF-C的表达及其意义
胃癌组织中VEGF和ILK的表达及意义