PTK7基因在脑胶质瘤中表达和临床预后的生物信息数据集分析*

2022-03-29 09:26林艺王策康勋康庄陈峰江波李文斌
肿瘤预防与治疗 2022年3期
关键词:胶质瘤通路数据库

林艺,王策,康勋,康庄,陈峰,江波,李文斌

100070北京,首都医科大学附属北京天坛医院 肿瘤综合治疗中心

脑胶质瘤是中枢神经系统最常见的恶性肿瘤之一,手术、放疗、化疗是目前脑胶质瘤的综合治疗模式[1]。脑胶质瘤患者在接受规范治疗后临床预后差异较大,临床医生希望在现有整合诊断基础上寻找相关分子标志物,提高脑胶质瘤诊治水平。除了Oncomine、TCGA、cBioPortal for Cancer Genomics和GEO等数据库,CGGA已实现数据公开,为学者从事神经肿瘤领域相关的标志物研究提供了新的途径[2-3]。PTK7隶属于蛋白激酶家族,因最早在结肠癌中被发现,故又被称为CCK-4[4]。其由具有类似免疫球蛋白胞外结构域、跨膜结构域和C端类激酶结构域构成。PTK7基因存在组织特异性,在多种肿瘤中表达水平升高,其高表达提示预后不佳,相关研究报道见于胃癌[5]、结直肠肿瘤[6]、乳腺癌[7]、卵巢癌[8]等。而在子宫颈癌[9]、脂肪肉瘤[10]、血液肿瘤[11]中 ,PTK7呈现为低表达, 低表达提示生存预后差。脑胶质瘤中PTK7的表达情况和预后价值尚不明确,本研究通过对TCGA、cBioPortal和CGGA等公共数据库的检索,分析PTK7在脑胶质瘤中的表达并研究其与临床病理参数及预后的关系。

1 材料与方法

1.1 资料数据来源

所有数据来源于互联网开放的数据库和分析工具,包括Human Protein Atlas,Oncomine,GEPIA,STRING,cBioPortal for Cancer Genomics和CGGA(表1)。采用Human Protein Atlas基于RNA深度测序结果分析17种常见肿瘤组织中的基因 mRNA表达情况。Oncomine平台用于分析比较脑胶质瘤和对照组织中的基因mRNA表达水平,这共包括5项脑肿瘤数据,其中2项是胶质瘤。cBioPortal for Cancer Genomics共有11项脑胶质瘤研究,涵盖低级别胶质瘤、胶质母细胞瘤等病例。GEPIA分析来自TCGA和GTEx项目的676个肿瘤和对照正常样品的RNA测序表达数据。CGGA分析来自325例脑胶质瘤病例的测序数据。

表1 生物信息分析相关数据库

1.2 数据资料挖掘

以“PTK7”为关键词进行检索,利用Human Protein Atlas 数据库RNA-Seq数据分析PTK7基因mRNA在常见肿瘤组织中的表达水平;检索Oncomine数据库,分析PTK7mRNA在肿瘤组织和正常组织中的表达,利用CGGA分析其mRNA在脑胶质瘤中的表达。基于cBioPortal for Cancer Genomics,分析PTK7在脑胶质瘤中基因突变及拷贝数变异情况。然后,利用CGGA mRNA芯片数据库分析PTK7基因mRNA表达水平与脑胶质瘤相关临床参数和预后的关系。再通过GEPIA获取所有TCGA脑胶质瘤数据,选择Group Cutoff为Median,设定高表达人群和低表达人群(Cutoff-High=50%;Cutoff-Low=50%),验证PTK7基因mRNA在脑胶质瘤中的表达水平,分析其与预后的关系。最后,利用STRING 构建蛋白质相互作用(protein protein interaction,PPI)网络,寻找蛋白质之间的相互作用关系。PPI的相关基因进行GO和KEGG信号富集分析。

1.3 统计学分析

应用R 4.0.2软件进行统计分析,采用配对t检验比较癌组织和癌旁组织PTK7基因的表达量差异。在GO通路富集分析中,数据间差异比较采用方差分析。KEGG富集分析中选择的具有统计学意义的通路(P<0.05)。生存分析采用Kaplan-Meier法,生存率的比较采用Log-rank检验,P<0.05为差异有统计学意义。癌组织和癌旁组织表达量差异采用配对t检验用来比较,卡方检验比较临床病理参数组间差异(n<5时行连续校正卡方检验)。

2 结 果

2.1 PTK7基因mRNA在泛癌组织中的表达

基于Human Protein Atlas数据库RNA-Seq数据,研究分析了PTK7基因mRNA在多种类型肿瘤组织中的表达。共纳入7 392个病例样本(表2):子宫内膜癌(n=541)、睾丸癌(n=134)、头颈癌(n=499)、肺癌(n=994)、卵巢癌(n=373)、宫颈癌(n=291)、乳腺癌(n=1 075)、前列腺癌(n=494)、胰腺癌(n=176)、尿路上皮癌(n=406)、甲状腺癌(n=501)、黑色素瘤(n=102)、结直肠癌(n=597)、脑胶质瘤(n=153)、胃癌(n=345)、肾癌(n=877)和肝癌(n=365)。PTK7基因的mRNA表达水平在子宫内膜癌、睾丸癌、头颈癌、肺癌、卵巢癌、宫颈癌、乳腺癌、前列腺癌、胰腺癌、尿路上皮癌和甲状腺癌中相对较高,而在黑色素瘤、大肠癌、胃癌和脑胶质瘤中表达中等。在肾癌、肝癌中,其表达水平相对较低(图1)。

表2 PTK7基因 mRNA在泛癌组织中的表达

图1 Human Protein Atlas 数据库中PTK7基因 mRNA在肿瘤组织中的表达

2.2 PTK7基因mRNA在脑胶质瘤和对照组织中的表达

Oncomine表达谱芯片分析结果示,与对照的正常脑组织相比,PTK7基因mRNA在脑胶质瘤组织(胶质母细胞瘤)表达较高,二者之间的差异有统计学意义(P<0.001),Fold change值为8.245(图2)。基于TCGA数据的GEPIA分析显示,与对照的正常脑组织相比,PTK7基因mRNA在低级别脑胶质瘤组织中表达较高(P<0.001),二者间的差异有统计学意义;同样与对照的正常脑组织相比,PTK7基因mRNA在脑胶质母细胞瘤组织中表达较高(P<0.001),二者间的差异有统计学意义。CGGA数据分析结果示PTK7基因mRNA表达在II、III和IV级脑胶质瘤组织组织间差异有统计学意义(P<0.001),表达水平随着脑胶质瘤分级升高而升高。

图2 PTK7 mRNA在组织中的表达

2.3 PTK7基因突变及甲基化分析

基于cBioPortal for Cancer Genomics数据库分析,共纳入11个研究数据,共计5 386例脑胶质瘤病例,结果显示PTK7在脑胶质瘤中存在突变和扩增。PTK7基因突变率最高0.84%,扩增率最高0.58%,没有检测到基因融合(图3)。甲基化分析共有源自2个研究的325例样本检测数据被纳入,结果显示PTK7甲基化和PTK7基因mRNA在脑胶质瘤组织中的表达呈负相关(P<0.001,图4),这提示PTK7基因的表达可能受到了表观遗传学调控。7例病例检测到了PTK7基因拷贝数扩增,25例检测到了PTK7基因拷贝数的轻度丢失(图4)。按照病理类型进行分析,结果显示42例脑胶质母细胞瘤(占比97.67%)PTK7基因甲基化水平较低(图4)。

图3 PTK7基因在脑胶质瘤中的突变和扩增

图4 PTK7基因在脑胶质瘤组织中甲基化情况

2.4 PTK7基因mRNA表达水平与脑胶质瘤患者临床病理特征的关系

为进一步探讨PTK7mRNA表达情况与临床病理参数关系,研究进一步利用 CGGA mRNA芯片数据库进行相关性分析。该数据包括病例325例脑胶质瘤病例,涵盖不同WHO分级,PTK7的高低表达 cut-off值为13.1,高于cut-off值即高表达,反之为低表达。分析结果显示:PTK7基因在肿瘤不同分级间(WHO II、WHO III、WHO IV)的表达差异有统计学意义(P<0.001), 在异柠檬酸脱氢酶(isocitrate dehydrogenase,IDH)不同状态间(野生型,突变型)差异有统计学意义 (P<0.001), 在不同肿瘤发生类型间差异有统计学意义(P=0.004), 在不同病理类型间差异有统计学意义(P<0.001)。PTK7表达与WHO分级、IDH状态、肿瘤发生类型和病理类型相关(表3)。

表3 PTK7 表达与脑胶质瘤患者临床病理参数的关系

2.5 PTK7基因mRNA表达水平与脑胶质瘤预后的关系

为分析PTK7的预后价值,研究使用CGGA mRNA芯片数据库进行生存分析。“Analyze-mRNA data”模块将PTK7表达分为两组,高表达组111例,低表达组111例,经生存分析Kaplan-Meier法显示,PTK7基因表达与脑胶质瘤的总生存率(overall survival, OS)相关(P<0.001),PTK7基因mRNA低表达组预后优于高表达组。在复发脑胶质瘤病例中,PTK7基因高、低表达组间的OS差异具有统计学意义(P=0.013),PTK7低表达组预后优于高表达组(图5)。

图5 基于CGGA脑胶质瘤病例的生存分析

2.6 验证PTK7基因mRNA表达水平与脑胶质瘤预后的关系

为了进一步验证基于CGGA数据库的分析结果,分析PTK7基因在脑胶质瘤中的预后价值,研究通过GEPIA进行生存分析,结果(Kaplan-Meier法)显示在676例TCGA脑胶质瘤病例中,PTK7低表达者预后均优于高表达组,二者的OS 差异有统计学意义(P<0.001,图6)。PTK7低表达者无病生存优于高表达组,二者之间的差异具有统计学意义(P<0.001,图6)。

图6 基于TCGA脑胶质瘤病例的生存分析

2.7 PTK7 PPI关系及GO、KEGG分析

为了探讨PTK7可能的作用通路,基于STRING 数据库,研究构建了蛋白质相互作用网络,并分析与PTK7相互作用的蛋白分子,结果如图7所示,共有11个蛋白分子构建成为核心相互作用网络,相关基因为PTK7、CCK、CCKAR、CCKBR、DVL1、DVL2、DVL3、FZD7、VANGL1、VANGL2和WNT5A。对上述基因进行GO功能分析结果提示,其主要参与平面细胞极性通路、耳蜗形态发生、Wnt信号通路等29个功能过程(图8)。KEGG通路分析结果显示上述基因参与Wnt通路、基底细胞癌、黑色素生成、调节干细胞多能性、Hippo通路、人类T淋巴细胞白血病病毒Ⅰ型感染、癌症通路和Notch通路等8个通路(图9)。

图7 PTK7相关蛋白质相互作用网络图

图8 PTK7相关基因本体(GO)功能分析结果

图9 PTK7相关基因KEGG信号通路富集分析结果

3 讨 论

脑胶质瘤的发生和发展过程极其复杂,是由多种因素共同作用的结果。尽管在过去的几十年中,神经胶质瘤的治疗已有很大进展,但是大多数患者的临床结局仍然欠佳,尤其是胶质母细胞瘤。近年来,手术联合放疗和替硝唑胺化疗已经成为胶质母细胞瘤的标准治疗方案,但是即使接受相同的治疗,患者的生存期也明显不同。生存期受很多因素影响,包括治疗策略、患者的身体状态、肿瘤的特征等。与这些因素相关的标志物往往是胶质瘤患者预后评价的关键,针对相关标志物的靶向治疗将成为未来脑胶质瘤治疗方面的突破点。

蛋白激酶是真核细胞中最大的一个基因家族,依据激酶、非激酶区域和跨膜的结构域,将蛋白激酶划分为受体依赖型受体酪氨酸激酶(receptor tyrosine kinases,RTKs)和非受体依赖型RTKs[12]。蛋白激酶介导了真核细胞内大多数的信号传导,调控大部分细胞内蛋白的功能,参与发育过程中的细胞内通讯,参与生理反应和内稳态等[13-15]。因此,蛋白激酶突变和调控异常导致了人类疾病,这也为使用酶类的激动药和拮抗药治疗疾病提供了可能。越来越多的研究表明酪氨酸激酶在各种类型肿瘤中均起重要作用,而RTKs已成为肿瘤药物研究中受到重点关注的靶点[15-16]。

本研究发现PTK7mRNA在脑胶质瘤组织中表达升高,表达水平随着脑胶质瘤分级升高,这与既往脑胶质母细胞瘤研究结果一致[17]。PTK7在脑胶质瘤中存在突变和扩增。临床参数分析显示PTK7表达与脑胶质瘤的WHO分级、IDH状态和病理类型相关(P<0.001),而与其他临床因素如年龄、性别等无相关性。基于CGGA数据的生存分析显示PTK7基因mRNA低表达组预后优于高表达组(P<0.001),在复发脑胶质瘤中同样存在上述差异(P=0.013)。基于TCGA数据点生存分析印证了PTK7低表达者预后均优于高表达组,OS和DFS差异均具有统计学意义(P<0.001)。而既往学者研究显示,与低表达PTK7的脑胶质瘤相比较,高表达PTK7的多形性胶质瘤患者预后更差[17]。该研究与我们的分析结果一致,即在脑胶质瘤病例中,PTK7高表达意味着预后不良。

PTK7是WNT/β-catenin和WNT/PCP信号传导途径中的常见成员,可能在这两个信号传导途径中发挥正向或负向作用[18-20]。研究显示PTK7调控细胞极性[21],并且与RACK1,Cdx和PlexinA1有相互作用[22-23],是WNT信号通路的调控因子,作用于Frizzled受体,并作为GSK3β的上游调节信号[20,24]。Wnt信号通路在神经发生和干细胞增殖中发挥功能,被证实在脑胶质瘤的发生和发展中起着关键作用[25]。此外,PI3K/Akt/mTOR途径与脑胶质母细胞瘤的生长、代谢、存活、血管生成、自噬和化疗耐药性密切相关[26]。在本研究中,PTK7在脑胶质瘤中高表达也预示预后不佳。而PTK7在血液肿瘤[27]、肺癌[28]、结肠癌[6]、乳腺癌[29]、食道癌[30]以及肉瘤[10]等出现过表达则同样提示不良预后。这些数据进一步支持PTK7未来作为肿瘤新药研究的候选靶标[31-33]。

总之,本研究结果提示PTK7表达水平和脑胶质瘤的临床病理参数和临床预后有关,但PTK7的预后价值仍需要在蛋白水平进行验证。PTK7作为酪氨酸蛋白激酶家族成员,如果未来能够明确其临床价值和功能机制,或将有希望成为脑胶质瘤的治疗新靶点,在精准治疗中发挥作用。

作者声明:本文全部作者对于研究和撰写的论文出现的不端行为承担相应责任;并承诺论文中涉及的原始图片、数据资料等已按照有关规定保存,可接受核查。

学术不端:本文在初审、返修及出版前均通过中国知网(CNKI)科技期刊学术不端文献检测系统的学术不端检测。

同行评议:经同行专家双盲外审,达到刊发要求。

利益冲突:所有作者均声明不存在利益冲突。

文章版权:本文出版前已与全体作者签署了论文授权书等协议。

猜你喜欢
胶质瘤通路数据库
长链非编码RNA在胶质瘤中的研究进展
DJ-1调控Nrf2信号通路在支气管哮喘中的研究进展
基于改进TF-IDF算法的基因通路富集方法
AngⅡ激活P38MAPK信号通路在大鼠NSAID相关小肠损伤中的机制研究
成人高级别脑胶质瘤术后复发相关因素分析
复发胶质瘤组织中miRNA-200c的表达 及作用机制研究
IgG、Integrinβ6、P16在人脑胶质瘤中的表达及其临床意义
数据库
数据库
数据库