PARVG基因在肾透明细胞癌患者中的表达及临床意义

2022-04-02 00:55王立韬
大理大学学报 2022年2期
关键词:生物学数据库肿瘤

王立韬,白 丽*

(1.大理大学基础医学院,云南大理 671000;2.云南省昆虫生物医药研发重点实验室,云南大理 671000)

肾癌,即肾细胞癌(renal cell carcinoma,RCC),是一类起源于肾实质泌尿小管上皮系统的恶性肿瘤。从临床角度看,RCC主要有3种病理类型:肾透明细胞癌(kidney renal clear cell carcinoma,KIRC)、肾乳头细胞癌和肾嫌色细胞癌其中KIRC为最常见的病理类型,占RC C的70%~80%〔1-2〕。近年来,RCC的发病率逐年增加,在新增患者中,稳居前10位(男性第6位,女性第8位),且发病呈现出年轻化的态势〔3-4〕。RCC被认为是一种免疫原性肿瘤,几十年来免疫治疗一直是其治疗的重要部分〔5〕。目前,免疫检查点抑制剂(immune checkpoint inhibitors,ICIs)、单药/联用酪氨酸激酶抑制剂(tyrosine kinase inhibitors,TKIs)显示出更佳的临床治疗效果〔6〕。然而,ICIs仍然存在很多弊端,如不良反应较多、容易产生耐药等,因此,寻找新型靶点成为肿瘤免疫治疗的关键所在。

PARVG基因是与焦点接触相关的肌动蛋白结合蛋白家族中的一员,被证明可能是参与耐受过程的候选者〔7〕。PARVG基因主要在淋巴组织中优先表达,全长约25 kb,定位于第22号染色体q13.31区域〔8〕。PARVG基因已被证明与大肠癌和乳腺癌的发生发展无关,与子宫内膜癌的预后不良密切相关〔9-10〕。本研究运用生物信息学技术分析了人PARVG基因在KIRC和癌旁正常组织中的表达情况及对癌症患者预后的影响,探讨PARVG基因潜在的临床价值,旨在为后续研究PARVG基因在KIRC的发生、发展、诊疗与预后以及研究新型治疗靶点提供新的理论依据和信息支持。

1 材料与方法

1.1 TIMER数 据 库TIMER(https://cistrome.shinyapps.io/timer/)是一个包含32种常见肿瘤类型、对10 897个肿瘤进行肿瘤浸润免疫亚群预先计算的在线分析数据库,可以方便快捷地获取免疫浸润与基因表达、体细胞突变、临床结果等因素的联系〔11〕。利用TIMER数据库,在Diff Exp模式下搜索PARVG基因在临床常见肿瘤中的表达情况。

1.2 GEPIA数据库GEPIA(https://gepia.cancerpku.cn/index.html)是一个基于TCGA和GTEx数据库,可以根据选定数据集和按癌症类型或病理分期的统计方法绘制特定的基因表达谱,并可以对基因在某种特定癌症中的表达及预后进行分析的在线工具〔12〕。利用GEPIA对PARVG基因在KIRC患者中的表达情况进行分析,在Expression on Box Plots模式下,匹配的癌症数据来自TCGA和GTEx数据库,筛选及处理条件为:基因“1、数据集选择“KIRC”、P<0.01。

1.3 UALCAN数据库UALCAN(https://ualcan.path.uab.edu/analysis.html)是一个基于TCGA数据库在线分析和挖掘的网站,可以分析在不同临床病理特征下某个/某些基因在肿瘤样本和癌旁正常组织样本中的表达差异〔13〕。在UALCAN数据库中选定TCGA数据库为“Kidney renal clear cell carcinoma”,检索PARVG基因的表达水平及KIRC患者肿瘤分期对患者预后的影响。

1.4 Kaplan-Meier Plotter数据库Kaplan-Meier Plotter(https://kmplot.com/analysis/)数据库,网罗来自GEO、EGA和TCGA的癌症患者生存信息及转录组数据,是对癌症患者生存分析最权威的网站。利用此在线软件在Pan-cancer RNA-seq模块下,选择“kidney renal clear cell carcinoma,n=530”,分 析PARVG基因对KIRC患者总体生存率的影响。

1.5 Coexpedia数 据 库Coexpedia(https://www.coexpedia.org/)是一个共表达网络分析以及可视化的在线工具,搜集了来自GEO数据库关于人和小鼠的900多个数据集,并对每个数据集进行了共表达分析,然后将共表达关系汇总成数据库信息。通过在Coexpdia数据库中检索,获得了在KIRC中PARVG基因的共表达基因网络。

1.6 Funrich软件FunRich软件主要用于基因和蛋白质的功能富集和相互作用网络分析。选取Coexpedia数据库得到的“LLS分数>2”的17个基因,在“Gene enrichment”模块下,对17个基因进行细胞组成(cellular component)、分子功能(molecular function)、生物学过程(biological process)以及生物学通路(biological pathway)的富集分析。

1.7 统计学方法采用单因素方差分析PARVG基因在KIRC肿瘤组织及癌旁正常组织中的表达差异;Kaplan-Meier Plotter研究PARVG基因表达与KIRC患者临床预后的相关性(采用Log-rank检验);用t检验或单因素方差分析PARVG基因差异表达;用皮尔逊法分析PARVG基因与其关键基因的表达相关性。P<0.05为差异有统计学意义。

2 结果

2.1 PARVG基因在常见肿瘤中的表达情况利用TIMER数据库分析PARVG基因在临床常见肿瘤组织及癌旁正常组织中的表达情况。结果显示,PARVG基因在多种肿瘤组织及癌旁正常组织中呈现差异性表达,其中在乳腺浸润癌(breast invasive carcinoma,BRCA)、结肠腺癌(colon adenocarcinoma,COAD)、头颈部鳞状细胞癌(head and neck squamous cell carcinoma,HNSC)、KIRC、肾乳头细胞癌(kidney renal papillary cell carcinoma,KIRP)、肺腺癌(lung adenocarcinoma,LUAD)、肺鳞状细胞癌(lung squamous cell carcinoma,LUSC)、皮肤黑色素瘤(skin cutaneous melanoma,SKCM)、胃 腺 癌(stomach adenocarcinoma,STAD)以及子宫内膜癌(uterinecorpus endometrial carcinoma,UCEC)中表达明显上调(P<0.001)。见图1。

2.2 PARVG基因在KIRC组织和癌旁正常组织中的表达情况 通过GEPIA数据库检索TCGA和GTEx数据库中的样本信息,分析了523例KIRC组织及100例癌旁正常组织中PARVG基因mRNA的表达情况,结果表明,PARVG基因在KIRC组织中的表达水平明显高于癌旁正常组织(P<0.05)。见图2。

图2 PARVG在KIRC组织和癌旁正常组织中mRNA的表达情况

2.3 PARVG表达与临床病理特征相关性利用UALCAN数据库比较PARVG基因在不同肿瘤分期、肿瘤分级、不同种族、不同年龄阶段间的表达差异。结果表明,PARVG基因在肿瘤1~4期KIRC患者肿瘤组织中的表达均明显高于癌旁正常组织(P<0.01),且3期、4期PARVG基因表达水平均比1期的表达水平高(P<0.01)。见图3A。PARVG在白种人、非裔美国人以及亚洲人KIRC患者肿瘤组织中的表达水平均显著高于癌旁正常组织(P<0.01)。见图3B。在年龄为21~40、41~60、61~80、81~100岁人群中,KIRC患者中PARVG基因的表达水平均明显高于癌旁正常组织(P<0.01)。见图3C。肿瘤1~4级的KIRC患者,PARVG基因的表达水平也显著高于癌旁正常组织(P<0.01),KIRC 3级与4级患者PARVG基因的表达水平均显著高于2级患者(P<0.01)。见图3D。

图3 PARVG表达与临床病理特征相关性

注:*P<0.05;**P<0.01;***P<0.001。

2.4 PARVG基因与KIRC患者预后及生存性分析采用Kaplan-Meier Plotter数据库评估PARVG基因的表达水平对KIRC患者预后的影响,发现PARVG基因的高表达提示患者预后不良。进一步分析结果显示,高表达PARVG基因预示着KIRC患者更差的总体生存率(P=7.6×10-5,HR=2.2),差异具有统计学意义。见图4。

图4 PARVG基因对KIRC患者总体生存率的影响

2.5 PARVG与共表达基因在KIRC中的分子调控网络利用Coexpedia数据库绘制出PARVG基因与其共表达基因在KIRC中的分子调控网络图,得到PARVG基因的共表达基因61个。其中LLS分数>2的共表达基因17个,分别是SASH3、SELPLG、ITGAL、CD84、CD53、RASSF5、MYO1F、LCP2、CD86、HCK、IL10RA、LY86、CD48、LILRB1、FCER1G、ARHGAP9和PRF1。

2.6 PARVG及其共表达基因的富集分析为进一步了解PARVG基因与共表达基因在KIRC中的生物学功能,使用Funrich软件对其进行功能富集分析。通过细胞组成的富集分析,发现PARVG共表达基因主要参与了细胞质膜的形成、维持细胞质膜的完整性以及免疫突触等方面。见表1。通过分子功能的富集分析,发现PARVG共表达基因中主要参与蛋白酪氨酸激酶活性、受体信号复合物支架活性、T细胞受体活性以及G蛋白信号活性调节因子等。见表2。通过生物学过程的富集分析,发现PARVG共表达基因中有7个基因(7/17,占41.18%)参与了细胞通讯,8个基因(8/17,占47.06%)参与信号转导。见表3。通过生物学通路的富集分析,发现PARVG共表达基因主要参与生理性止血、血管壁细胞表面的相互作用以及CXC R4介导的信号事件等多条信号通路。见表4。分析结果提示PARVG基因与其共表达基因可能通过调节免疫相关功能及信号传导等过程来影响KIRC的发生与发展。

表1 PARVG共表达基因的细胞组成富集分析结果

表2 PARVG共表达基因的分子功能富集分析结果

表3 PARVG共表达基因的生物学过程富集分析结果

表4 PARVG共表达基因的生物学通路富集分析结果

3 讨论

RCC占全球恶性肿瘤的2%~3%,据估计,全世界每年新增病例33.8万例。大约20%~30%的患者在确诊时即合并转移,且患者5年内复发的概率极高(可达90%)〔14〕,因此,寻找全新的诊断或治疗靶点和标志物成为目前亟待解决的问题。PARVG是来源于parvin家族的肌动蛋白结合蛋白,主要起着黏着斑蛋白的作用。PARVG的体细胞突变在少突胶质瘤的发生、发展中不起作用,只能观察到PARVG的多态性改变〔15〕。

本研究基于生物信息学的分析方法,通过对TCGA数据库的挖掘,探究PARVG基因在KIRC中潜在的临床应用价值。通过TIMER数据库分析

PARVG基因在常见肿瘤中的表达情况,发现PARVG基因在乳腺浸润癌、头颈部鳞状细胞癌、结肠腺癌、肾透明细胞癌、肾乳头细胞癌、胃腺癌以及子宫内膜癌等多种实体瘤中呈现高表达。通过GEPIA及UALCAN数据库分析PARVG基因mRNA在KIRC组织中的表达水平及预后情况。结果显示,与癌旁正常组织相比,PARVG基因在KIRC组织中呈现高表达。通过Kaplan-Meier Plotter数据库的检索结果显示,PARVG基因的表达水平与患者预后具有相关性,PARVG基因表达水平越高,患者的总体生存率越差,说明PARVG基因的高表达可能与KIRC患者预后不良有关,PARVG基因的表达水平可作为判断患者预后的一个指标用于临床诊疗中。

为探究PARVG基因参与调控的生物学过程,利用Coexpedia数据库进行挖掘,并利用Funrich软件着重对LLS分数>2的共表达基因进行功能富集分析,获得了其在细胞组成、分子功能、生物学过程及生物学通路中发挥的作用。研究发现,PARVG基因参与了多种生物学过程。在PARVG基因的共表达基因中,SELPLG、CD84、CD48、FCER1G主要参与细胞质膜的形成,并在细胞质膜的完整性保持方面发挥重要作用。另外,共表达基因HCK、LCP2、LY86、RASSF5等参与了多种信号通路的活化与信号传导等过程。SASH3、ITGAL、CD84、CD53、CD86、LILRB1、FCER1G等共表达基因参与了免疫应答的调控过程,免疫应答在肿瘤控制中起到了至关重要的作用。SELPLG、ITGAL、CD84、CD48、FCER1G等则参与了生理性止血与血管壁细胞表面的相互作用等多种生物学通路。PARVG基因与其共表达基因可能通过相互作用影响免疫应答、信号传导等共同参与调控KIRC的发生、发展。

本研究基于多种生物信息学在线工具探究了PARVG基因在KIRC中的表达情况以及预后意义。PARVG基因在KIRC组织中高表达,同时其高表达与患者的总体生存率密切相关。另外,PARVG基因在肿瘤相关的多种生物学过程及信号传导中也发挥着举足轻重的作用。因此,PARVG基因有望成为KIRC临床研究及治疗的潜在靶基因。

猜你喜欢
生物学数据库肿瘤
致命肿瘤忽然消失
初中生物学纠错本的建立与使用
滚蛋吧!肿瘤君
“饿死”肿瘤的纳米机器人
基于项目式学习的生物学概念教学研究
初中生物学纠错本的建立与使用
数据库
高中生物学中“一半”的涵义
数据库
肿瘤标志物正常不等于没有肿瘤