陈 玥 佘婧瑶 陈 思 曹 莹 梁春云 卢 燕 王佩娟 公 真
1.江苏省中西医结合医院妇产科,江苏 南京 210028; 2.南京中医药大学第三临床医学院,江苏 南京 210023
宫颈癌在中国的女性癌症发病率中居第六位,发病率与死亡率均较高。2020年全球共报道超过60万例新发病例和超过30万例死亡病例[1]。在经济条件较好的国家和地区,规范的宫颈疾病筛查有效地降低了发病率和死亡率[2]。然而在东南亚地区,宫颈癌仍是第二常见的癌症类型,也是中低收入国家女性因癌症死亡的主要原因[3]。宫颈癌分为不同组织学亚型,最常见组织病理学亚型是鳞状细胞癌(squamous cell carcinoma,SCC),其次是腺癌(adenomatous carcinoma,AC)[4]。手术是目前治疗宫颈癌的主要手段,晚期或复发性宫颈癌患者对传统的放化疗会有一定的耐药性,有效的治疗方法仍然匮乏。因此,研究对宫颈癌有预测价值的生物标志物和治疗靶点,对患者的生存和预后尤为重要。
E2F转录因子家族已被证实参与细胞增殖、凋亡、分化、衰老、DNA损伤反应和修复等过程[5-7]。1987年,该家族首次被证实为激活E2腺病毒启动子的激活剂,目前已鉴定出该家族的8个成员:E2F1、E2F2、E2F3、E2F4、E2F5、E2F6、E2F7 和E2F8,分别位于不同的染色体上。其中E2F3和E2F7存在a、b两种亚型,在细胞的不同周期表达。根据转录因子的结构和功能可将其分为激活因子(E2F1、E2F2和E2F3a)和抑制因子(E2F3b、E2F4、E2F5、E2F6、E2F7和E2F8)[8]。
研究发现,E2F家族成员与多种类型恶性肿瘤(肝癌[9]、肾癌[10]、直肠癌[11]等)的发生发展存在相关性。它们在正常组织中低水平表达,但在肿瘤组织中过度表达,使其成为潜在治疗靶点[12]。在宫颈癌中,也观察到部分E2F家族成员的表达异常上调[13]。尚未有应用生物信息学分析探索E2Fs在宫颈癌中作用的研究。本研究基于对在线发表的数千个基因表达或拷贝数变异的分析,详细分析宫颈癌患者中不同E2F因子的表达和突变,以确定E2F转录因子家族在宫颈癌中的表达模式、潜在功能、不同的预后价值以及与免疫浸润的关系,从而为宫颈癌的诊断和治疗提供新的视角。
Oncomine数据库是目前全球最大的癌症基因芯片数据库和整合数据挖掘平台,旨在挖掘癌症基因信息[14]。本研究利用Oncomine数据库鉴定E2F家族成员在宫颈癌、正常组织以及在宫颈癌不同临床分期中的差异表达。筛选条件:(1)【search】分别输入E2F1-E2F8;设置P-VALUE:0.05,FOLD CHANGE:2;GENE RANK:2 ,DATA TYPE:mRNA。获得8个转录因子在不同类型癌种中的表达情况后进行合并,蓝色模块对应低表达,红色模块对应高表达,3种饱和度由浅至深分别表示差异排序为10%,5%,1%。(2)【Analysis Type】--【cancer vs. Normal Analysis】--【Cervical squamous cell carcinoma vs. Normal Analysis】,得到E2F家族在宫颈癌中的表达数据集,记录表达倍数。
GEPIA 2[15]是基于肿瘤基因组计划(the Cancer Genome Atlas,TCGA)与 基 因 型 -组 织 表 达(Genotype-Tissue Expression,GTEx)数据库建立的可视化癌症大数据分析平台。
筛选条件:【enter gene name】分别输入E2F1-E2F8,点击【GoPIA】;【Expression DIY】选择【Boxplot】及【Stage plot】,分别输入E2F1- E2F8,设置|Log2FC|Cutoff:1,p-value Cutoff:0.01,【Datasets】选择CESC,点击【plot】,用于分析E2F家族在宫颈癌与正常组织中,以及不同疾病期别间的表达差异。
Kaplan-Meier plotter数据库来源于基因表达综合数据库(Gene Expression Omnibus,GEO)、欧洲基因组(European Genome-phenome Archive,EGA)和TCGA等,目前可评估基因对21种癌症生存的影响,包括宫颈癌[16]。因此,可用此数据库评估E2F家族各成员表达水平与宫颈癌患者总生存期(overall survival,OS)、无复发生存期(recurrence free survival,RFS)的相关性。检验水准α= 0.05。
筛选步骤:选择【Start KM plot for pan-cancer】,【Gene symbol】分别输入E2F1-E2F8;【Split patients by】设为median,病种选择Cervical squamous cell carcinoma,【Survival】分别选择 OS,RFS,获得生存曲线。
cBioPortal是包含多个肿瘤基因组项目的多维癌症数据平台[17],使用cBioPortal分析宫颈癌患者的数据集(TCGA),探索E2F家族的基因变异情况。同时利用该平台筛选出193个宫颈癌中E2F家族成员的相关基因。筛选步骤:(1)点击【Cervix】,选择包含310个样本的【Cervical Squamous Cell Carcinoma and Endocervical Adenocarcinoma(TCGA,Firehose Legacy)】数据库;【Enter Genes】输入E2F1- E2F8;选择【OncoPrint】及【Cancer Types Summary】E2F家族基因突变情况分析。(2)【Co-expression】板块中蓝色代表被选中基因,搜索框分别输入E2F1-E2F8;②生成图中得到Pearson校正值,用于分析宫颈癌E2F家族成员之间的相关性。
String是Search Tool for the Retrieval of Interaction Gene/Proteins的缩写(https://string-db.org/),是一个在线搜索已知的蛋白相互作用关系的数据库,收录了已知和预测的蛋白质/基因间的相互作用关系[18]。具体步骤:cBioPortal数据库中选择【Co-expression】板块,依据P值鉴定出与每个成员最相关的25个基因,去交集后得到193个基因。String中选择【Multiple proteins】,【List Of Names】中导入筛选出的193 个基因,【Organisms】选择 Homo sapiens,点击【SEARCH】匹配到190个基因,将190个基因导入Cytoscape生成蛋白相互作用网络图。
WebGestalt (http://www.webgestalt.org/)支 持在线的基因集富集分析[19],以此对E2F相关基因进行GO功能和KEGG通路富集分析。具体步骤:【Gene List】中导入190个基因,【Organism of Interest】选择 Homo sapiens,【Method of Interest】选择 Over-Representation Analysis(ORA),Funtional Database选择不同的富集类型,【Submit】进行分析。
Timer 2.0是一个提供不同类型癌症中免疫细胞浸润综合分析的公共资源平台[20]。通过该平台的【Immune Association】模块获取免疫细胞散点图,【Gene Expression】分别输入E2F1-E2F,【Immune Infiltrates】选择不同的免疫细胞类型,分析宫颈癌样本中E2F家族的表达与不同类型的免疫细胞浸润(CD4+T细胞、CD8+T细胞、B细胞和巨噬细胞)的相关性。
通过Oncomine数据库比较宫颈癌与正常组织中E2F的转录水平,发现E2F1、E2F2、E2F3、E2F7、E2F8在宫颈癌组织中的表达明显上调(图1A),GEPIA 2数据库证实了相同的结果(图1B)。此外,E2F家族成员在宫颈癌中的表达丰度亦不相同:E2F5的相对表达量在E2F家族成员中最低,而E2F4的表达量最高,但与正常组织无明显差异(图2)。Scotto的数据集中,E2F1在宫颈癌组织中过表达,与正常组织对比倍数变化为3.64(表1)。Biewenga的数据集显示宫颈癌组织中E2F2的表达较正常组织增加(倍数变化 =2.19)。在Zhai等3种不同的数据集中,E2F3在宫颈癌组织中均过表达(倍数变化 = 3.252~4.546)。Pyeon Multi-cancer数据库分析显示,与正常组织相比,E2F7在宫颈癌组织中表达增加(倍数变化 =9.39)。Scotto和Zhai的数据集还提示,E2F8在宫颈鳞状细胞癌组织中亦过表达(倍数变化 = 2.557~2.751)。根据不同的临床分期划分亚组,发现E2F家族各成员在不同临床分期中的表达差异无统计学意义(P> 0.05)(图3)。
图3 E2F家族表达水平与宫颈癌临床分期的相关性(GEPIA2)
表1 E2F家族在不同类型宫颈癌与正常组织中表达水平的倍数变化(Oncomine)
图1 E2F转录因子家族表达分析
图2 宫颈癌中E2F家族的相对表达水平(GEPIA2)
采用Kaplan-Meier plotter数据库分析E2F家族成员的表达水平与宫颈癌患者预后之间的相关性,结果显示,E2F1低表达与患者较差的OS,E2F3高表达与患者较差的RFS均显著相关,差异有统计学意义(P<0.05)(图4)。上述结果提示,具有高E2F1和(或)低E2F3 mRNA表达水平的宫颈癌患者预计具有更高的生存率,这些成员可能是评价预后的潜在标志物。
图4 E2F家族与宫颈癌患者预后的关系(Kaplan-Meier plotter)
通过TCGA数据库和cBioPortal工具对宫颈癌中E2F家族基因变异频率和类型进行分析。选择包含310例宫颈癌样本的数据库,库内共包含191例样本数据,24例(13%)样本检测到E2F家族成员的遗传变异。其中宫颈SCC样本突变率为12.26%(19/155),宫颈AC样本突变率为7.69%(2/26)。如图5所示,E2F1基因变异率为5%,为E2F家族中最高;E2F2、E2F4、E2F7基因变异率1%,为E2F家族中最低。主要变异类型包括基因扩增、基因缺失、错义突变和截断突变等。通过cBioPortal在线工具计算宫颈癌E2F家族成员之间的相关性,并进行Pearson相关分析。结果表明,在宫颈癌组织中E2F2与E2F7、E2F8,E2F3与E2F5,E2F7与E2F8的表达呈正相关;E2F2与E2F5的表达呈负相关,其余家族成员间无明显线性相关(图6)。
图5 宫颈癌中各E2F家族成员的基因改变频率(cBioPortal)
图6 E2F家族各成员之间的相关性(GEPIA2)
首先,通过cBioPortal数据库鉴定出宫颈癌中与E2F转录因子家族最密切相关的193个基因,运用String数据库匹配到其中190个基因,导入Cytoscape软件构建蛋白互作(protein-protein interaction,PPI)网络图(图 7A),结果显示 KIF11、CENPA、CENPM、CENPN和MIS18BP1是与宫颈癌中E2F家族功能相关的核心基因(图7B)。WebGestalt对匹配到的其中191个E2F相关基因进行了GO功能富集分析,结果显示E2F相关基因功能主要与生物调节、能量代谢、细胞成分、应激反应及发育过程等环节有关;E2F相关基因在以下部位、成分中高度富集:细胞核、膜封闭腔、细胞浆、含蛋白质复合物、细胞膜、内膜系统等。就分子功能而言,蛋白质结合、离子结合、核酸结合、核苷酸结合、水解酶活性、转移酶活性等被高度富集。此外,KEEG分析结果表明,E2F相关蛋白与卵母细胞减数分裂、细胞周期和细胞衰老密切相关。
图7 E2F家族相关分子分析(cBioPortal,Cytoscape)
免疫细胞浸润是肿瘤预后和淋巴转移状态的独立评价指标。采用TIMER 2.0分析宫颈癌中免疫细胞浸润与E2F家族各成员之间的相关性,结果显示,除E2F1与B细胞呈正相关(r= 0.283,P< 0.001)外,其余家族成员与B细胞无明显相关性;E2F2,E2F4、E2F,7,E2F8与CD4+ T细胞呈显著性正相关(r= 0.229,0.301,0.432,0.278,P< 0.001),但E2F5与 CD4+ T细胞呈负相关(r= -0.229,P<0.001);CD8+ T细胞与E2F5,E2F8)均呈显著性正相关(r= 0.257,0.282,P< 0.001);E2F3与巨噬细胞浸润呈负相关(r= -0.202,P< 0.001)。以上数据表明,E2F家族在肿瘤免疫细胞浸润的机制中发挥着不同作用,可能与其结构域不同有关。
2020年全球报道的宫颈癌病例中,80%发生在中低收入国家,这给患者和医疗系统带来了沉重的经济负担[21]。因此,降低治疗成本、改善治疗结果对宫颈癌的诊疗管理至关重要。E2F转录因子家族在恶性肿瘤发生发展中的作用也已得到部分证实,但针对其与宫颈癌相关性的生物信息学分析仍有待进行。本研究首次探讨了E2F转录因子家族不同成员在宫颈癌中的表达水平和预后价值,将有助于提高疾病认知,促进治疗优化,改善宫颈癌患者预后。
在E2F家族中,E2F1与宫颈癌的关系是目前研究最多的。研究显示,沉默或过表达转录因子E2F1可导致RNASEH2A表达的显著下调或上调,而RNASE2A过表达可加快DNA复制并缩短细胞周期,从而促进宫颈癌细胞增殖[22]。本研究显示,E2F1在宫颈癌组织中表达明显升高,采用Kaplan-Meier plotter,本研究确定了E2F1在乳腺癌患者中的预后价值,在随访的宫颈癌患者中,E2F1低表达与生存率差显著相关。
到目前为止,关于E2F2在宫颈癌中的表达作用研究较少。Chang等[13]研究显示,E2F2敲除可导致宫颈癌细胞G0/G1期细胞周期停滞。在本研究中,E2F2在宫颈癌组织中的表达高于正常组织。然而,E2F2表达与宫颈癌患者的肿瘤分期、预后均无显著相关。
E2F3过表达是许多类型恶性肿瘤(包括宫颈癌)的致癌因素。Liu等[23]证明了E2F3诱导肝星状细胞活化,激活CD36-AKT-E2F3信号传导和靶向FGF2转录,随后通过FGFR1介导的PI3K/AKT和MEK/ERK信号传导促进肝癌细胞的生长和转移。在乳腺癌中,E2F3被证实是miR-340-5p的靶基因,可被LINC01094间接和正向调控,促进癌细胞增殖[24]。本研究显示,E2F3在宫颈癌组织中的表达高于正常组织,且更低的E2F3表达与宫颈癌患者更好的生存率显著相关。
通常认为E2F7和E2F8是转录抑制因子,但他们亦有可能扮演激活因子的角色。与正常宫颈组织相比,E2F7在宫颈癌样本中上调,其发挥作用的主要途径可能是通过调节CDC6的表达实现的[25]。研究发现,E2F8的表达在多种恶性肿瘤中显著增加,这意味着它可能参与多种肿瘤的发生和进展[26]。E2F8在实验中被证明可通过诱导上皮细胞-间充质细胞转化促进宫颈癌的生长、浸润和复发转移[27],遗憾的是相关研究数量仍然较少。在本研究中,E2F7和E2F8在宫颈癌组织中显著过表达,但其表达水平与宫颈癌患者的肿瘤分期和预后均无关,需要更进一步的实验验证它们在宫颈癌中的作用。
本研究系统地分析了E2F家族在宫颈癌中的表达和其预后价值,尝试深入了解宫颈癌分子生物学层面的异质性。通过对基因的功能和通路的富集分析,进一步加深了对E2F家族在宫颈癌发生和发展中作用的理解。此外,近年来很多报道重视肿瘤中免疫细胞浸润在疾病发生发展中的作用,有效提高了多种癌症的诊断特异性和预后评估的准确性[28-29]。本研究发现,在宫颈癌中多数E2F家族成员的表达与CD4+T细胞浸润呈显著性正相关,与CD8+T细胞、巨噬细胞呈负相关。CD4+和CD8+T细胞都是最常见的免疫细胞,CD8+T细胞是肿瘤浸润淋巴细胞的主要成分。因此,调节CD8+T细胞反应一直是癌症免疫治疗的重点[30],而M0巨噬细胞也在之前的研究中被证明与宫颈癌风险相关[31]。CD4+T细胞、CD8+T细胞和巨噬细胞被认为可通过免疫反应达到抑癌作用,但免疫逃逸机制可能是导致免疫细胞大量浸润却无法发挥抗肿瘤作用的元凶;相反,正反馈机制使免疫细胞浸润进一步加剧,与此相关的深入研究亟待进行。
综上所述,本研究发现,E2F转录因子家族部分成员在宫颈癌中异常表达,并导致免疫细胞浸润比例失调,从而影响临床结局和免疫治疗的效果。E2F家族成员(尤其是E2F1、E2F3)可能是潜在的预后标志物和新的治疗靶点,后续拟通过体内外实验进一步探究其具体作用机制,为宫颈癌患者新治疗方案的发现、更特异预后标准的制定,提供更多理论依据,使更多宫颈癌患者受益。
利益冲突所有作者均声明不存在利益冲突