李 燕,董经茹,魏媛媛,张金艳
(河北医科大学第四医院,河北 石家庄 050011)
宫颈癌(cervical cancer,CC)在全球女性恶性肿瘤中发病率及死亡率均居第4位,是我国女性常见的癌症之一[1],但目前缺乏高度特异性和敏感性的生物标志物用于CC的诊断和预后监测。近年来,大量研究利用微阵列生物信息学技术分析CC发生发展中的差异表达基因(differentially expressed genes,DEGs)及其分子机制[2],为CC的早期诊断、疗效观察、预后监测及基因治疗提供了重要依据。通过人类宫颈癌组织的全基因组表达谱芯片比较CC组织与正常宫颈组织中的DEGs,运用多种生物信息学分析工具分析,极光激酶A(aurora kinase A,AURKA)在CC组织中高表达,随着肿瘤分期的进展AURKA的表达水平升高。AURKA是一种丝氨酸/苏氨酸激酶,对调节细胞有丝分裂进程,维持基因组稳定性至关重要[3]。有研究发现AURKA在多种肿瘤中普遍存在基因扩增和过表达,并且与肿瘤的发生发展及预后存在密切联系[4]。宫颈鳞状细胞癌(cervical squamous cell carcinoma,CSCC)是最常见的宫颈癌组织学类型,且几乎均发生在已婚多产的妇女。本研究以CSCC、宫颈上皮内瘤变(cervical intraepithelial neoplasia,CIN)和女性健康体检者为研究对象,分别采用实时荧光定量PCR(quantitative real-time PCR,qPCR)和酶联免疫吸附试验(enzyme-linked immunosorbent assay,ELISA)方法定量检测CSCC血清中AURKA mRNA及蛋白的表达,并分析其对CSCC的诊断价值及临床意义,探寻以血清AURKA mRNA及蛋白作为无创分子标志物来预测宫颈癌的发生发展的可能性。
2021年6—10月在河北医科大学第四医院就诊的96例患者,年龄25~79岁。其中宫颈鳞状细胞癌患者48例,宫颈上皮内瘤变患者28例,健康体检者20例。所有患者治疗前清晨空腹采集静脉血5 mL于无抗凝剂的真空采血管。本研究已获得河北医科大学第四医院伦理委员会批准(2021KS038),所有患者均知情同意并签署知情同意书。
纳入标准:①患者均为首次就诊,经阴道镜或手术活组织病理检查确诊,入院前未接受过手术及放射治疗、化学治疗等相关抗肿瘤治疗措施;②无其他器官疾病或功能障碍;③患者各项临床资料完整。健康体检者性别为女性,超声及血清肿瘤标志物等均未见异常。
排除标准:①合并有其他恶性肿瘤;②入院前接受过手术或放疗、化疗等其他抗肿瘤治疗;③合并有其他器官功能障碍或自身免疫性疾病。
1.2.1 试剂BIOG游离RNA提取试剂,购于常州百代生物科技股份有限公司;PrimeScriptTMRT Reagent Kit和TB Green®Premix Ex TaqTMII购于日本TaKaRa公司;人AURKA ELISA试剂盒购于河南百奥维克生物科技有限公司;DEPC水购于北京兰杰柯科技有限公司。
1.2.2 仪器QunantStudioDx型PCR仪购于美国Applied Biosystems公司;NanoDrop型微量核酸蛋白浓度测定仪购于美国Thermo公司;PHOMO型酶标仪购于郑州安图生物工程有限公司。
1.2.3 引物设计AURKA为目的基因,GAPDH作为内参基因,由上海生工生物工程股份有限公司合成。引物序列为:AURKA基因,上游5′-GGAATATGCAC CACTTGGAACA-3′,下 游5′-TAAGACAGGGCATTT GCCAAT-3′;GAPDH基因,上游5′-AGAAGGCTGG GGCTCATTTG-3′,下游5′-AGGGGCCATCCACAGTC TTC-3′。
1.3.1 筛选差异表达基因GEO2R是基因表达综合(Gene Expression Omnibus,GEO)数据库自带的基于R语言的在线分析工具,允许用户对GEO数据进行转换和复杂分析,以帮助识别和可视化差异基因表达[5]。通 过GEO2R对GSE63514、GSE52903、GSE39001、GSE27678和GSE9750共5个微阵列数据集中癌组织和癌旁正常组织样本进行分组,以调整后的P<0.05和|log2(FC)|>1为标准,筛选两组样本的DEGs。FC(fold change)为基因表达的差异倍数变化,log2(FC)>1的基因定义为上调基因,log2(FC)<-1的基因定义为下调基因。通过在线分析网站绘制Venn图,获得5个GEO数据芯片上调基因的交集与下调基因的交集。
1.3.2 功能富集分析在DAVID数据库中选择“Functional Annotation”分析工具,批量输入通过Venn图获得的DEGs,“Select species”输入“Homo sapiens”,提交数据后进行基因本体(gene ontology,GO)功能注释分析和京都基因与基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)通路富集分析。以P<0.05为标准筛选重要的功能注释及通路富集结果。
1.3.3 蛋白互作网络构建与分析利用STRING在线数据库构建DEGs介导的蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络,以揭示它们之间的复杂相互作用。设置最低关联度为0.7,并隐藏网络中孤立的和部分连接的节点。将分析结果导入Cytoscape[3]软件进行可视化,应用Cytohubba[6]插件进行关联度分析,取关联度排名前10的差异表达基因节点作为关键基因。
1.3.4 生存预后分析Kaplan-Meier plotter是常用的检测基因与肿瘤患者预后相关性的在线分析网站[7],对10个关键基因进行生存分析,筛选出与宫颈癌预后相关的分子标志物。选择“RNA-seq Start KM plotter for pan-cancer”,将筛选出的枢纽基因输入,限定条件为总体生存期(OS),生存时间统计最长为120个月。肿瘤样本为304例宫颈癌患者,肿瘤病理类型、分期及其病人性别等其他条件不做限制,进行Kaplan-Meier生存分析。以P<0.05作为条件筛选出与宫颈癌预后相关的关键基因。
1.3.5 关键基因mRNA水平的表达基因表达谱交互式分析(gene expression profiling interactive analysis,GEPIA)可对基于癌症基因组图谱(the cancer genome atlas,TCGA)和基因型-组织表达(the genotype-tissue expression,GTEx)数据库的肿瘤和正常组织进行基因表达分析[8]。在GEPIA2表达分析模块选择Box Plot,数据来源选择CC,得到关键基因在宫颈癌及正常宫颈组织中的表达情况,选择Stage Plot分析关键基因与肿瘤病理分期的关系。P<0.05为差异具有统计学意义。
1.3.6 关键基因蛋白水平的表达人类蛋白质图谱(the human protein atlas,HPA)可对编码的蛋白质进行免疫组织化学染色研究。利用HPA数据库进一步验证与宫颈癌患者生存相关的4个关键基因在组织中蛋白水平的表达情况。组织图谱模块获得关键基因在正常宫颈组织的免疫组织化学染色,病理图谱模块获得其在宫颈癌组织的免疫组织化学染色,比较这些关键基因的抗体在宫颈癌组织和正常组织中免疫组织化学染色的差异。
1.3.7 血清游离AURKA mRNA及蛋白检测血液离体后立即分离血清,提取血清循环游离RNA,使用微量核酸蛋白浓度测定仪检测血清RNA的浓度和纯度,以DEPC水作为空白对照,吸取2μL提取的RNA溶液进行检测。血清RNA浓度为40~160 ng/μL,260 nm和280 nm波长下的吸光度之比在1.8~2.1之间,提示RNA浓度和纯度符合后续实验要求,利用qPCR检测血清AURKA mRNA的表达,反应结束后确认qPCR的扩增曲线和熔解曲线,利用2-ΔΔCT计算样本目的基因的相对表达量,即ΔCT=CT,目的基因-CT,对照基因,ΔΔCT=ΔCT,实验组-ΔCT,对照组。ΔΔCT值越高,表示基因表达水平越低。采用ELISA检测血清AURKA蛋白水平的表达,以标准品浓度为横坐标,对应吸光度值为纵坐标,绘制标准品线性回归曲线,根据曲线方程计算各样本中AURKA的浓度。
采用SPSS 26.0和GraphPad Prism 9.0软件对数据进行统计分析,以α=0.05为检验水准。计量资料进行Shapiro-Wilk正态性检验和Levene方差齐性检验,正态分布资料以±s表示,偏态分布以M(Q)表示。正态分布且方差齐时多组比较采用方差分析,否则采用Kruskal-WallisH检验。采用Spearman秩检验分析血清AURKA mRNA及蛋白的相关性。利用受试者工作特征曲线(receiver operating characteristic curve,ROC)及曲线下面积(area under curve,AUC)评估血清AURKA对CC的诊断价值。采用χ2检验分析血清AURKA mRNA表达与CC患者临床病理特征间的关系。
通过GEO2R在线分析5个微阵列数据集中187例宫颈癌组织和80例正常宫颈组织基因测序结果。火山图显示了每个数据集中DEGs分布(见图1)。Venn图对数据取交集得到60个共同的差异表达基因(见表1),包括41个上调和19个下调基因(见图2)。
图1 5个数据集差异基因的火山图
表1 60个共表达的差异表达基因
图2 Venn图显示5个数据集共有差异表达基因的交集
GO富集分析结果显示,差异表达基因主要参与的生物过程(biological process,BP)为细胞分裂、DNA复制、有丝分裂的G1/S期转换、有丝核分裂、细胞增殖转录的负调控、p53类介体对信号转导的调控、有丝分裂的G2/M期转换、DNA修复、细胞周期等;主要参与的细胞成分(cell component,CC)为核质、细胞质、膜、主轴、微管、中心体、蛋白质复合物、着丝粒、染色体、MCM复合体等;主要参与的分子功能(molecular function,MF)为蛋白质结合、ATP结合、DNA结合、酶结合、蛋白质同源二聚化活性、蛋白激酶结合、染色质结合、微管结合、蛋白质丝氨酸/苏氨酸激酶活性、DNA解旋酶活性等(见图3A)。KEGG通路富集结果显示,差异表达基因主要富集在DNA复制、细胞周期、p53信号通路、错配修复、嘧啶代谢、卵母细胞减数分裂、铂耐药、泛素介导的蛋白质水解、病毒致癌等信号通路(见图3B)。
图3 差异表达基因功能富集可视化结果
通过STRING在线分析构建DEGs的PPI网络,该网络中总共包含60个节点和660个边(见图4A)。通过Cytoscape软件对PPI网络进行可视化处理,利用Cytohubba插件计算出关联度前10的节点基因作为宫颈癌的重要关键基因,分别为CDK1、NCAPG、TOP2A、AURKA、UBE2C、RRM2、TTK、CDC20、MCM2、RFC4(见图4B)。
图4 差异表达基因的PPI网络和枢纽基因
Kaplan-Meier生存分析结果显示,10个关键基因中筛选出4个基因与TCGA数据库中宫颈癌患者生存相关,且4个关键基因均为表达上调基因,分别为AURKA、CDK1、MCM2、RFC4。其中AURKA基因的表达水平与宫颈癌患者10年总体生存率呈负相关,即AURKA基因高表达的宫颈癌患者生存时间更短(见图5)。
图5 宫颈癌患者的生存曲线
2.5.1 AURKA基因转录水平的差异GEPIA2表达分析模块分析结果显示与正常组织相比,AURKA mRNA在宫颈癌组织中高表达(P<0.05),且与GEO数据集的分析结果一致(见图6)。进一步分析关键基因与宫颈癌分期的关系,结果显示AURKA mRNA在宫颈癌不同阶段的表达水平存在显著差异(P<0.05),随着肿瘤分期的进展AURKA mRNA的表达升高(见图7)。
图6 GEPIA2在线工具分析结果
图7 AURKA mRNA在宫颈癌不同分期的表达
2.5.2 AURKA蛋白水平差异HPA数据库的免疫组织化学分析结果显示,与正常宫颈组织相比,宫颈癌组织中AURKA的抗体特异性着色程度均加深,即在宫颈癌组织中表达较高。
AURKA mRNA扩增曲线为平滑的S型曲线,阈值循环数(CT)值在20~30之间,提示扩增结果可靠。熔解曲线为单一峰,没有引物二聚体的产生,表示特异性较好(见图8)。CSCC和CIN患者血清AURKA mRNA的相对表达水平明显高于健康体检者,差异有统计学意义(P<0.05)。CSCC与CIN患者血清AURKA mRNA的相对表达水平无显著差异。CSCC患者血清AURKA蛋白的表达水平明显高于CIN及健康体检者(P<0.05),与血清AURKA mRNA相对表达不同的是,CIN患者与健康体检者血清AURKA蛋白表达水平无显著差异(见图9)。经Spearman相关性分析,血清AURKA mRNA与蛋白表达水平呈正相关关系,但关联性较弱(r=0.237,P=0.020)。
图8 AURKA mRNA扩增曲线及熔解曲线
图9 宫颈鳞状细胞癌患者血清AURKA mRNA及蛋白的表达
根据ROC曲线,血清AURKA mRNA和蛋白预测CSCC最佳截断值分别为2.028和3.239,此时曲线下面积(AUC)分别为0.869(敏感度75%,特异度90%)和0.699(敏感度85.4%,特异度60%)(见图10)。根据ROC曲线的截断值,将AURKA mRNA表达水平分为高表达组和低表达组。经χ2检验发现,血清中高表达与低表达AURKA mRNA的CSCC患者年龄、分化程度均无明显差异(P>0.05),而患者FIGO分期、是否有淋巴结转移、肿瘤大小及肌层浸润深度差异明显(P<0.05)。血清中高表达AURKA mRNA的CSCC患者往往临床分期较晚、瘤组织较大、肌层浸润更深、更易发生淋巴结转移(见表2)。
表2 血清AURKA mRNA表达与宫颈鳞状细胞癌患者临床病理特征的关系
图10 AURKA mRNA及蛋白预测宫颈鳞状细胞癌患者的ROC曲线
本研究比较了5个微阵列数据集中宫颈癌组织与正常宫颈组织的mRNA表达谱,筛选出共同的DEGs,并通过多种生物信息学工具综合分析它们的潜在功能。GO功能注释结果显示,DGEs在细胞有丝分裂、核质、染色体和DNA解旋酶活性中显著富集,表明其中一些DEGs可能定位于细胞核中,通过增强宫颈癌中的DNA解旋酶活性参与细胞分裂周期过程以促进细胞增殖。KEGG富集分析发现,DEGs在DNA复制、细胞周期、p53信号通路、卵母细胞减数分裂和病毒致癌等信号通路中显著富集。Mine等[9]研究发现,基因染色体畸变直接或间接驱动细胞周期失调和抗病毒基因活性,导致宫颈癌发生发展。构建共同DEGs的蛋白质-蛋白质相互作用网络,确定了关联度较高的10个重要关键基因。通过Kaplan-Meier分析枢纽基因的表达与TCGA数据库中宫颈癌患者生存预后之间的相关性,发现与CC预后相关的4个关键基因,即AURKA、CDK1、MCM2和RFC4。
为进一步探究4个关键基因与宫颈癌发生的关系及相关的分子机制,将其导入STRING在线分析网站,结果显示关键基因主要富集在细胞有丝分裂过程中,包括DNA复制、细胞分裂周期相变。Espinosa等[10]研究发现,有丝分裂是宫颈癌筛查、生存和治疗靶标的潜在标志物来源,而抑制有丝分裂是重要的抗癌策略。由此推断,4个关键基因作为促癌基因可能通过加速细胞周期转换,促进肿瘤细胞增殖分化,从而导致人类宫颈癌的发生和发展。PPI网络和生存分析结果显示AURKA基因是和CC分期及预后相关的潜在生物标志物。
本研究基于生物信息学分析结果显示,与正常宫颈组织相比,CC组织中AURKA mRNA及蛋白表达较高。通过qPCR及ELISA技术检测CSCC患者血清AURKA mRNA及蛋白的表达,结果显示CSCC和CIN患者血清AURKA mRNA的表达明显高于健康体检者,CSCC血清AURKA蛋白的表达明显高于CIN及健康体检者。CSCC血清AURKA mRNA高表达组患者FIGO分期、淋巴结转移、肿瘤大小及肌层浸润深度均分别高于AURKA mRNA低表达组(P<0.05),这提示血清中高表达AURKA mRNA可能具有预测CSCC患者临床进展和预后的作用。本研究结果及文献报道相似,Twu等[11]通过免疫组织化学染色检测正常宫颈、CIN和浸润性宫颈癌(鳞癌和腺癌)组织中AURKA的表达,结果显示其在浸润性宫颈癌和CIN组织中的表达显著高于正常宫颈组织。与腺癌相比,鳞癌中AURKA的表达更高。Zhang等[7]采用qPCR检测宫颈癌细胞系及74例宫颈癌患者配对癌组织和相应非癌组织中AURKA mRNA的表达,通过蛋白质印迹和免疫组织化学测定细胞悬液和组织中AURKA蛋白的表达,结果显示AURKA mRNA和蛋白在宫颈癌细胞系和组织中的表达显著高于正常宫颈上皮细胞和非癌组织,AURKA mRNA表达与FIGO分期、肿瘤分化、宫旁浸润、淋巴结或血行转移相关,高表达患者的OS和无病生存率更差,提示其可能在原发肿瘤的进展和侵袭中发挥重要促癌作用,并有潜力成为宫颈癌早期诊断和预后监测的指标。有学者提出AURKA表达可能预测宫颈癌患者的结局,但其在宫颈癌发病机制中的确切功能和分子机制尚不明确[12]。AURKA是细胞周期调节激酶,对维持基因组稳定性至关重要[3]。先前的一项研究发现,抑制AURKA可作为HPV E7癌基因的合成致死靶点,用小分子抑制剂Alisertib抑制AURKA可选择性地靶向体内表达HPV E7的细胞,AURKA的过度表达对HPV转化的宫颈癌细胞的存活至关重要[13]。研究发现AURKA过表达可增强G1/S细胞周期过渡,促进细胞增殖,并保护细胞免受凋亡,产生抗肿瘤药的化学耐受性[14]。
综上所述,本研究发现CC患者血清中AURKA mRNA及蛋白的表达水平升高且与CSCC患者临床进展有关,二者联合检测对于CSCC诊断及监测预后具有一定意义。