鉴定并验证KIF20B对高级别浆液性卵巢癌的影响

2022-02-04 10:26赵静王雅卓王润芳李娜褚兆苹韩华赵源王蓓田菲张媛张蕴霞
河北医药 2022年22期
关键词:差异基因高级别靶标

赵静 王雅卓 王润芳 李娜 褚兆苹 韩华 赵源 王蓓 田菲 张媛 张蕴霞

上皮性卵巢癌(EOC)是恶性程度最高的妇科肿瘤之一[1]。大多数患者早期无明显不适,诊断时已为晚期[2],这在很大程度上解释了这种恶性肿瘤预后差的原因。上皮性卵巢癌是一种包含多种组织学亚型的异质性疾病[2],但其癌变机制尚未完全阐明。根据二元癌变模型理论,卵巢癌包括Ⅰ型和 Ⅱ型两类[3]。Ⅰ型肿瘤通常是惰性的,以信号通路相关基因(KRAS、BRAF、PIK3CA、CTNNB1、ARID1A、PPP2R1A和PTEN)突变为特征,包括低级别浆液性、黏液性、子宫内膜样癌和透明细胞癌及Brenner瘤等[3]。与Ⅰ型肿瘤相比,Ⅱ型肿瘤侵袭性强,基因稳定性差,常含有p53和BRCA1/2突变,包括高级别浆液性癌、子宫内膜样癌和未分化癌等[3,4]。其中致死率最高的高级别浆液性卵巢癌(HGSOC)[5,6]患者虽然对标准治疗(包括减瘤手术和基于铂的化疗)反应良好,但他们之中很多人术后不久却因为耐药大大降低了生存率[7]。在过去的十年中,通过标准疗法治疗的患者的生存率也仅有微小的改善,因此阐明其分子机制和发现新的分子生物标志物对于HGSOC具有非常重要的意义[8]。庆幸的是,生物信息学技术的大力发展使得我们可以利用大数据筛选目标基因并对其进行探究分析,也为后续的基础研究及临床实践提供了重要的理论依据。在我们的研究中,首先使用R语言分析了来自Gene Expression Omnibus (GEO)数据库中的3个表达谱芯片数据集,以确定HGSOC与正常人类卵巢表面上皮样本(HOSE)之间的差异基因。并通过GO[9]、KEGG[10]通路富集分析和PPI网络分析,揭示了HGSOC可能相关的分子机制,并挖掘出176个差异基因(DEGs),在这176个差异基因中我们使用MCODE插件鉴定出22个核心基因,在这22个核心基因中我们发现KIF20B在HGSOC中显著高表达,为了鉴定并验证KIF20B作为卵巢癌生物标志物的可行性及对卵巢癌的影响,我们随机对其进行了生存曲线分析,ROC曲线分析及其与免疫浸润的相关性分析,报道如下。

1 材料与方法

1.1 数据获取与差异基因分析 为了探索高级别浆液性卵巢癌的相关基因,我们从GEO (http://www.ncbi.nlm.nih.gov/geo) Affymetrix GPL570平台[11]通过使用R包中GEOquery包下载了3个微阵列数据集(GSE18520[12], GSE27651[13], GSE40595[14])。其中,GSE 18520数据集包含53个高级别浆液性卵巢癌组织样本(HGSOC,n=53)和10个正常人类卵巢表面上皮样本(HOSE,n=10)。GSE27651含有6个人卵巢表面上皮细胞(HOSE,n=6)和22个高级别浆液性卵巢癌(HGSOC,n=22)。GSE40595包含32个来自高级别浆液性卵巢癌患者(HGSOC,n=32)和6个正常人类卵巢表面上皮样本(HOSE,n=6)。使用limma包进行差异基因分析,|logFC (fold change)| >2和P<0.05为差异有统计学意义。为了直观地显现差异基因表达的情况,我们利用R包中的ggplot2对3个数据集进行差异基因(DEGs)分析,并使用韦恩图进行可视化。

1.2 功能富集分析 为了进一步系统地分析DEGs的功能注释,我们使用了R中的clusterProfiler包[15]进行GO和KEGG分析,并利用org.Hs.eg.db包进行基因ID转换,P<0.05为差异有统计学意义。

1.3 蛋白互作网络构建及核心基因鉴定 我们使用STRING数据库 (http://string-db.org )[16]和Cytoscape (version 3.4.0)[17]绘制了蛋白蛋白互作网络图(PPI),并使用Cytoscape中的MCODE插件 (version 1.4.2)分析出互作关系中最强大的模块,这些模块中的基因即为核心基因。MCODE评分>5, degree cut-off=2, node score cut-off=0.2, Max depth=100, k-score=2差异有统计学意义。

1.4 核心基因与生存预后关系分析 为了深入挖掘与预后相关的基因,我们利用Kaplan-Meier Plotter (http://kmplot.com/analysis/index.php?p=service&

cancer = ovar)[18]数据库分析核心基因表达与高级别浆液性卵巢癌患者总生存期(OS)和无进展生存期(PFS)的关系,筛选出对HGSOC生存及预后有影响的靶标基因。

1.5 预后标志物鉴定 为了探究靶标基因KIF20B作为卵巢癌生物标志物的可行性及预测能力,我们使用pROC包[1.17.0.1版本]对TCGA中的卵巢癌数据集进行KIF20B的ROC曲线分析,并使用ggplot 2包[3.3.3版本]进行可视化展现。

1.6 靶标基因与肿瘤细胞免疫浸润分析 为了明确靶标基因KIF20B是否通过调节免疫微环境影响患者预后,我们使用R中的GSVA包[1.34.0版本]对靶标基因KIF20B进行免疫浸润分析,并在TIMER数据库中加以验证,P<0.05为差异有统计学意义。

1.7 KIF20B的分子相关性分析 为了探究与KIF20B密切相关的分子以探究其作用机制,我们使用R 的ggplot2[3.3.3版本]对TCGA数据集进行KIF20B的分子相关性分析,P<0.05为差异有统计学意义。

1.8 免疫组化验证KIF20B在HGSOC中的表达 选自河北省人民医院2018至2021年行手术切除并且病理证实为高级别浆液性卵巢癌组织及正常卵巢组织所制标本蜡块各20块。卵巢癌组织均为原发性肿瘤,正常卵巢组织均为因子宫肌瘤、功能性异常子宫出血、子宫脱垂等良性疾病切除子宫的同时切除卵巢的病例,病理证实卵巢组织无异常。采用SP法进行免疫组化染色,DAB显色后发现KIF20B定位于胞浆,呈现黄色或棕褐色为阳性。显微镜下随机选10个高倍镜视野(×400)结果判定:按细胞显色有无及深浅计分:0分为无色,1分为浅黄色,2分为棕黄色,3分为棕褐色;按显色细胞所占比例计分:0分<1%,1分1%~10%,2分11%~25%,3分26%~50%,4分51%~75%,5分>75%,二者乘积之和即为该切片积分,>5分认为为阳性染色,由两位资深病例学专家单独评定,并达成一致意见。

2 结果

2.1 差异基因鉴定 我们使用GEOquery包识别出GSE18520中的698个基因,GSE27651中的568个基因,GSE40595中的1 012个基因。其中,GSE18520中高表达基因404个,低表达基因294个;GSE27651中高表达基因357个,低表达基因211个; GSE40595中高表达基因160个,低表达基因852个。3个数据集的重叠部分包含176个差异基因,如韦恩图所示,提示这176个差异基因可能对HGSOC具有重要意义,值得深入研究。见图1。

图1 韦恩图

2.2 功能富集分析 我们使用R中的clusterProfiler包对176个DEGs进行了功能富集分析。DEGs的生物学过程(BP)在核染色体分离、核有丝分裂中显著富集;细胞组分(CC)的变化主要集中在纺锤体、着丝粒区;分子功能(MF)主要在糖胺聚糖结合,肝素及含硫化合物等结合方面富集。提示这些差异基因主要与细胞周期及糖代谢等功能相关。见图2。

图2 功能富集分析

2.3 蛋白互作网络构建及核心基因鉴定 我们使用Cytoscape构建DEGs的蛋白互作网络(PPI),并找到最强大的模块从而确定出联系最紧密的22个核心基因。见图3、4。

图3 蛋白-蛋白互作网络图

图4 核心基因

2.4 核心基因与生存预后关系分析 我们利用Kaplan-Meier Plotter在线数据库对22个核心基因进行生存分析。我们发现在HGSOC患者中核心基因KIF20B的高表达与低表达患者的PFS和OS差异均有统计学意义(P<0.05),提示该基因的差异表达对HGSOC患者预后有显著影响。见图5。

图5 KIF20B的差异表达对HGSOC患者生存预后的影响

2.5 预后标志物鉴定 我们利用R语言对TCGA数据库中浆液性囊腺癌样本进行KIF20B的ROC曲线分析,曲线下面积AUC为0.875,提示KIF20B对于卵巢癌患者的预后具有较好的预测性。见图6。

图6 TCGA数据集中KIF20B的ROC曲线分析图

2.6 靶标基因与肿瘤细胞免疫浸润分析 肿瘤浸润淋巴细胞的分布是判断患者淋巴结状况的重要指标。我们使用R中GSVA包对靶标基因KIF20B进行免疫分析时发现KIF20B高表达患者的T细胞富集程度低于低表达患者(P<0.05),提示KIF20B可能参与调节HGSOC患者免疫浸润从而影响患者的生存预后。TIMER数据库检索进一步显示卵巢癌患者KIF20B的表达与B细胞的浸润程度呈负相关,与CD4+T细胞、巨噬细胞浸润程度呈正相关(P<0.05)。见图7、8。

图7 KIF20B差异表达对HGSOC患者T细胞富集程度的影响

图8 KIF20B的表达与免疫细胞浸润程度的相关性

2.7 KIF20B的分子相关性分析 为了探究与KIF20B密切相关的分子以探究其作用机制,我们使用R 的ggplot2[3.3.3版本]对TCGA数据集进行KIF20B的分子相关性分析,结果提示KIF20B与BIRC5及BCL2A1的表达密切相关。

2.8 KIF20B在HGSOC患者中呈高表达 我们对20块HGSOC及20块HOSE组织蜡块进行免疫组化染色后分析发现在HGSOC患者中KIF20B的阳性表达率(17/20≈85%)显著高于在HOSE患者中的阳性表达率(1/20≈5%),差异有统计学意义(P<0.05),实验验证符合生信分析数据结果。见图9。

图9 KIF20B在HGSOC组织中的免疫组化染色结果

3 讨论

上皮性卵巢癌分为两型,Ⅰ型肿瘤是低级别的、生长缓慢的卵巢肿瘤。而Ⅱ型肿瘤是高级别的、侵袭性强恶性程度极高的卵巢肿瘤[19],其中HGSOC在上皮卵巢癌中占>60%,而在卵巢癌死亡病例中占>70%[20,21],所以确定HGSOC的特异性生物标志物和靶标基因对于提高卵巢癌的早期检测和预防率非常重要,并可能为治疗晚期卵巢癌提供有利帮助。

在我们的研究中发现HGSOC和HOSE之间有176个DEGs。GO的变化主要富集在染色体分离、纺锤体中,之前的已有的研究表明细胞周期的失调可能在肿瘤的癌变过程中发挥重要作用[22-24],这与我们的发现相一致。在挖掘到的22个核心基因中,我们发现KIF20B的表达可以显著影响卵巢癌患者的生存和预后。KIF20B是参与有丝分裂磷酸化蛋白的家族成员之一,它是一种缓慢正端定向的驱动蛋白相关蛋白,并在G2/M转变时被磷酸化,它有固定的表达定位与表达模式,主要表达于细胞核,但我们的免疫组化结果提示它在卵巢组织中表达于胞浆。众多研究提示它可以促进膀胱癌、肝癌、结直肠癌、肾细胞癌、舌癌和乳腺癌等多种恶性肿瘤的进展[25-30]。Chen等[31]的研究发现,KIF20B 可促进胰腺癌细胞增殖,并可能成为胰腺癌的潜在治疗靶点。Alahmad等[32]的研究还发现KIF20B可能是参与阵发性夜间血红蛋白尿患者免疫缺陷机制的自身靶标抗原。而迄今为止,关于KIF20B对于卵巢癌尤其是高级别浆液性卵巢癌的影响尚不明确。我们的研究发现KIF20B在HGSOC患者中呈高表达,低表达患者的PFS与OS显著优于高表达患者,提示KIF20B的差异表达与HGSOC患者预后密切相关。ROC曲线分析中AUC>0.75,提示KIF20B对于卵巢癌预后具有很好的预测性,基于此研究结果,我们推荐KIF20B作为卵巢癌的生物标志物指导预后,当然这也需要后续的临床研究加以验证。凋亡抑制因子5(BIRC5)通过抑制凋亡促进多种恶性肿瘤的增殖侵袭,B淋巴细胞瘤2相关蛋白1(BCL2A1)与免疫微环境息息相关,分子相关性分析提示KIF20B与这两个基因密切相关,提示KIF20B可能通过抑制凋亡促进卵巢癌的增殖侵袭,并且可能参与调节肿瘤免疫微环境。R中GSVA包与TIMER数据库对KIF20B在卵巢癌中的免疫分析提示,KIF20B在正常卵巢组织及肿瘤组织中免疫浸润程度具有显著差异,再次提示KIF20B或可通过调节肿瘤免疫微环境影响卵巢癌的进展,但机制仍需进一步实验加以验证。

综上所述,我们的实验研究通过综合的生物信息学分析,筛选出靶标基因KIF20B,并发现其与高级别浆液性卵巢癌患者的预后密切相关,对于卵巢癌预后具有良好的预测性,可作为预测卵巢癌预后的生物标志物,分子相关性分析及免疫浸润分析提示其可能通过抑制凋亡及参与调节肿瘤免疫微环境促进卵巢癌的增殖侵袭,虽然我们已经验证了KIF20B在卵巢癌组织中的表达,但仍需后续实验进一步确认和分析其具体作用机制。

猜你喜欢
差异基因高级别靶标
纳米载体可缓解农药对靶标作物的负作用
成人高级别脑胶质瘤术后复发相关因素分析
肺原发未分化高级别多形性肉瘤1例
“百灵”一号超音速大机动靶标
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
纳米除草剂和靶标生物的相互作用
SRSF2、HMGA2和Caspase-3在卵巢高级别浆液性癌及其前驱病变中的表达及意义
紫檀芪处理对酿酒酵母基因组表达变化的影响
前列腺特异性膜抗原为靶标的放射免疫治疗进展
高级别岛叶胶质瘤的外科治疗策略