基于生物信息学分析UBE2C、TTK和CP 对卵巢癌预后的影响

2022-03-17 07:14马惠涵秘嘉庆马梅杰冯勤梅
中国医药导报 2022年4期
关键词:细胞周期卵巢癌途径

马惠涵 秘嘉庆 秦 倩 马梅杰 冯勤梅

1.山西医科大学第五临床医学院,山西太原 030001;2.山西医科大学附属人民医院妇科,山西太原 030012

卵巢癌是妇科癌症中导致女性死亡的主要原因。晚期卵巢癌患者5 年生存率不到20%,且多数患者会在18 个月的中位无进展生存期复发[1-2]。

转录异常的基因可作为癌症的预后标志物,在临床试验中进行新药研发和指导治疗[3]。Leoutsakou等[4]使用半定量RT-PCR 方法发现SRA1 基因在卵巢肿瘤组织中高表达,Dong 等[5]将胰岛素样生长因子2确定为卵巢癌与卵巢组织的差异表达基因,Fu 等[6]通过蛋白质组学和转录组分析发现UTP23 的低表达促进了卵巢癌细胞对紫杉醇的耐药性,但因不稳定性和非适用性,目前尚鲜见报道可指导临床的生物标志物。

本研究从NCBI 基因表达综合数据库下载数据集,利用R 软件识别卵巢癌与正常对照间的差异表达基因(differentially expressed genes,DEG),并进行功能富集分析。此外,建立DEG 和关键模块的蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络并进行模块分析、生存分析及相关性分析,最终发现3 个与卵巢癌预后相关的重要基因。

1 材料与方法

1.1 基因表达谱数据

基因表达汇编(gene expression omnibus,GEO)由美国国立生物技术信息中心创建,保存高通量功能基因组学数据。4 个数据集均出于此且已发表相关文献。

1.2 微阵列数据集的综合分析

基于编程语言R,使用hgu133plus2.db 注释包和hgu133a.db 注释包转换基因名,使用limma 软件包[7]识别出4 个数据集中卵巢癌组织与对照健康卵巢组织相比的DEG,用VennDiagram 软件包[8]对DEG 进行整合。|logFC|>1.5 和P <0.05 被认为对DEG 有统计学意义。logFC>1.5 认为是上调DEG,logFC<1.5 为下调DEG。

1.3 功能和途径富集分析

使用Clusterprofiler 包对DEGS 进行功能和途径富集分析,显著阈值设定为P<0.05。基因本体论(gene ontology,GO)功能富集主要从细胞成分、生物过程和分子功能三方面描述基因和其产物的功能。京都基因和基因组百科全书(Kyoto encyclopedia of genes and genomes,KEGG)途径富集分析从基因的生化途径和调控途径等方面进行说明。

1.4 PPI 网络构建和模块筛选

使用数据库STRING 映射DEG 以综合得分≥0.4为截止值。Cytoscape 软件[9]构建PPI 网络,可视化分析卵巢癌中DEG 编码蛋白间的相互作用并使用Cytohubba 鉴定出20 个hub 基因。同时用分子复合物检测(molecular complex detection,MCODE)PPI 网络的密集区域,选择MCODE分数>3 和节点数>4 的模块并对基因分别进行KEGG 富集分析。

1.5 中枢基因的生存分析

Kaplan-Meier Plotter 中有大量卵巢癌患者的临床数据,可用于分析20 个hub 基因对存活的影响,选择logrank P <0.05 的基因。

1.6 hub 基因表达水平分析

使用基因表达谱交互式分析(gene expression profiling interactive analysis,GEPIA)对影响预后的hub基因进行表达水平分析,设定P <0.01 为差异有统计学意义。

2 结果

2.1 基因表达谱数据

纳入4 个数据集,共297 例卵巢癌样本和32 例健康对照样本(表1)。经limma 软件包筛选出812、2820、1495 和536 个DEG(|logFC|>1.5,P <0.05),通过VennDiagram 包进行基因整合。通过VennDiagram包对4 个数据集中的105 个DEGs 取交集。与正常卵巢组织比较,卵巢癌组织样本中共有135 个DEG。见图1。

表1 数据集的相关信息

2.2 富集分析

在编程语言R 中使用Clusterprofiler 包对DEG进行生物学注释并得到P 值<0.05 的GO 功能富集。其显著性结果表明:细胞组成中,上调DEG 主要富集在双株紧密连接、后期促进复合物、顶端连接复合物及紧密连接中,下调DEG 主要富集在细胞外基质、含胶原的细胞外基质及血液微粒中;生物过程中,上调DEG 明显富集在有丝分裂纺锤体组装检查点、染色体分离调控、细胞周期中后期转变的调控和染色体分离等,下调DEG 明显富集在蛋白丝氨酸/苏氨酸激酶活性的调控、黏多糖代谢过程和Wnt 信号通路;分子功能中,下调DEG 主要在肝素结合及卷曲结合中富集,而上调DEG 未见符合标准的明显富集。

2.3 PPI 网络与模块分析

经STRING 数据库建立PPI 网络并导入Cytoscape软件。MCODE 检测到4 个模块,选择分数较高模块进行下一步分析(图2)。使用Cytohubba 筛选hub 基因,前20 分别为KDR、SOX9、EPCAM、WNT5A、FGF13、PDGFRA、CP、ALDH1A1、KLF4、CDC20、UBE2C、FGF9、SOX17、TTK、TRIP13、CKS2、RACGAP1、CD24、CHGB、LAMB1。

2.4 KEGG 途径富集模块中的基因

经KEGG 富集分析后发现:模块1 中均为上调DEG,主要在细胞周期、泛素介导蛋白水解作用途径富集;模块2 中除ALDH1A1 为下调DEG,余为上调DEG,未见明显通路富集;模块3 中除CP 为上调DEG,余为下调DEG,富集后CP 在铁死亡、卟啉和叶绿素代谢途径中存在,LAMB1 在ECM 受体相互作用、小细胞肺癌等途径中存在。

2.5 hub 基因的生存分析和表达水平分析

在Kaplan Meier Plotter 中对20 个hub 基因进行生存分析,发现13 个基因关联卵巢癌患者的预后较差(P <0.05)。使用GEPIA 进一步分析发现,卵巢癌样本中有SOX9、EPCAM、CP、UBE2C、TTK、RACGAP1、CD24 7 个基因反映出高表达(P <0.01)。见图3。

3 讨论

为确定卵巢癌预后不良的重要基因,本研究采用生物信息学方法对GEO 数据库的数据集进行整合分析。最终取交集得到UBE2C、TTK、CP 3 个基因在卵巢癌中高表达且影响预后,又显著富集于KEGG 通路,将其认为是改善卵巢癌患者预后的有效靶点。

UBE2C 在细胞周期进程中促进目标蛋白降解,异常的UBE2C 过表达与异常的细胞增殖可能相关[14]。Wang 等[15]研究显示UBE2C 在胃癌中高表达,敲低UBE2C 会通过Wnt/β-catenin 和PI3K/Akt 信号通路抑制胃癌肿瘤形成,将其定义为诊断胃癌潜在生物标志物。Yuan 等[16]构建基因共表达网络鉴定出6 种与透明细胞肾细胞癌的进展和预后相关的hub 基因,其中包括UBE2C。Martínez-Canales 等[17]通过数据集转录组功能注释和PPI 网络分析确定UBE2C 基因的过表达与较差预后相关,和本研究一致。

TTK 的转录水平在细胞进入正常细胞周期中通过有丝分裂时被上调,后期被泛素E3 连接酶降解失活而下调,也就是TTK 的及时失活才能维持正常细胞周期进程[18]。Tang 等[19]使用加权共表达网络分析确定TTK 可作为乳腺癌临床研究的预后生物标志物,Zhang 等[20]从公开转录组数据发现高水平TTK 与大肠癌患者预后不良有关,Feng 等[21]使用与本研究不完全相同的GEO 数据集发现卵巢癌中4 个影响预后的显著上调基因,其中包括TTK,间接验证本研究的可靠性。

CP 基因编码铜蓝蛋白,血清中铜蓝蛋白水平在炎症和组织损伤中上调[22]。Arner 等[23]发现CP 在肥胖受试者的脂肪组织和与肥胖相关的癌细胞中过表达(如子宫内膜癌),将其确定为新型脂肪因子。通过定量实时RT-PCR 和Western blot 检测肺腺癌临床样本,Matsuoka 等[24]发现CP 表达与较差预后显著相关,将其作为肺腺癌的独立预后因素。在卵巢癌中,患者血浆铜蓝蛋白水平较对照组明显增加,且其启动子活性表现更明显[25]。

总之,本研究通过对4 个不同数据集进行客观的生物信息学分析,明确得到卵巢癌组织和健康对照样本间的3 个DEG,其高表达与卵巢癌患者的预后不良呈正相关。总结和比较与之相关的大量文献,本研究认为这3 个基因在卵巢癌的进程中可能起到关键作用,可作为新的预后生物标志物。这些数据都为卵巢癌的治疗和改善患者预后提供有用的方向。但目前尚未进行实验验证,这也是未来进行深入研究的重点。

猜你喜欢
细胞周期卵巢癌途径
卵巢癌:被遗忘的女性“沉默杀手”
构造等腰三角形的途径
红霉素联合顺铂对A549细胞的细胞周期和凋亡的影响
减少运算量的途径
Wnt3 a和TCF4在人卵巢癌中的表达及临床意义
NSCLC survivin表达特点及其与细胞周期的关系研究
X线照射剂量率对A549肺癌细胞周期的影响
熊果酸对肺癌细胞株A549及SPCA1细胞周期的抑制作用
microRNA与卵巢癌转移的研究进展
JMJD2B在人卵巢癌中的定位表达