基于数据库分析CK-19基因在乳腺癌中的表达及与患者预后相关性

2020-08-20 04:01殷红梅
转化医学杂志 2020年4期
关键词:共表达角蛋白乳腺癌

殷红梅

乳腺癌是临床上较为常见的恶性肿瘤,居女性肿瘤发病率第一位。北美肿瘤流行病学报告显示,2018年,美国乳腺癌新诊断人数为268 670例,而死亡人数为41 400例,乳腺癌已成为肿瘤相关死亡的重要原因之一[1]。近年来,随着分子生物学的研究进展,乳腺癌靶向药物及激素治疗使得患者的预后大大提高。但部分晚期乳腺癌患者仍预后不良,探讨影响乳腺癌患者的相关因素是目前的研究热点[2-3]。

CK-19蛋白由KRT19基因编码,该基因位于人17号染色体q21.2区域,全长41.53 Mb[4]。该基因编码的蛋白为细胞角蛋白,与上皮细胞骨架的稳定性有关。CK-19 mRNA在乳腺癌中的表达及其与患者预后关系及其共表达网络研究较少。本研究采用数据挖掘方法,在多个数据库中探讨CK-19基因表达及其临床意义。

1 材料与方法

1.1 数据库选择 分别对肿瘤芯片数据库Oncomine(https://www.oncomine.org/),生存分析数据库Kaplan-Meier Plotter(http://kmplot.com/analysis/)和蛋白-蛋白相互作用String数据库(https://string-db.org/cgi/input.pl)进行乳腺癌CK-19基因表达情况数据挖掘。

1.2 Oncomine,Kaplan-Meier Plotter和String数据平台分析 首先在Oncomine数据库中对CK-19 mRNA在乳腺癌组织与对应的正常乳腺组织中的差异表达情况进行分析。数据筛选条件为:①肿瘤类型:乳腺癌;②组织对比:乳腺癌vs正常乳腺组织;③数据类型:mRNA;④显著性:P=1E-4;⑤差异表达级别:大于2倍;⑥基因排序:前10%。然后利用Kaplan-Meier Plotter数据平台挖掘CK-19 mRNA表达的芯片数据,并绘制CK-19高低表达生存曲线,分析CK-19与乳腺癌患者的预后关系。应用蛋白-蛋白相互作用数据库String分析CK-19相互作用蛋白网路,探讨其可能的生物学功能。

2 结果

2.1 CK-19基因mRNA表达于肿瘤 检索Oncomine数据库发现,在乳腺癌中有9个数据集均显示乳腺癌中CK-19高表达(包括细胞系),图1。

图1 CK-19基因mRNA在多种实体肿瘤与对应正常组织中的整体表达

2.2 CK-19基因共表达聚类分析 Oncomine数据库中对CK-19 mRNA在乳腺癌中的共表达基因进行聚类分析显示,CK-19 mRNA与KRT18,ERBB3,PRR5等基因mRNA存在共表达,提示上述基因在生物学功能上可能具相关性,图2。进一步在String蛋白数据库中对CK-19蛋白共表达进行了分析,结果显示CK-19与KRT8,KRT18等蛋白具有共表达关系,图3。

图2 CK-19基因在乳腺癌组织中与其他基因共表达聚类分析

图3 CK-19基于String数据库的基因共表达分析

2.3 CK-19在乳腺癌与正常乳腺组织中的差异表达 Oncomine数据库中,有3项基因表达芯片数据关于CK-19 mRNA在乳腺癌与正常组织中的差异表达分数数据,其中1项来自TCGA数据库,另2项文献[5-6],图3。结果均提示在乳腺癌组织中CK-19 mRNA表达水平高于正常乳腺组织(P<0.05),图4。

A:12项数据比较了不同类型乳腺癌组织与正常组织中CK-19 mRNA的差异表达情况;B:不同类型乳腺癌组织与正常组织比较的箱式图,数据来自TCGA数据库http://tcga-data.nci.nih.gov/tcga/;C:不同类型乳腺癌组织与正常组织比较的箱式图,数据来自Radvanyi BreastStatistics;D:不同类型乳腺癌组织与正常组织比较的箱式图,数据来自Perou Breast Statistics图4 CK-19在乳腺癌与正常乳腺组织中的差异表达

2.4 CK-19表达与乳腺癌预后的关系 检索Kaplan-Meier Plotter数据库,发现关于CK-19表达水平与乳腺癌患者预后相关的表达谱芯片数据有1项[7]。根据CK-19 mRNA表达水平中位数分为低表达组和高表达组,并绘制生存曲线,比较高低表达组总生存期和无疾病进展生存期有无差异。结果显示,CK-19 mRNA高低表达组总生存期分别为90.0月和115.0月,差异比较无统计学意义(HR=1.14,95%CI:0.92~1.41,P=0.23),而高低表达组无疾病进展生存期分别为48.16月和48.0个月,差异比较无统计学意义(HR=1.09,95%CI:0.98~1.22,P=0.11),图5。

A:总生存比较;B:无疾病进展生存比较图5 CK-19 mRNA高低表达与乳腺癌患者生存期关系

2.5 CK-19相互作用蛋白网络 应用String数据库富集CK-19相互作用的可能相关蛋白,富集条件为P=2E-15,节点数共11个,其中蛋白网络中与CK-19相互作用的蛋白有10个,分别为KRT8,KRT18,KRT7,KRT5,KRT4,KRT6B,KRT1,KRT3,KRT80和KRT78,作用评分均大于0.9。上述10个关联蛋白均属于细胞角蛋白家族,参与上皮细胞结构的稳定性。

3 讨论

CK-19为细胞角蛋白家族的成员,角蛋白通常为负责上皮细胞结构完整性的中间丝蛋白,分为细胞角蛋白和毛发角蛋白。CK-19是一种Ⅰ型角蛋白,Ⅰ型细胞角蛋白由酸性蛋白组成,酸性蛋白成对排列[8]。与它的相关家族成员不同,这种已知最小的酸性细胞角蛋白在上皮细胞中不与碱性细胞角蛋白配对。编码该蛋白的记忆定位于17q12-q21的一个区域。既往研究认为,CK-19在多种实体肿瘤组织中呈现高表达,并可在肿瘤患者外周血中检测到CK-19蛋白的表达,可作为肿瘤诊断的标志物[9]。但在不同的肿瘤中,以其为参考指标,诊断的敏感性或特异性均不高,因而单独作为肿瘤标志物的临床应用价值有限[10-11]。

CK-19在乳腺癌中的表达已有报道,大多数研究采用免疫组织化学方法,探讨肿瘤组织中CK-19蛋白的表达与乳腺癌患者临床病理特征,如年龄、性别、HER2等情况的相关性。黄英等[12]采用qPCR检测60例Ⅱ、Ⅲ期乳腺癌患者手术及化疗前后外周静脉血CK-19 mRNA变化情况,结果提示CK-19 mRNA的表达与神经及脉管受侵以及淋巴结转移有关,与激素受体及HER2表达无关。近年来随着基因芯片技术的发展及高通量测序成本的降低,基因表达与肿瘤预后关系得到了大量芯片和测序数据的支持。而这些芯片和测序数据的公开获取为进一步数据深入挖掘提供了条件。

本研究综合利用肿瘤芯片数据库(Oncomine),肿瘤预后数据库(Kaplan-Meier Plotter)和蛋白-蛋白相互作用数据库(String)对CK-19基因表达情况与乳腺癌的关系进行了分析,研究认为CK-19 mRNA在乳腺癌组织中高表达,其蛋白与KRT18等角蛋白家族可能共同参与了上皮细胞结构的稳定性,但CK-19 mRNA高低表达与乳腺癌患者的预后无关。上述结论在基因芯片数据中得到了很好的支持,为其在临床中的应用,包括靶向CK-19药物研发,肿瘤标志物筛选提供了有力证据。

猜你喜欢
共表达角蛋白乳腺癌
羊毛角蛋白的提取及其在大健康领域的应用进展
角蛋白家族基因及其与动物毛发性状关系的研究进展
绝经了,是否就离乳腺癌越来越远呢?
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
高世代回交玉米矮秆种质的转录组分析
羊毛角蛋白改性纤维素膜的结构和性能
角蛋白在皮肤老化过程中的研究进展
乳腺癌是吃出来的吗
胸大更容易得乳腺癌吗