(1 河北医科大学第四医院病理科,河北 石家庄 050011;2 河北医科大学基础医学院;3 河北省胸科医院胸三科;4 河北医科大学药理学教研室)
乳腺癌是女性中最常见的肿瘤,是女性癌症死亡的主要原因[1]。据预测,到2021年我国35~49岁女性中乳腺癌病例将达到220万[2]。在我国乳腺癌患者诊断的平均年龄为48~49岁,比西方国家确诊年龄低10岁以上[3]。乳腺癌的治疗效果在很大程度上取决于患者激素受体和人表皮生长因子受体2(HER2)的表达水平,而乳腺癌的不同的分子亚型(luminalA型、luminalB型、HER2过表达型及三阴型)预后差异很大[4]。HER2是受体酪氨酸激酶(RTK)的EGFR/ERBB家族的成员[5]。HER2癌基因在大约25%的乳腺癌中扩增或高表达,并且在大多数癌症中是肿瘤细胞生长的主要驱动力[6]。临床试验表明,HER2“上瘾”是某些肿瘤行为的基础,HER2作为致癌基因,可促进癌细胞的增殖与转移,并且与肿瘤复发率和患者病死率增高有关[7]。X型胶原蛋白(COL10)是结构大分子胶原超家族的一员,由COL10A1基因编码[8]。COL10A1基因突变与日本型脊椎关节发育不良和Schmid型干骺端软骨发育不良有关[9]。在大多数肿瘤组织中可观察到COL10A1高表达,并且其可能与肿瘤血管生成有关。在结直肠癌的早期诊断中,外周血液中COL10A1可被视为潜在的生物标志物[10]。研究显示COL10A1在结直肠癌组织中异常表达并参与结直肠癌的进展和EMT过程[11]。此外,通过组织微阵列和基因表达谱分析显示,COL10A1在乳腺癌中表达上调[12]。然而,COL10A1对HER2阳性乳腺癌的影响尚不清楚。
肿瘤基因组图谱计划(TCGA)利用基因组测序技术研究33种癌症类型及20 000多种分子特征。目前TCGA已经产生了大量的基因组学、表观基因组学、转录组学和蛋白质组学的大量数据[13]。本研究深入挖掘基于TCGA的肿瘤在线生物信息数据库cBioPortal、Oncomine、UALCAN等,综合分析COL10A1在HER2阳性乳腺癌中的表达及与患者预后的关系,为进一步研究COL10A1在乳腺癌治疗中的作用提供一定的参考依据。
通过GEPIA[14](http://gepia.cancer-pku.cn/)搜集相对于正常乳腺组织乳腺癌中高表达的基因,数据集选择“Differential Genes”,Dataset(Cancer name)选择“BRCA”。在方差分析中,|log2FC|值高于预先设定的阈值,q值低于预先设定的阈值的基因被认为是差异表达基因。对于前10个基因,|log2FC|值和百分比值高于阈值的基因被认为是过表达基因。
登录cBioPortal 网站(http://www.cbioportal.org)的首页[15],数据集选择 “Breast invasive carcinoma (TCGA,PanCancer Atlas) ”,病例组则选择“Tumor Samples with mRNA data (RNA Seq V2) (1100)”,分别分析COL10A1的突变、mRNA 水平变化及与HER2表达的关系。
通过Oncomine数据库[16](https://www.oncomine.org/)检索COL10A1在不同肿瘤类型中的差异性表达,限定条件为:①基因:COL10A1;②数据类型:mRNA;③显著性:P<1E-4;④差异表达级别:大于2倍;⑤基因排序:前10%;⑥其他为数据库默认设定。
登录UALCAN 网站(http://ualcan.path.uab.edu)首页[17],数据库类型选择 “Breast invasive carcinoma”,输入基因名称“COL10A1”,分析不同类型乳腺癌组织中COL10A1基因表达的变化。
数据库类型选择 “Metastatic breast cancer[MET500 dataset]”,输入基因名称“COL10A1”,分析COL10A1在HER2扩增与非扩增样本中表达的差异。
登录Kaplan-Meier Plotter数据分析平台[18](http://kmplot.com/analysis/),检索COL10A1基因,获得COL10A1基因表达差异患者的生存曲线。限定条件为无疾病进展生存,“HER2 status”设为“HER2 positive”或“HER2 negative”,对肿瘤病理类型及临床分期、分级等不做限制。
cBioPortal数据库分析结果显示,994例乳腺癌患者中,61例发生了COL10A1基因改变,改变的类型包括突变、拷贝数畸变以及mRNA 水平上调等(图1a)。GEPIA以及Oncomine数据库分析结果显示,COL10A1在乳腺癌中呈现高表达(表1、图1b)。再利用UALCAN平台进一步分析TCGA数据库中COL10A1在乳腺癌中的差异表达情况,在TCGA数据库中总共涉及到正常乳腺组织114例,乳腺癌组织1 097例,COL10A1基因在乳腺癌中的表达水平大约为正常乳腺组织的177.85倍(P<1E-12)。图2a。
UALCAN 分析显示,luminal型与HER2阳性乳腺癌患者中COL10A1表达高于其他类型乳腺癌(P<0.05)。见图2b。且COL10A1在HER2扩增样本中表达水平明显高于无扩增样本(P<0.01)。见图2c。GEPIA数据库与cBioPortal数据分析显示,COL10A1与HER2表达呈正相关(P<0.01)。见图3a、b。HER2阳性乳腺癌样本中COL10A1表达与HER2阴性样本比较,差异具有显著性(P<0.05)。见图3c。
表1 GEPIA 数据库中乳腺癌组织中高表达的基因
a:cBioPortal数据库分析COL10A1在乳腺癌中的突变位点及突变方式;b:Oncomine数据库中COL10A1在不同肿瘤中的差异性表达
图1COL10A1在不同肿瘤中的表达情况及突变方式
对Kaplan-Meier Plotter数据库分析显示,在全部乳腺癌样本中,COL10A1与患者无复发生存率(RFS)无关。见图4a。单独筛查HER2阴性乳腺癌样本,RFS也未见明显差异。见图4b。然而,在HER2阳性乳腺癌患者中,相对于COL10A1低表达者,COL10A1高表达者RFS降低(P<0.01)。见图4c。
乳腺癌是一种高度异质性的恶性肿瘤,与之相关的分子标志物种类众多[19]。其中HER2表达在乳腺癌进展中发挥着重要作用。尽管目前有针对HER2阳性乳腺癌患者的靶向药物,但抗HER2治疗的乳腺癌患者往往会产生耐药性,致使出现新的进展,预后仍不理想[20],因此本研究期望通过生物信息学数据分析发现HER2阳性乳腺癌中的新的靶点。
研究显示COL10A1在结直肠癌、食管癌和胰腺癌等肿瘤中高表达[21-23],并且免疫荧光染色表明COL10A1定位于乳腺癌的肿瘤脉管系统,而在正常乳腺组织的脉管系统中水平较低[24]。有研究结合RNA表达谱以及免疫组织化学方法分析发现,COL10A1在对化疗无反应的ER阳性/HER2阳性型乳腺癌样本中表达上调[25]。但其在HER2阳性乳腺癌中的特异性作用尚不清楚。
TCGA是迄今为止最具实力和最成功的癌症基因组计划之一。TCGA项目已经生成、分析并提供了超过1.1万例代表30多种不同癌症类型的基因组和转录组数据。Oncomine数据库是一个研究肿瘤相关基因的开放数据库,其整合了TCGA、GEO和已发表文献来源的DNA和RNA-seq数据,能帮助人们筛选一些值得研究的靶分子,有利于提高对癌症的诊断、治疗和发生发展机制的深入研究。Ualcan数据门户是为了促进TCGA数据库的基因查询而开发的交互式网络资源,便于分析鉴定肿瘤相关的生物分子标记物,从而分析肿瘤发生、进展和转移的相关分子机制,使癌症研究人员更容易获得TCGA数据和分析结果。此外,cBioPortal癌症基因组学在线门户网站是一个交互式探索多维癌症基因组学数据集的开放网站,对于肿瘤的诊断、治疗及预后评估具有重要价值。
a:COL10A1在乳腺癌中基于样本类型的表达;b:COL10A1在乳腺癌亚型中的表达;c:基于HER2基因扩增亚类的COL10A1在乳腺癌中的表达
图2COL10A1 mRNA在HER2基因扩增样本中的表达情况
a:GEPIA数据库分析显示,COL10A1与HER2 mRNA表达呈正相关;b:cBioPortal分析显示,COL10A1与HER2 mRNA表达水平呈正相关;c:UALCAN分析结果显示,HER2阳性乳腺癌组织中有差异表达的基因
图3COL10A1与HER2 mRNA表达水平的关系
a、b、c分别为Kaplan-Meier Plotter数据库中所有乳腺癌样本、HER2阴性乳腺癌样本及HER2阳性乳腺癌样本
图4COL10A1高表达与乳腺癌患者无复发生存率(RFS)的关系
本研究基于上述肿瘤在线生物信息数据库分析COL10A1在乳腺癌中的表达及与患者预后的关系。首先通过GEPIA及Oncomine数据库筛查发现COL10A1在乳腺癌中高表达。然后利用UALCAN进一步分析TCGA数据库中COL10A1在不同类型的乳腺癌中的表达情况,发现COL10A1在HER2扩增样本中表达水平明显高于无扩增样本,结果有统计学意义。为了探究COL10A1与HER2表达的关系,本研究利用GEPIA与cBioPortal数据库筛查分析显示,COL10A1与HER2表达呈显著正相关。以上结果提示COL10A1在乳腺癌中可能为促癌因素,且与HER2相互作用,影响乳腺癌的进展。同时Kaplan-Meier Plotter数据库分析表明,COL10A1高表达与HER2阳性乳腺癌患者预后较差有关,而与HER2阴性乳腺癌患者预后无关。以上结果显示COL10A1可能与HER2相互促进,共同影响乳腺癌患者的预后。
综上所述,通过生物信息数据库综合分析发现,COL10A1在乳腺癌中高表达,且与HER2阳性乳腺癌患者的不良预后相关,可以作为HER2阳性的乳腺癌患者临床预后评估的潜在标志物。鉴于COL10A1基因表达的种族和个体特异性,后续工作中应在乳腺癌患者肿瘤组织样本中进行验证,并通过基础实验验证靶基因COL10A1在HER2阳性乳腺癌发生发展中的作用,为HER2阳性乳腺癌患者的治疗、诊断和预后提供新的依据。