李萍,刘怡茜
南京医科大学第一附属医院 肿瘤科,南京 210009
胰腺癌是一种病死率高、生存期短的恶性肿瘤。2020年美国胰腺癌新发病例为57 600例,死亡病例为47 050例,占癌症导致的死亡原因的第四位,5年生存率在所有肿瘤中最低(9%)[1]。2019年中国最新癌症报告显示,胰腺癌发病和死亡均位居恶性肿瘤前十位。无疑,胰腺癌已日益成为危害人类健康的重大疾病。
细胞外基质(extracellular matrix,ECM)由基底膜和细胞间质组成,一直以来被认为与恶性肿瘤的发生、发展、侵袭和转移等多种生物过程密切相关。Ⅴ型胶原蛋白α2(COL5A2)是ECM的主要成分之一。相关研究及数据分析表明,COL5A2参与多种恶性肿瘤的病理过程,且与患者的预后密切相关,包括舌鳞癌[2]、乳腺癌[3]、结直肠癌[4]、膀胱癌[5-6]和卵巢癌[7]等。目前国内外有关COL5A2与胰腺癌的研究尚少,仅局限于Zhou等[8]通过整合转录组分析中发现的关键基因(hub genes)。
Oncomine数据库是目前全球最大的癌基因芯片数据库和整合数据挖掘平台,其宗旨在于挖掘癌症基因信息,目前已收录包括715个基因表达数据集、86 733个癌症组织和正常组织在内的样本数据。Kaplan-Meier Plotter数据库[9]是目前分析预后应用较广泛的在线数据库,涵盖了包括胰腺癌、乳腺癌、卵巢癌、肺癌、胃癌等在内的21种肿瘤类型,可对54 000个基因进行包括总生存、无复发生存、无进展生存等在内的相关预后分析,结果较为客观。本研究主要采用Oncomine数据库和Kaplan-Meier Plotter数据库分析COL5A2在胰腺癌中的表达及其与预后的关系,为进一步阐明胰腺癌的发生、发展机制提供线索。
根据本研究需求,在Oncomine数据库(https://www.oncomine.org/resource/login.html)中 设 定 筛 选和挖掘数据的条件:①cancer type:pancreatic cancer;②gene:COL5A2;③data type:mRNA;④analysis type:cancer vs normal analysis;⑤临界值设定条件:P<0.05,fold change>2,gene rank=All。
根据本研究需求,在NCBI网站(https://www.ncbi.nlm.nih.gov/)筛选挖掘数据:①GEO profiles;②输入关键词:COL5A2 and pancreatic cancer;
利用Kaplan-Meier Plotter数据库(http://kmplot.com/analysis/)中的Pan cancer(mRNA)数据集进行生存分析。筛选条件:①Gene symbol:COL5A2;②Split patients by:Auto select best cutoff;③Survival:OS/RFS;④Follow up threshold:All;⑤Cancer:Pancreatic ductal adenocarcinoma(n=177)。本研究预后评价指标包括总生存期(overall survival,OS)和无复发生存期(relapse-freesurvival,RFS)。OS定义为癌症诊断之日起至因任何原因引起死亡的时间。RFS定义为从癌症初次治疗至最早出现局部复发、远处转移或死亡的时间。
采用Kaplan-Meier Plotter数据库和Graphpad Prism 5统计软件进行数据分析。采用x±s描述COL5A2基因的表达量,其在正常组织与胰腺癌组织的差异分析采用独立样本t检验。采用Kaplan-Meier法分析COL5A2表达与胰腺癌预后的关系,组间比较用Log-rank检验。双侧P<0.05认为差异有统计学意义。
Oncomine数据库共收集了417项不同类型肿瘤组织与正常组织中COL5A2的比较研究结果,其中COL5A2表达差异有统计学意义的78项,包括高表达的研究75项、低表达的研究3项(图1)。
2003年以来,Oncomine数据库中共有7项芯片研究比较COL5A2在胰腺癌组织及正常组织中的表达,共178个样本(图2)[10-16]。在Oncomine数据库中对上述7项研究结果进行荟萃分析发现,与正常组织相比,所有差异表达基因中COL5A2中位数值排名为790,并在胰腺癌组织中呈高表达(P=0.008)。
Oncomine数据库中COL5A2在不同胰腺癌研究芯片中的表达情况如图3a~g所示。在Oncomine数据库的7项研究中,有5项揭示COL5A2在胰腺癌组织中的表达量明显高于正常组织(P<0.05,Fold change>2),分别是 Badea Pancreas、Segara Pancreas、Grutzmann Pancreas、Logsdon Pancreas和Pei Pancreas研究芯片。Ishikawa Pancreas、Buchholz Pancreas这2项研究芯片中两者表达量差异无统计学意义(P>0.05)。分析NCBI/GEO Profiles数据库中的数据GDS4102同样显示COL5A2在胰腺癌组织中的表达量明显高于正常组织(P<0.05),见图3h、i。
图1 Oncomine数据库中COL5A2在不同类型肿瘤研究中的表达情况
图2 Oncomine数据库中COL5A2在胰腺癌中的表达
NCBI/GEO Profiles数据库中GDS5627数据显示,与达沙替尼敏感细胞株相比,达沙替尼耐药细胞株中COL5A2的表达明显升高(P<0.05)(图4)。
NCBI/GEO Profiles数据库中GDS4106数据显示(图5),与未经处理的细胞相比,胰腺癌细胞株Panc-1在接受TGF-β处理48 h后,COL5A2的表达明显升高(**P<0.01,***P<0.001)。
采用Kaplan-Meier Plotter数据库分析COL5A2表达量与胰腺癌患者预后的关系,结果显示COL5A2高、低表达组胰腺癌患者OS无统计学差异(HR=1.45,95%CI:0.96~2.18,P=0.077),但高表达组胰腺癌患者的RFS明显差于低表达组(HR=4.13,95%CI:1.46~11.72,P=0.0045)(图 6)。
胰腺癌早期缺乏特异性的症状与体征,且具有早期侵犯的生物学特征,如浸润血管、“围胆管”和神经侵犯,致使大多数胰腺癌患者在确诊时已属于中晚期,预后不良,生存期短,胰腺癌的发病率几乎等同于死亡率[17]。因此,阐明胰腺癌的发生、发展机制,寻找关键分子或靶点,一直是备受关注和研究的热点。
图3 COL5A2在不同胰腺癌研究芯片中的表达情况
图4 COL5A2在达沙替尼耐药细胞株中的表达情况
图5 COL5A2在TGF-β处理后的表达情况
Zhou等[8]通过整合转录基因组发现的胰腺癌关键基因COL5A2引起了我们的兴趣。早期的多项研究发现一种少见的遗传性结缔组织病Ehlers-Danlos综合征主要与COL5A2等的基因突变有关[18],近期相关文献报道COL5A2基因参与了多种肿瘤的病理过程。Vargas等[3]通过一系列研究观察到,与乳腺原位导管腺癌相比,包括COL5A2在内的与ECM重塑相关分子在浸润性导管腺癌中的表达明显升高,提示这些表达水平的变化可能参与促进疾病从原位向浸润性癌症的转变,因此可能是疾病发生发展过程中的关键点。同样,Fischer等[4]发现COL5A2在正常肠黏膜组织中无表达,但在结直肠癌组织中有表达,提示其可能参与了结直肠癌的发生发展。Zeng等[5]发现COL5A2低表达的膀胱癌患者具有良好的临床病理分型和预后。当然,对于该基因对肿瘤预后的影响尚存在一定的分歧。Chen等[2]利用组织芯片发现,与正常组织相比,COL5A1和COL5A2在舌鳞癌组织中高表达,COL5A1高表达与临床病理分期较晚和淋巴结转移密切相关且预后较差,而COL5A2高表达患者预后良好。因此,研究者认为高(COL5A1)2/低(COL5A2)表达的舌鳞癌患者预后不良。另外,Januchowski等[7]的研究发现COL5A2基因可能与卵巢癌细胞的多药耐药有关。但是,目前国内外尚无该基因与胰腺癌的系统研究。
图6 COL5A2基因表达与胰腺癌患者预后的关系
我们发现Oncomine数据库中有关COL5A2在不同胰腺癌研究芯片中表达情况的研究共7项,其中2项研究芯片中表达量差异无统计学意义,考虑可能与单项研究中的样本量过小有关。进一步对上述7项研究结果进行荟萃分析发现,与正常组织相比,在所有差异表达基因中COL5A2中位数值排名为790,并在胰腺癌组织中呈高表达,与NCBI/GEO Profiles数据库的分析结果一致。采用Kaplan-Meier Plotter数据库分析发现COL5A2高、低表达组胰腺癌患者OS无统计学差异,但高表达组胰腺癌患者的RFS明显差于低表达组。正如前文所述,胰腺癌是一种病死率高、生存期短的恶性肿瘤,在整体OS较差的情况下,患者的RFS显得尤为重要。
胰腺癌耐药一直是临床面临的一大难题,因为多药耐药的发生,导致胰腺癌治疗效果不佳,预后不良。部分研究认为ECM[19]和上皮间质转化(epithelial-to-mesenchymal transition,EMT)[20]参与了胰腺癌的耐药过程。达沙替尼是Src激酶抑制剂,可用于治疗包括胰腺癌在内的多种肿瘤[21]。我们通过NCBI/GEO Profiles数据库分析发现,胰腺癌细胞株Panc-1在接受TGF-β处理48 h后,COL5A2的表达明显升高。与达沙替尼敏感细胞株相比,达沙替尼耐药细胞株中COL5A2的表达也明显升高。TGF-β是促进EMT发生发展的一个重要分子,TGF-β处理后的胰腺癌细胞中COL5A2表达升高提示COL5A2的表达变化可能与EMT过程密切相关,另外,COL5A2同时也是ECM的主要成分之一,结合这两点可以部分解释达沙替尼耐药细胞株中COL5A2的表达升高,从而为胰腺癌的耐药提供了新的思路。当然,这些研究仅局限于对数据库中的资料进行的二次分析,其具体机制仍须进一步阐明。
综上所述,COL5A2基因在胰腺癌组织中高表达,且与胰腺癌患者的无复发生存和耐药密切相关,有望成为协助胰腺癌诊断、治疗和评估预后的生物标志物。本研究主要采用数据库进行分析,避免样本量过小产生的误差,分析结果可信度较高,但这些数据均来自芯片检测结果,相关结论尚有待后续验证。