杨雪佳,马义丽,李玉杰,吴登强,周素芳
(1.国家生物靶向诊治国际联合研究中心,广西生物靶向诊治重点实验室,广西肿瘤靶向诊治协同创新中心,广西生物靶向诊治研究人才小高地,广西医科大学,广西 南宁 530021;2.广西医科大学基础医学院生物化学与分子生物学教研室,广西 南宁 530021)
关键字:肝细胞癌;数据挖掘;TTK
肝癌是癌症相关第四大死亡原因,也是最难治疗的癌症之一,每年导致近百万人死亡。HCC占原发性肝癌的 80%-90%[1],死亡率位居全球第三[2]。2022年在中国诊断出的前五种癌症类型中肝癌排第四,癌症死亡的前五位原因肝癌排第二[3]。肝癌具有发病隐匿、预后很差、恶性程度高等生物学特征[4]。因此进一步加深对HCC发病机制的研究十分重要。深入探讨肝细胞癌的发生、发展机制,寻找新的治疗靶点和预后的生物标志物对肝细胞癌的研究有着重要意义。纺锤体组装检查点激酶 TTK ( Mps1 ) 基因(NM_003318)位于染色体6q13-q21上,编码双丝氨酸/苏氨酸和酪氨酸蛋白激酶[5]。TTK是纺锤体组装检查点的核心组成部分,其作用是确保染色体正确分布到子细胞[6]。除了睾丸和胎盘,通过Northern 印迹在正常组织中几乎无法检测到TTK。然而,TTK的高表达水平可以在不同类型的癌症中检测到,包括胶质母细胞瘤、食道癌和乳腺癌。TTK在肝癌中表达明显增高。此外,TTK在肝癌具有促进细胞增殖和迁移的作用[7]。这些结果提示TTK可能作为诊断肝癌的潜在预测指标。
从TCGA数据库(https://portal.gdc.cancer.gov/)下载关于肝细胞癌的TCGA-LIHC转录组测序数据(FPKM格式)和样本临床信息,包含374个HCC和50个正常组织。将FPKM格式的RNAseq数据转换成了TPM格式并进行log2转化后用于基因表达分析。基因表达分析采用wilcoxon秩和检验,临床特征分析Kruskal-Wallis 检验,癌和癌旁配对样本差异分析采用配对样本T检验。生存分析Kaplan-Meier生存分析与log-rank检验,采用Survival R包完成,ROC分析采用PROC R包。使用ggplot R包进行可视化。
从广西医科大学获得10对匹配的HCC组织和邻近癌旁组织。以上样本采集时间为2020年1月至2021年8月。本研究经广西医科大学伦理委员会批准(批准文号:20200035)。所有人体组织标本的处理都严格遵守《赫尔辛基宣言》中的道德准则。所有患者均提供知情同意。上述临床标本的RNA纯化、鉴定及RNA序列均由中国Novelbio公司完成。采用R包“Limma”中的Wilcoxon检验验证TTK的表达。癌和癌旁配对样本差异分析采用配对样本T检验。
由图1A可知,TTK在TCGA 数据库HCC组织表达显著高于正常组织(P<0.001)。图1B在50对配对样本组中,除了一组癌组织TTK表达低于正常组织外,大部分组均高于正常组织(P<0.001)。说明转录水平上TTK在HCC组织中高表达。
图1 TCGA数据库中TTK转录水平表达情况
由图2A-2B可知,TTK表达在HCC病理分期StageⅠ-Ⅲ和组织分级G1-G4中其表达逐渐升高,StageⅡ和StageⅢ与StageⅠ相比,TTK表达量显著升高(P<0.05)。然而StageⅣ与各分期无显著差异,考虑StageⅣ仅有5个样本,样本数过少不具有代表性。G3和G4与G1相比,TTK表达量显著升高(P<0.05)。反映HCC疾病恶化程度越严重,TTK表达越高。
图2 TCGA数据库中TTK表达与临床病理特征关系
由图3A-B可知,HCC患者在总体生存和无进展生存方面,TTK高表达组比低表达组随着随访时间延长,病人生存率逐渐下降。说明TTK高表达与HCC的不良预后有关(P<0.05)。
图3 TCGA数据库中TTK表达与患者生存状态关系
由图4A可知,在预测正常和HCC结局上,TTK的预测能力有较高准确性(AUC=0.971,CI=0.955-0.987);图4B可知,在预测病理早期(StageⅠ-Ⅱ)和晚期(StageⅢ-Ⅳ)病理状态上,TTK的预测能力有较低准确性(AUC=O.601,CI=0.530-0.672); 图4C可知,在预测组织分级早期(G1-G2)和晚期(G3-G4)方面,TTK预测效能有一定准确性(AUC=0.680,CI=0.625-0.735)。可推断,TTK用作为诊断HCC良好指标。
图4 ROC分析TTK诊断效能
通过收集来自广西医科大学附属肿瘤医院的十对HCC和配对癌旁样本,进行转录组测序挖掘TTK基因在癌和正常组织差异表达。有图5A可知,TTK在HCC组织中高表达(P<0.05)。图5B可知,在十组配对样本中,癌组织TTK表达量均高于正常组织(P<0.05)。
图5 临床样本验证TTK转录水平表达情况
肝细胞癌(HCC)是癌症相关死亡的第四大原因,并且在全球范围内发病率不断上升[8]。HCC的发病率、频繁复发、高死亡率和目前治疗方案的局限性,使HCC被公认为主要的公共卫生问题。HCC是一种生物学复杂且高度异质的疾病[9]。常规的临床和病理学指标可用于判断肝细胞癌分期和预后,但准确性有限。肝细胞癌变的分子机制仍不清楚[10]。TTK该基因编码一种参与细胞有丝分裂和增殖的双特异性蛋白激酶。目前有研究报道,TTK高表达与多种肿瘤预后不良相关,包括三阴性乳腺癌[11]、胃癌[12]、前列腺癌[13]和膀胱癌[14],但其在肝细胞癌中的表达情况和预后相关性报道较少见。Miao等[15]研究发现,TTK在肝脏肿瘤组织中表达水平较肝脏组织高,间接表明TTK可作为肝细胞癌的一个潜在癌基因。因此进一步探讨TTK在肝细胞癌中的表达情况和临床特征相关性十分必要。TCGA数据库是目前被广泛使用的肿瘤学数据库,并得到了广泛科研工作者的认同。本实验通过对TCGA数据库数据深入挖掘,发现TTK基因在肝细胞癌组织中的表达水平高于正常组织,临床样本验证也证实TTK在HCC的高表达。TTK的高表达与患者HCC病程进展密切相关:TTK在病理晚期和组织分化差样本中,表达量更高。生存分析发现,高表达TTK与HCC患者不良预后相关。接着用ROC分析探索了TTK诊断HCC结局、预测病理和组织方面其检验准确性。发现TTK在预测患者HCC或正常疾病状态方面,AUC=0.971,表明TTK评价患者HCC检验效能良好。本研究将数据挖掘和临床验证结合起来,证明了TTK在HCC组织中的高表达,与疾病恶化和预后密切相关,且可作为潜在HCC预后和诊断靶标,但未能对TTK影响HCC进展的机制进行基础研究。本研究将为寻找肝细胞癌诊断和预测预后的靶标提供一定的理论依据和临床指导。