胡梦圆,付丽云,3
1.宁波大学医学院(宁波315211);2.中国科学院大学宁波华美医院肝病科(宁波315020);3.浙江省消化系统肿瘤诊治及研究重点实验室(宁波 315020)
1990年至2015年统计数据显示,原发性肝癌是全球癌症相关死亡的第四大病因,位居恶性肿瘤发生率第六位[1]。2019 年公布的我国最新恶性肿瘤发病和死亡分析结果显示:原发性肝癌是我国第四位高发恶性肿瘤,2015 年原发性肝癌发病率和死亡率分别为26.92/10万和23.72/10万,位居肿瘤致死病因第二位[2]。肝细胞肝癌(hepatocellular carcinoma,HCC)是原发性肝癌的主要病理类型,占比约85%~90%[3]。在本篇文章中,肝癌主要指的是HCC这一病理类型。据统计,男性HCC 发病率高于女性,约为3∶1[3]。对于HCC 高危人群的定期筛查,有助于HCC的早期发现、早期诊断和早期治疗,是提高HCC 治疗疗效、提升生存率的关键。一项纳入47项研究、包含15 158 例患者的Meta 分析显示:在肝硬化人群中,定期筛查可使早期HCC 的诊断率、HCC 的治愈率和生存率分别提升2 倍以上[4]。因此,HCC 的早筛显得尤为重要。
目前,组学研究已成为医学研究领域中常用的技术手段,组学包括基因组学、转录组学、蛋白质组学、代谢组学和微生物组学等,是研究基因的表达和功能、遗传产物及代谢产物等的学科。通过组学技术可以将生物体内所有的某分子类型(基因/蛋白质/转录产物/代谢产物等)作为对象进行研究,并建立相应数据库。也可以筛查疾病表达差异分子,进一步研究其与临床病理特征的联系,如筛选出HCC癌组织与癌旁组织的差异表达分子[5]。本综述结合最新研究,主要阐述基因组(genomics)、转录组(transcriptomics)、蛋白质组(proteomics)、代谢组(metabolomics)和微生物组(microbiomes)在HCC 中的研究进展和在早期诊断中的运用价值。
基因组学是一门研究生物体所有遗传物质的科学,针对单个个体或一类生物体所有基因进行分析和量化,同时研究相互关系及其对生物体的影响[6]。在癌症研究中,基因组学旨在通过发现和靶向与癌症相关的基因改变从而推进肿瘤个体化治疗[7]。
基因组学应用的技术有:二代测序技术(next-generation sequencing,NGS),又称高通量测序技术(high-throughput sequencing),包括全外显子组测序(whole exome sequencing,WES)[8]、全基因组测序(whole genome sequencing,WGS)[9]、RNA 测序(RNA-SEQ)[10-11]、靶向深度测序(targeted deep sequencing)[8]等,并且仍在不断扩展新的技术,这些技术通过提供更高的效率和更低的成本推动了科学研究的进展。
WGS 提供了最全面的基因组信息和相关生物学意义,正在成为NGS 中使用最广泛的应用之一[12]。WES 和靶向测序,通过限制所用基因组材料的大小,可以在一次测序运行中对更多个体样本进行测序,从而增加基因组研究的广度和深度[12]。NGS还提供了洞察基因组调控机制的技术基础,比如蛋白质-DNA 相互作用可以通过免疫共沉淀富集与蛋白质相互作用的DNA 片段来探测[12]。
在HCC 的研究中,基于二代测序技术,以及不断扩充的各项数据库,包括癌症基因组图谱(The Cancer Genome Atlas,TCGA)计划和GEO(gene ex⁃pression omnibus)数据库等[13],发现了多个突变基因,其中,TP53 和CTNNB1 是高频突变的基因[8,14-15]。另外,也发现10 多个基因发生突变,包括AX⁃IN1、RB1、KEAP1、ARID2、ARID1A、RPS6KA3、APOB、CDKN2A、LRP1B、PTEN、ALB、BRD7、RPL22等[8,16-18]。
基于测序技术的广泛应用,针对不同变量的更有针对性的基因测序也在不断开展。近来,针对病因以及流行病学特征开展了一系列基因组学研究。流行病学调查显示,肝癌最常见的危险因素是慢性乙型肝炎病毒(hepatitis B virus,HBV)感染和饮食中暴露于黄曲霉毒素B1[14],同时还发现,男性比女性更易患HCC[14],蒙古族人是世界上HCC发病率最高的人群之一[15]。针对这些因素,研究的结果如下:HBV相关的HCC:多项组学研究的开展发现了包括端粒酶逆转录酶(telomerase reverse transcriptase,TERT)在内的癌症相关基因CCNE1 和MML4 是HCC 中HBV整合的重要靶基因[5,19-21]。TERT 启动子突变在肿瘤的发生中起到重要作用(见于60%的肝癌)[21]。此外,由于很大比例的HBV相关HCC不包含任何已知癌症相关基因的整合,因此提出了另外两种机制:诱导基因组、染色体不稳定性和突变HBV 蛋白的产生、持续表达[22]。另外Péneau 等研究发现,与非肿瘤肝组织相比,在肿瘤肝组织中发现了更多的克隆性HBV 整合,这与2012年的发现一致[10,23]。最新研究显示,HBV 病毒增强子可诱导癌基因的过表达,值得关注的是,HBV 整合位点基因重排也可能导致癌症驱动基因的拷贝数改变,HBV 整合的数量是HBV 相关HCC 的独立预后因素[10]。黄曲霉毒素相关的HCC:黄曲霉毒素相关的HCC 中除了先前报道的常见突变(TP53)外[8],还发现黏附G蛋白偶联受体B1基因(adhesion G protein-coupled receptor B1,ADGRB1)高频突变,与肿瘤组织毛细血管密度增加和程序性死亡因子配体1(programmed cell death 1 ligand 1,PD-L1)的表达相关。值得注意的是,在来自中国的肝癌病例中,9.8%含有黄曲霉毒素相关的遗传特征,与其他含有这些遗传特征的地区相比肝癌比例要偏大。这些发现可能被用来识别因接触黄曲霉毒素而患肝癌的患者[24]。地区相关的HCC:蒙古族人的基因图谱展示了除常见突变(TP53、CTNNB1)外独特的驱动突变,包括GTF2IRD2B、PNRC2 和SPTA1,其中GTF2IRD2B最为显著[15]。
依据越来越多的基于流行病学背景的基因图谱描绘以及随着新技术的更新以及检测成本的下降,未来也许可以做到对有高危因素的人群进行基因组的筛查,从而有助于HCC的早期诊断。
虽然全基因组和全外显子组测序逐渐描绘出HCC 的基因组,但基因改变是如何驱动癌症表型,目前在很大程度上还不清楚。而接下来介绍的其他组学,也将和基因组学共同研究,为揭示HCC 的分子分型和协助诊断提供帮助。
转录组学是研究细胞中基因转录情况及转录调控规律的学科,即研究各种RNA,是基因组学和蛋白组学的桥梁[11-12]。RNA-seq,是随着高通量测序技术而发展起来的一种转录组测序技术,可对差异基因表达和mRNA 差异剪接进行全转录组分析,可用于研究RNA(包括mRNA,非编码RNA(non-cod⁃ing RNA,ncRNA)等)生物学的各个层面,包括单细胞基因表达、翻译和RNA 结构[11]。在RNA-Seq基础上,微阵列技术(microarray)、批量RNA 测序(bulk RNA-sequencing)、单细胞RNA 测序(sin⁃gle-cell RNA sequencing,scRNA-seq)、小RNA测序(small RNA sequencing,sRNA-seq)、基因表达芯片(gene expression arrays)等[24-26]为RNA 研究提供了技术支持,孕育出了多个类别的候选标志物。一般研究思路是,首先通过表达图谱和生物信息学分析,筛选出候选生物标志物,再通过进一步分子、细胞、动物等多层面的实验,研究这些候选分子的表达水平与临床参数的关系,以及摸索它们在某一通路中的角色,增加作为潜在的HCC诊断标记物的可行性及寻找治疗靶标等。
miRNA 是非编码RNA 中的一种,许多研究评估了miRNA 能否作为诊断HCC 的潜在生物标志物。比如miR-21 和miR-199[26-27]已被多次验证是肝癌早期诊断的潜在生物标志物。一项Meta分析表明,4 个miRNAs(miR-20a-5p、miR-320a、miR-324-3p 和miR-375)可以作为HCC 早期诊断生物标志物[28]。另外,一项研究发现miR-375,miR-10a,miR-122和miR-423在HCC组中显著高于对照组(P <0.0 001),并且4-miRNA 组合下的受试者工作特征曲线下面积(AUC)可达到0.995[29]。
lncRNA参与HCC细胞的增殖、侵袭、迁移与转移、细胞凋亡等,在肝癌诊断中具有较好的作用。如,来源于组织、血浆和唾液中的lnc-PCDH9-13:1和来源于血清的lncRNA-UCA1 和 ln⁃cRNA-WRAP53可以作为诊断HCC潜在的生物标志物。后两者与AFP 结合可以达到100%的灵敏度[30-31]。由于许多候选早筛标志物lncRNA 在非HCC情况下也会有异常表达,有研究表明lncRNA 与AFP等其他分子联合诊断效果更佳[32]。
cirRNA是ncRNA的新成员,同样参与HCC的产生和发展,由于它的不易被核酸外切酶降解的稳定性提示了它有潜力成为早期筛查的标志物[33]。如circRNA-100338、circRNA SMARCA5、hsa_circ_00156、hsa_circ_000224、hsa_circ_000520、hsa_circ_0028502 和hsa_circ_ 0076251 等有潜在的预后和诊断价值[34-37]。
蛋白质组学主要运用双向凝胶电泳、色谱与质谱技术,研究组织、体液等来源的蛋白质水平、翻译后修饰等,能够将基因型与癌症表型联系起来。其中,磷酸蛋白质组学和糖蛋白质组学是两种有效的功能蛋白质组学方法,可用于挖掘生物标志物以及治疗靶点、癌症发展机制、耐药机制等[7,38-39]。
蛋白质位于转录下游,可以直接反应细胞的活动,并且研究发现,在所有组织中,肝脏分泌的蛋白质数量最多[40],这使得蛋白组学在HCC中具有较大的价值。
国内樊嘉院士团队首次利用159 例HBV 相关HCC 患者的成对肿瘤和邻近肝组织进行蛋白质基因组学表征。发现两个预后生物标志物PYCR2 和ADH1A;同时发现了CTNNB1和TP53突变相关的信号传导和代谢特征,其中突变的CTNNB1相关的醛酸磷酸化被证实可促进糖酵解和细胞增殖。该研究提供了一个有价值的资源,极大地扩展了HBV相关HCC的知识,同时也扩展了挖掘早期诊断标志物的思路[18]。
一项前瞻性多中心横断面研究,采用毛细管电泳质谱(capillary electrophoresis-mass spectrum,CE-MS)技术检测HCC 患者的尿蛋白组学特征。鉴定了31个肝癌特异性多肽标志物,并进一步整合到多变量分类模型中。该多肽模型对HCC诊断的敏感度和特异度分别为79.5%和85.1%[38]。这项研究说明了该尿多肽有望成为HCC早期诊断标志物。
代谢组学是研究生物个体在置身于某特定环境下所产生的代谢产物集合的科学。代谢物质的起源来自于上游的基因组,能够与蛋白质组一起直观且动态地反应细胞的生理病理状态,是继基因组学、转录组学和蛋白组学之后的又一新方向,是以上组学的补充[41-42]。
对来自KEGG新陈代谢数据库中注册的1 434个基因的蛋白质在32个组织中进行了量化,发现肝脏富含的代谢蛋白最多,并且大多数代谢途径都在肝脏中富集[40]。另外,肝功能下降被认为是肝癌发展的早期事件,因此很可能在血液中观察到各种代谢紊乱[43]。当HCC 中的癌细胞发生不可控制的增殖时,肝脏代谢可发生复杂的适应性改变,这为找到潜在诊断生物标志物提供了新思路。
Luo等[44]通过多中心大样本研究发现血清代谢生物标志物组合,包括苯丙氨酰-色氨酸和甘胆酸,对HCC高危人群的早期诊断具有良好的诊断性能。运用液相色谱与质谱联用技术,Lu 等[45]发现了Pep(36∶4)和Pep(40∶6)可以作为HCC 诊断的潜在血清生物标志物。国内一研究团队运用超高效液相色谱-四极杆飞行时间质谱联用技术发现了甘胆酸、2-脱氧栗甾酮、脱氧胆酸甘氨酸偶联物和牛磺胆酸是潜在早期临床诊断标志物[46]。基于高分辨率质谱技术,一个前瞻性队列研究观察了HCC诊断前的代谢紊乱[43],确定了与HCC 风险相关的92 种代谢物的循环水平变化,其中14 种具有高可信度,其中一些观察了长达10 年。14 种代谢物包括:N1-乙酰亚精胺、靛红、对羟基苯乳酸、酪氨酸、鞘氨醇、L-环(亮氨酰脯氨酰)、甘氨鹅脱氧胆酸、甘氨胆酸和7-甲基鸟嘌呤,与HCC风险呈正相关;视黄醇、硫酸脱氢表雄酮、甘油磷酸胆碱、γ-羧乙基羟色胺和肌酸,与HCC风险呈负相关。Liu等[47]对来自门静脉血的代谢物的变化进行了代谢组谱分析,发现肝癌患者中的DL-3-苯乳酸、L-色氨酸、甘胆酸和1-甲基烟酰胺的代谢物水平的表达升高,提示了肝功能损害和生存不良。
人肠道中有多达100 万亿个微生物,尤其结肠具有最高密度的微生物[48]。肝脏有一个独特的门静脉血管系统,该系统接收来自肠道的代谢物并直接输送到肝脏,另外,还存在胆汁酸的肠-肝循环[49]。因此,来源于肠道的微生物结构的变化可能通过改变代谢物结构成分和代谢物共同来影响HCC 的发生发展[47]。肝脏疾病中的微生物组学研究主要以肠道为背景。肠道微生物组学为寻找HCC非侵入性生物标志物提供了新的思路。
微生物组学使用了元基因组学中的研究方法和技术,来测定样品中所包含的全部微生物的遗传物质及群落功能,并研究其与代谢物之间的关系。一般思路是,用二代测序技术和生物信息学工具检测样品中提取的DNA 并与微生物基因组的参考数据库比对,确定细菌分类组成,再通过蛋白质组学和代谢组学的补充,深入研究微生物组的功能[50-51]。
多项研究发现肠道微生物在免疫、炎症反应以及肝癌发展中具有关键作用[52-53]。Behary等[53]发现非酒精性脂肪性肝病相关HCC 的肠道微生物具有独特的微生物群和代谢组特征,可以调节外周免疫反应。Ponziani 等[54]观察到与炎症指标相关的钙保护素可能受到阿克曼杆菌和双歧杆菌丰度的影响,这两种细菌可能通过降低肠道和肝脏的炎症反应,影响HCC 的发生和进展。也发现了与非HCC 的肝硬化患者相比,HCC 组的类杆菌属和疣微菌科增加。
成人的微生物群结构具有特异性,但最近的研究表明不同地区的HCC患者虽然微生物结构不同,但HCC中的微生物失调可能存在普遍性,提示了微生物标志物作为早期筛查标志物的可能性[52,55]。任志刚等应用16S rRNA 测序等技术,发现了一种HCC 微生物操作分类单元(operational taxonomy units,OTUs)标志物诊断模型,来自微生物筛选基因的30个OTUS标志物被选为最优标志物集,在识别早期HCC中的AUC为80.64%,并成功地实现了国内西北和华中地区HCC的跨区域验证,这项研究说明了肠道微生物标志物可以作为HCC 早期诊断的非侵入性潜在工具[52]。然而肠道微生物受到的影响因素很多,不仅来自宿主,还会受环境、饮食等的影响[56-57],因此仍需大量研究来完善微生物与人体肠道构成的微生态组网络。
基因型与表型的关系一直是生命科学中至关重要的,是破译生命科学奥秘的钥匙。对于单基因性状,可以很容易地理解基因型与表型的关系。然而大多数表型特征涉及多基因产物[41],若是放到整个人体中,基因与表型则会形成复杂的网络。组学提供了一种研究技术和方法,筛选出差异基因,再去验证它与表型是否存在强关联,再通过后续的功能学研究进行“基因到表型”的探索,为靶向治疗和预后提供强大支撑。再通过多组学的整合,有希望绘制出HCC 发生发展中,从基因到转录产物,从翻译产物到直接反应机体状态的代谢产物,再到与微生物交互作用反应的分子生物学机制全景,最终应用到包括早期诊断在内的多个肝癌研究领域。
多组学研究发现的候选早筛生物标志物距离高特异性、高敏感性、可重复性、低成本性的理想肿瘤标志物相差很远[58]。未来的挑战包括大规模临床样本的验证研究,技术方法的标准化和新技术的开发,分析算法的标准化和进一步发展,以及大规模的合作等。