唐人宇 杨瑞丰 伍健雄 邓培妍 杨磊
广州医科大学公共卫生学院(广东广州 511436)
高通量测序技术和生物信息分析手段的跨越式发展,深度揭示了人类基因组和转录组中广泛存在的遗传改变,为探索疾病病因、筛查诊断、靶向治疗和解析肿瘤耐药机制提供了新的靶点。遗传变化主要由基因突变和遗传饰变两种机制造成,在肿瘤新疗法的决策和开发中起着引领作用。目前靶向治疗的选择和疗效大多取决于肿瘤组织是否存在特定的驱动基因突变。然而,根据Barlesi F等对17 664名肺癌患者驱动基因突变谱的检测结果显示,约50%的患者癌组织缺乏可靶向的驱动基因突变[1]。可见,基于基因突变的治疗靶点挖掘存在技术瓶颈。遗传饰变是一种不涉及DNA改变的,只发生在转录和翻译水平上的遗传信息变化。RNA编辑是遗传饰变的主要类型之一,其在转录后RNA水平上改变遗传信息的过程。近年来随着比较基因组学的发展,RNA编辑被报道在肿瘤的发生发展中起着关键作用[2-3]。人类超过7 0%的R N A 编辑为腺苷至肌苷编辑(adenosine-to-inosine RNA editing,AIRE),其是指转录前体RNA在腺苷酸脱氨酶(adenosine deaminase acting on RNA,ADAR)的作用下,某些特定位点的腺苷(A)发生脱氨反应转变成为肌苷(I)的过程。在转录后翻译调控中,I被识别作鸟苷(G),扰乱遗传信息传递。AIRE失调在几乎所有肿瘤中均有报道,可通过类似A>G基因突变的功能而导致氨基酸编码改变、RNA剪切异常以及microRNA-mRNA重定向等而参与肿瘤的发生、进展和耐药[4]。本文将系统介绍AIRE的研究现状,包括其生物学调控机制和与不同肿瘤发生发展的关联,以期为后续广泛揭示AIRE在肿瘤中的作用研究提供思路。
AIRE的生物学作用机制很大程度上由其所在的基因功能区间决定(图1)。一般而言,位于mRNA编码区的AIRE位点可引起同义或非同义突变;位于非翻译区(untranslated region,UTR)可导致微小RNA(microRNA,miR)或RNA结合蛋白(RNA binding protein,RBP)的结合改变;位于非编码RNA如microRNA和长链非编码RNA的AIRE会影响他们的结构或与靶标基因的结合。此外,位于内含子区的AIRE还可引起选择性剪接的异常。这些机制给肿瘤细胞在转录组和蛋白组组学方面引入了多样性和异质性,广泛参与癌症的发生发展。
图1 腺苷至肌苷RNA 编辑在肿瘤发展中的作用机制
发生于编码区的AIRE一方面可引起氨基酸的非同义突变而参与肿瘤的进程,大大提升了肿瘤蛋白组学多样性[5-6]。关于这类功能的探索,研究最多的是AZIN1S367G[7-11]和COPAI164V[5,12-15]。AZIN1S367G可导致AZIN1蛋白第367位氨基酸由丝氨酸变异为甘氨酸,从而赋予AZIN1功能获得性表型,促进多种肿瘤的增殖与转移。COPAI164V则可引起COPA第164位氨基酸由异亮氨酸替换为缬氨酸,直接导致COPA由促癌作用转变为抑癌功能。其他引起氨基酸非同义突变而参与肿瘤进程的AIRE位点还包括,KPC1M8V[16]、RHOAR17 6G[17]、FLNBM2293V[11,15,18]、CDK13Q10 3R[19]、GLI1R701G[20]、PDZD7Stop518W[21]、C O G 3 I 6 3 5 V[10,22]、G R I A 2 Q 6 0 7 R[23]、G R I A 2 R 7 6 4[10]、G N E I L 1 K 2 4 2 R[24]、S L C 2 2 A 3 N 7 2 D[25]、I G F B P 7 K 9 5 R[26]、Gabra3I342M[27]、RHOQD137S[28]。其中,一个值得关注的特例是PDZD7Stop518W。该编辑可导致PDZD7原始的终止密码子被绕过,形成一个C末端有18个氨基酸延伸的新蛋白,最终弱化PDZD7的致癌效应[21]。另一方面,导致同义突变的AIRE事件近年来也逐渐引起广泛关注。尽管此类AIRE不改变氨基酸编码,但研究显示它们富集于蛋白泛素化区域,提示其可能影响目标蛋白质的降解[29]。例如,存在于BLCAP上的AIRE可诱导该蛋白泛素化降解而失去抑癌功能[30]。然而,这一机制仍有待更多证据阐明。此外,AIRE对氨基酸编码的改变可能导致肿瘤新抗原的出现[31],这对肿瘤新药研发具有十分重要的意义,值得深入挖掘。
MiR主要通过碱基互补配对与靶基因mRNA的3′-UTR结合,在转录后水平调控基因的表达。因此,位于miR成熟体和mRNA 3′-UTR的AIRE位点,可通过影响碱基互补配对而改变miR对靶基因的选择。现有证据显示,发生在miR上的AIRE可导致:miR-3144-3p失去对MSI2的抑制但新增对SLC38A4的调控[32];miR-379-5p缺失对PTK2的结合而新增对CD97的抑制[33];miR-200b失去了抑制原始靶标如ZEB1的能力但获得了靶向LIFR等新基因的能力[34-35];miR-589-3p缺失对PCDH9的结合而新增对ADAM12的抑制[36];miR-376a失去了抑制RAP2A的能力但获得了靶向AMFR的能力[37];miR-411-5p新增对MET的抑制[38];miR-378a-3p新增对PARVA的抑制[39];miR-455失去对CPEB1的抑制[40]。有趣的是,导致MTL3发生同义突变的AIRE(UCA→UCG:Ser→Ser)也被报道可下调miR-532-5p对MTL3 mRNA的结合而促进该基因的表达,提示编码区的AIRE也可参与microRNA-mRNA重定向调控[41]。存在于3′-UTR的AIRE具有类似效应,如AIRE导致MDM2与miR-155、PHACTR4与miR-196a-3p、DHFR与miR-25-3p和miR-125a-3p、ARHGAP26与miR-30b和miR-573的结合位点丢失[42-45]。
RBP可识别和结合特定RNA序列而调控mRNA的翻译、稳定性及可变剪切等,参与基因的转录后调控过程。有研究报道,SCD1基因3′-UTR区的AIRE可影响P62蛋白的结合而促进其mRNA的稳定性[46]。提示,AIRE可扰乱RBP对目标RNA的结合。
在转录过程中,内含子会被转录至前体RNA,对选择性剪接发挥一定的调节作用。位于基因内含子区的AIRE可影响该过程[19,47-48]。例如,ADAR前体mRNA中的两个内含子编辑位点可通过控制其剪接模式而调节ADAR的翻译效率[49];HNRPLL基因内含子12上的三个AIRE可诱导产生一种与细胞增殖相关的新型剪接变异体,参与肾癌和膀胱癌的进程[50]。
非编码RNA的序列变化可以影响自身空间结构而影响自身的稳定性或成熟[51]。研究显示,ADAR对前体miR的编辑能影响miR-26a、miR-455-5p、miR-122的生物合成和表达水平,其可能机制在于碱基改变扰乱了核酸内切酶Drosha或Dicer的结合[42,52]。并且,AIRE亦可影响Drosha或Dicer的水平而广泛参与miR-142和let-7等miRs的生物合成[53-55]。此外,AIRE也广泛分布在环状RNA反向剪接点200-400nt的侧翼内含子区域,它们通过影响RBP的结合而调控环状RNA的形成[56-57]。
总体而言,目前AIRE的功能探究仍主要围绕编码区和miR开展。考虑到大多数的AIRE位于基因UTR、非编码RNA和内含子上,对这些类型AIRE的功能探索在很大程度上仍停留在生物信息学分析阶段,有待更多的实证证据支持。
AIRE自身强大的生物学功能决定了它在肿瘤发生发展机制中的一席之地。通过解析肿瘤转录组学谱尤其是癌症基因组图谱计划(The Cancer Genome Atlas,TCGA)数据库的二代测序数据,AIRE被报道在多数肿瘤中均异常上调,且大量的位点与不同肿瘤的发生发展存在显著相关[6,58-61]。其中,具有代表性的研究有,Leng Han等解析了TCGA的17种肿瘤6 236名患者的组织RNA转录组,发现肿瘤组织中AIRE比正常组织更为多样,并揭示数百个肿瘤关联的AIRE事件[10];Yumeng Wang等解析了miR转录组并报道了与多种肿瘤发生发展关联的miR AIRE位点[34]。在此基础上,进一步的研究深入解析了少数位点的生物学功能,如编辑型的miR-379-5p能显著抑制肿瘤细胞增殖并诱导凋亡,其在肿瘤组织中低编辑且与头颈部鳞状细胞癌、肾癌、肺腺癌和甲状腺癌预后均相关[62]。上述研究揭示的AIRE谱均上传于不同的数据库,为进一步研究肿瘤关联的AIRE及其生物学功能奠定了基础。
对肺癌转录组的整体分析显示,肺癌癌组织的总体AIRE水平显著升高,且依据不同AIRE可将肺癌分为多种分子亚型,精准预测患者的预后和治疗耐药性[63-64]。肺癌预后关联的AIRE位点也可作为预测因子,准确地估算总生存期[65]。进一步的功能研究显示,miR-411-5p成熟体第五位碱基的AIRE水平在肺癌组织中下调,并诱导肺癌细胞对酪氨酸激酶抑制剂耐药[38]。由AIRE导致RHOA异构体2的R176G变异能显著促进肺腺癌细胞的增殖和转移能力[17]。此外,有研究者评估了AIRE的变化,发现CTNNB1和FN1上的AIRE水平在α粒子辐射诱导肺上皮细胞恶化过程中上调,提示AIRE参与了肺癌变过程[66]。
约2/3的肠癌表现出上调的AIRE状态[67]。研究显示,AIRE可诱导AZIN1S367G变异而增强肿瘤血管新生、细胞转移、干性维持进而促进肠癌进展[7-9]。RHOQD137S在癌组织中过编辑,促转移能力变强[28]。COPA基因的AIRE水平与肠癌免疫浸润评分呈显著正相关,可导致COPAI164V变异而劫持内质网应激,影响肠癌的转移[13]。AIRE可导致抑癌基因BLCAP泛素化降解而促进肠癌细胞的增殖[30]。
AIRE总体水平在肝癌中异常上调并与肝癌患者预后显著相关[68]。研究显示,位于ADAR内含子上的两个AIRE位点水平在肝癌组织中异常上调,其通过选择性剪接而上调ADAR的表达,进而诱导MDM4等多个癌基因发生AIRE,最终加速肝癌进程[49]。COPAI164V编辑可诱导COPA由促癌分子向抑癌分子转变,其在癌组织中编辑水平显著低于癌旁正常组织,并预示肝癌高复发风险和乙肝病毒感染[14-15]。FLNBM2293V也被报道在肝癌组织中编辑上调[15]。
乳腺癌癌组织相比正常乳腺组织具有更多的AIRE位点和更高的编辑水平[69]。研究显示,FLNBM2293V在三阴乳腺癌组织中过编辑,且在高临床分期的组织水平更高,显著抑制了FLNB的抑癌功能[18]。导致MTL3发生同义突变的AIRE可通过MTL3/ARHGAP5/YTHDF1信号轴而促进乳腺癌的进展[41]。COPAI164V促进乳腺癌细胞的增殖而恶化患者预后[5]。Gabra3I342M仅在原位癌组织和非侵袭性的乳腺癌细胞中存在,其逆转了Gabra3的促转移作用[27]。DHFR的3′-UTR在乳腺癌组织中表现出高编辑趋势,其增强了DHFR的稳定性而促进乳腺癌细胞活力和对甲氨蝶呤耐药[44]。此外,基于4个预后关联的AIRE位点构建的nomogram模型可较好地预测乳腺癌患者的总生存期和无病生存期[70]。
Omer An等基于50个胃癌预后关联的AIRE位点构建了胃癌RNA编辑标签,发现该标签与患者预后、化疗敏感性均显著相关[71]。AZIN1高编辑状态与胃癌晚期T分期、淋巴结转移、高TNM分期显著相关,并提示总体生存率和无病生存率较低[72]。另外,位于SCD1 3′-UTR的AIRE可促进胃癌细胞对5-氟尿嘧啶和顺铂耐药[46]。
AZIN1S367G在癌组织中编辑上调,促癌作用增强[11]。SLC22A3N72D在癌组织中编辑上调,其可导致该蛋白表达降低而与淋巴结转移相关[25]。PDZD7Stop518W也被报道在57%的食管癌癌组织中编辑水平下调[21]。IGFBP7K95R编辑保护IGFBP7免受基质酶水解而发挥促食管癌细胞凋亡的功能[26]。
AIRE总体水平在胶质瘤中的状态存在争议。有研究报道胶质瘤包括胶质母细胞瘤相对于正常脑组织AIRE活性下调[22,73],但也有研究报道胶质母细胞瘤中AIRE异常升高[74]。相对于其他胶质瘤,少突胶质细胞瘤受AIRE的影响最小[73]。特异性分析胶质瘤组织长链非编码RNA的AIRE,发现其在瘤组织中的总体水平显著低于正常脑组织[75]。并且,与携带异柠檬酸脱氢酶突变的肿瘤相比,没有异柠檬酸脱氢酶突变的肿瘤表现出更高的总编辑水平[76]。这些证据表明,胶质瘤中的AIRE水平存在显著的肿瘤特异性。进一步的功能研究显示,COG3I635V在胶质母细胞瘤中过编辑,其可促进肿瘤细胞增殖而恶化患者预后[22];GRIA2Q607R编辑与胶质瘤的不同分子亚型有关,其在IV级胶质瘤中的水平低于II级胶质瘤且低编辑提示预后不良[23];位于GM2A基因3′-UTR的AIRE可促进GM2A的表达,调控神经节苷脂分解代谢而促进胶质母细胞瘤的发生发展[74];转录的超保守区域 uc.160+可增强 miR-376a的AIRE而改善神经胶质瘤预后[33],miR-589-3p发生AIRE后,其生物学功能从促癌转变为抑癌[39];胶质瘤细胞miR-589-3p呈现低编辑状态,其侵袭性下调[36];CDC14B的表达受到内含子多个AIRE位点的影响,其编辑水平与星形细胞瘤恶性程度分级呈负相关[77];miR-376a的编辑随着胶质瘤的发生发展而减弱进而促进癌细胞侵袭能力[37]。此外,基于PRKCSH|chr19:11561032、DSEL|chr18:65174489、UGGT1|chr2:128952084和 SOD2|chr6:160101723四个AIRE构建的神经胶质瘤预测模型能较准确地预测患者预后[78]。
除上述肿瘤外,AIRE在甲状腺癌等肿瘤的发生发展中起着重要作用。研究显示,CDK13Q103R在甲状腺癌癌组织中异常上调,其可促进CDK13向细胞核转移并增强该蛋白调控mRNA选择性剪接的能力,进而促进甲状腺癌的发生发展[19]。miR-200b的编辑水平升高与甲状腺癌晚期、较差的无进展生存期和预后显著相关[35]。宫颈癌癌组织相对于癌旁正常组织表现出低AIRE现象[56]。AIRE可导致BLCAP失去对STAT3的抑制而参与宫颈癌的发病[79]。Yulong Liu等共发现122个位于microRNA上的RNA编辑位点在肾透明细胞癌癌组织和癌旁组织间,其中两个位于mir-376a-3p和mir-376c-3p成熟体上,但这些位点与肾癌的关联仍有待验证[80]。KPC1M8V在胆管癌中过编辑,其可弱化KPC1与NF-κB1的结合而促进胆管癌的发生发展[16]。miR-154-5p在复发的膀胱癌中发生过度的AIRE,提示其与膀胱癌复发有关[81]。AZIN1的AIRE水平是子宫内膜癌独立的预后预测因子[82]。ADAR促胰腺癌细胞增殖和转移中涉及GLI1R701G等AIRE的异常上调[20]。雄激素受体基因转录物的AIRE可能有助于晚期雄激素非依赖性前列腺癌症激素的抑制表型[83]。Austeja Amweg等解析了黑色素瘤的RNA编辑谱,发现MOK和DZIP3基因在靶向治疗期间复发的患者中发生AIRE过编辑,提示它们与靶向治疗抵抗有关[84]。miR-378a-3p发挥促进黑色素瘤转移的作用,但该能力在发生AIRE后显著弱化[39]。AIRE抑制了miR-455-5p其促黑色素瘤的生长和转移的能力[40]。此外,AIRE水平在骨肉瘤中呈上调趋势[85]。无论是新诊断还是复发的多发性骨髓瘤均表现出异常上调的AIRE现象,且更高的编辑水平与患者预后差显著相关[24]。进一步研究发现,NEIL1K242R相对于野生型NEIL1的DNA损伤修复能力受损,骨髓瘤该位点编辑水平越高对DNA损伤越敏感[24]。
上述研究显示出AIRE改变在不同类型肿瘤中既有共性也有个性。需要指出的是,基于组学分析报道的大部分的肿瘤关联位点均未经实验证实,且与肿瘤的相关性也有待外部样本的验证。并且,总体而言,AIRE与肿瘤关系的研究尚处于起步阶段,仍然需要更多的研究去深入阐明其在肿瘤发生发展中作用。
尽管在转录组层面已广泛揭示了肿瘤关联的AIRE事件,但由于AIRE多位于基因非编码区或非编码RNA上,大多数的AIRE事件的生物学功能及其临床意义仍然未知,也有待更多的研究探索。目前研究虽已证实AIRE位点是肿瘤发生、进展和预后的可靠生物标志物,但如何具体在临床中将其转化为可应用的诊断或预后评估工具仍有待考证。并且,目前基于等位基因选择性靶向的小分子药物研发已在单碱基突变遗传性疾病上取得了一定成功,作为基因突变的补充,该技术也适用于针对肿瘤关联的AIRE位点靶向药物的研发。Daryl Jin Tai Tay等采用等位基因选择性靶向的小分子药物构建策略,研发了特异性针对AZIN1 S367G编辑反义核算药物,发现其可特异性靶向编辑型的AZIN1而抑制肿瘤的生长[86],表明AIRE可以被靶向。此外,当前对AIRE的分析仍主要集中于临床进展关联的事件,缺乏对耐药、环境致癌物相关的AIRE事件的挖掘。未来需要不断推进AIRE与肿瘤发生发展、预后、耐药和靶向药物的研究,为肿瘤发病机制的阐明、早期发现和治疗提供有价值的科学依据。