据Dietlein F 2022年4月8日[Science,2022,376(6589):eabg5601-eabg5601.]报道,非编码突变与一系列不同的生物过程有关,它们在基因组中的位置对于准确解释它们至关重要。
肿瘤产生的一个关键标志是癌细胞在其基因组中获得了正常组织中不存在的体细胞突变。一些突变是驱动突变(driver mutation),有助于肿瘤细胞生长,但其他许多突变是乘客突变(passenger mutation),对肿瘤生物学没有明显影响。在过去的10年里,通过分析成千上万对肿瘤-正常组织的测序数据,驱动突变在蛋白编码基因组区域(即编码蛋白的基因组区域)中被全面表征。对蛋白编码基因组区域的这种表征产生了对肿瘤生物学的大量见解,包括许多受基因组启发的药物靶标。然而体细胞突变在剩下98%癌症基因组——非编码基因组(noncoding genome)的作用仍未被完全理解。
许多统计学方法通过比较每个基因中对蛋白编码序列有影响和无影响的突变数量,将驱动突变检测为复发性突变事件。因此,这些方法不适用于蛋白编码区域以外的地方,在那里,体细胞突变的作用仍然不甚明了。非编码基因组包括多种不同的序列元件,包括基因表达的调节区域,这些调节区域的位置和活性在不同的肿瘤类型中有所不同。在一项新的研究中,为了扩大对蛋白编码区域以外的突变的理解,来自布罗德研究所、丹娜-法伯癌症研究所、哈佛医学院、布莱根妇女医院和乌特勒支大学医学中心的研究人员设计并实施了一种全基因组的滑动窗口方法来检测突变事件,而不考虑其在调节元件中的位置或对蛋白编码序列的影响。他们开发了3种方法的组合,以检测含有6 120万个体细胞突变的19种癌症类型的3 949例患者的全基因组中的复发性突变事件。这种方法根据突变事件在基因组中的位置,自动将其分为不同的类别。在蛋白编码区域,研究人员发现每种癌症类型平均有7.5个事件,并获得了公认的驱动突变。在非编码基因组中,每种癌症类型有3.7个事件发生在特定组织类型中专门表达的基因附近(肝脏中的ALB基因、前列腺中的KLK3基因、肺部中的SFTPB基因、肾脏中的SLC5A12基因、甲状腺组织中的TG基因,以及其他)。这些组织特异性事件不太可能是典型的驱动突变,因为它们源于只在这些基因周围活跃的诱变过程,而不是反映了肿瘤细胞起源的表达程序的可能印记。
此外,研究人员在每种癌症类型的表达调节区域发现了3.8个非编码事件,其中许多涉及癌症相关的基因(BCL6、FGFR2、RAD51B、SMC6、TERT、XBP1和许多其他基因)。与调节区域中的大多数事件相反,XBP1附近的乳腺癌突变主要积累在它的启动子之外的一个调节区域。他们通过进行CRISPR干扰筛选和荧光素酶报告实验验证了它们对基因表达的调节作用,阐明了全基因组方法与协调测序队列相结合以全面捕捉非编码基因组中已知和未知的序列元件中的突变模式的潜力。
这项新的研究建立了一个基因组范围内的不同突变模式的概要,这些突变模式塑造了19种主要癌症类型的基因组,包括在肿瘤生物学中具有已知作用的基因附近发生的事件,以及一些对基因表达表现出实验验证的影响。这些研究结果表明非编码突变与一系列不同的生物过程有关,它们在基因组中的位置对于准确解释它们至关重要。广义上讲,这项新的研究为解释全基因组测序数据提供了蓝图,并为未来研究非编码突变在肿瘤产生中的作用奠定了基础,最终为非编码癌症基因组量身定制治疗方法铺平了道路。