乳腺癌是女性发病率最高的恶性肿瘤[1]。人类基因组8号染色体长臂2区4带(8q24)位于该染色体末端128~142 Mb处并邻近端粒,该区域包含蛋白编码基因MYC、PSCA等癌基因及非编码RNA PVT1等约900个基因。染色体8q24区是肿瘤中常见的遗传畸变区域,常见变异有染色体扩增、缺失、易位、基因突变等,且该区域存在多个肿瘤相关风险位点或单核苷酸多态性(single nucleotide polymorphism,SNP),与调节远处基因的转录活性有关。乳腺癌中8q24区域扩增及相关风险位点是近年来的研究热点,在乳腺癌的发生发展及预后中具有重要作用。本文主要结合相关基因就乳腺癌中8q24区域扩增及相关风险位点的研究进展进行综述。
基因组8q24区域扩增现象在乳腺癌中较为普遍,包括男性乳腺癌[2],所占比例为27%~79%。基因的扩增水平是评价乳腺癌预后的重要指标之一,8q24区域扩增亦在乳腺癌的发生发展、侵袭转移和不良预后中具有关键作用。
Afghahi等[3]通过比较271例乳腺导管原位癌(ductal carcinomain situ,DCIS)患者中染色体拷贝数改变,包括151例浸润性癌和120例非浸润性癌,发现浸润性癌的DCIS成分中8q24区域扩增频率显著高于非浸润性癌中的DCIS,虽然80%均是增加1~2个额外拷贝数。此外,Horlings等[4]发现8q24.13~q3区域扩增仅在高级别浸润性癌中出现。这些证据提示8q24区域扩增或是原位癌进展至高级别浸润性癌的驱动因素。MYC是位于8q24.21的癌基因,其编码蛋白具有转录因子活性。MYC基因扩增可能始于良性肿瘤状态[5]并在30%~50%的高级别乳腺癌中显著扩增,过表达的MYC蛋白可促进下游的葡萄糖和谷氨酰胺代谢相关的靶基因表达,以维持癌细胞生长能量需求、促进肿瘤进展。长链非编码RNA(long noncoding RNA,lncRNA)PVT1基因位于MYC基因下游约50 kb处常与MYC共扩增[6],PVT1基因可通过上调β-catenin信号通路引起乳腺癌发生。
乳腺癌主要的转移途径是淋巴转移,远处转移是乳腺癌患者死亡的主要原因。基因组改变与转移的关系,大多通过基因组谱分析对原发病灶和转移病灶进行比较,或通过原发病灶的拷贝数改变与转移预后的比较进行分析。Ellsworth等[7]比较229例淋巴结阳性和阴性乳腺癌患者原发病灶的基因组发现,8q24区域扩增是唯一的显著改变,其中MYC基因扩增与淋巴结转移相关。PSCA基因位于8q24.3,最早发现于前列腺组织并在前列腺癌中过表达。浸润性微乳头状癌(invasive micropapillary carcinoma,IM⁃PC)具有高淋巴结转移特性,本课题组Meng等[8]研究发现,PSCA在IMPC中显著扩增且过表达,其表达与淋巴结转移相关。以上提示8q24区域的MYC、PSCA基因扩增或可促进乳腺癌发生淋巴结转移。
乳腺癌原发病灶与远处转移病灶之间的8q24区域扩增具有高度的一致性[9],其在转移病灶中扩增频率更显著。Magbanua等[10]对乳腺癌原发病灶与循环肿瘤细胞(circulating tumor cells,CTCs)的基因组进行拷贝数分析时发现,CTCs中8q24区域(包含MYC)高度扩增。进一步研究发现,乳腺癌中超过90%的脑脊液肿瘤细胞中存在8q24.13~q24.21区域高水平扩增,频率显著高于CTCs[11]。此外,Bilal等[12]对268例早期乳腺癌仅使用他莫昔芬治疗患者的8q24.3位点扩增情况检测时发现,当该位点扩增时其远处转移率显著增加,从另一方面说明8q24区域扩增或可促进乳腺癌发生远处转移。
乳腺癌不同组织学亚型中8q24区域扩增情况也不尽相同。8q24区域扩增在高级别非特殊型浸润性导管癌(invasive ductal carcinoma of no special type,IDC-NST)基因组中常见。研究发现,级别越高、侵袭性越强的多形性小叶癌的基因组改变与8q24区域显著扩增的高级别IDC-NST越类似[13],且8q24.11区域扩增是IDC-NST与经典型浸润性小叶癌在基因组上最显著的区别[14]。此外,全外显子测序发现,IMPC中8q24区域扩增频率最高且8q扩增与IMPC显著相关[15],提示8q24区域异常也许是IMPC特殊病理组织学形态及其高侵袭、转移特性形成的关键。
8q24区域扩增也与乳腺癌分子分型相关。Loo等[16]研究发现,8q24区域在乳腺癌ER阴性中显著扩增,而在ER阳性中扩增不明显。乳腺癌基因组数据库资料也显示,MYC在三阴性乳腺癌(triple negative breast cancer,TNBC)中扩增也显著高于激素受体阳性乳腺癌。MYC蛋白可通过直接驱动糖酵解途径而促进TNBC细胞生长增殖[17]。
SNP指基因组水平上单个核苷酸变异引起的DNA序列多态性。SNP在人群中变异频率高于点突变,也与乳腺癌发生和预后存在一定的相关性。通过全基因组学关联分析(genome-wide association study,GWAS)的方法已在8q24区域鉴定出一系列乳腺癌风险相关SNPs。研究表明,位于8q24基因沙漠区的SNP位点rs13281615与乳腺癌PR(progestogen receptor)状态、肿瘤级别及预后存在相关性[18]。而rs13281615与ER表达状态的相关性存在不同的结论,Garcia-Closas等[18]发现,rs13281615作为乳腺癌独立风险位点其GG基因型与ER阳性乳腺癌显著相关,Long等[19]却发现该SNP与ER阴性乳腺癌显著相关,而Campa等[20]则认为该风险位点与乳腺癌ER表达状态无关。rs13281615的基因型改变也会影响乳腺癌风险发生改变,其GG基因型增加乳腺癌风险或是通过影响PVT1转录而产生[21]。研究发现,rs35961414、rs7815245、rs2033101、rs11780156 等与ER阳性乳腺癌相关[22],8q24.21区域还存在男性乳腺癌风险相关[23]和乳腺癌各分期相关的多个 SNPs[19]。另外,Li等[24]通过GWAS方法,在乳腺癌基因组8q24区域发现新风险位点的靶基因显著富集MYC转录因子基序,且该风险位点与MYC基因表达增加显著相关,提示该新风险位点可通过影响MYC基因表达而影响患者预后。
在表观遗传学中,基因表达的调控除了受组蛋白修饰以及DNA甲基化状态影响之外,还受染色质相互作用的影响(包括染色质内和染色质间),而8q24区域也可通过此种染色体相互作用来调控基因的表达。随着3C(chromosome conformation capture,3C)、Hi-C(high-throughput chromosome conformation capture)等技术的发展,可获得(不同生理、病理状态下)高分辨率染色质间相互作用图谱。Baxter等[25]利用Hi-C技术发现,位于8q24.21区域的rs13281615和rs11780156可与 MYC、lncRNA CASC11(cancer sus⁃ceptibility 11)、lncRNA CCDC26(CCDC26 long noncoding RNA)的基因序列结合。在乳腺癌中CASC11可激活 Wnt/β-catenin 信号通路[26]引起肿瘤发生,CCDC26则可通过上调癌基因c-Kit表达产生化疗耐药性[27]。此外,Ahmadiyeh等[28]发现8q24区域上存在前列腺癌风险区域1、3(亦为结肠癌风险区域)及位于128.35~128.51 Mb处的乳腺癌独立风险位点,其均可与MYC基因形成组织特异性的远距离染色体环,虽然在乳腺癌中此染色体环并不影响MYC蛋白的表达量。8q24是染色体上高密度的肿瘤相关风险位点区域,但该区域SNP在乳腺癌中的功能分析研究较少,而在前列腺癌和肾癌中均有相关报道。Du等[29]在前列腺癌中采用3C-MTS(3C-based multi-tar⁃get sequencing)技术捕获与8q24相互作用的区域,其显著富集Wnt/β-catenin信号通路转录因子的启动子基序,提示8q24风险区域或许可以通过此种物理性空间相互作用调控肿瘤的多种信号通路。该研究还发现8q24区域的前列腺癌风险区域1、3主要与MYC基因启动子和增强子区域序列相互作用,且该区域还与3q13存在相互作用。HIF(hypoxia inducible fac⁃tor)是调控内环境稳态的关键基因,8q24区域的肾癌风险SNP rs35252396通过调控染色质的易接近性,改变位于MYC和PVT1基因之间的增强子(HIF结合位点)活性,达到调控MYC和PVT1转录的作用[30]。因此,8q24区域乳腺癌风险位点的功能还有进一步探索的空间。
乳腺癌的发生发展是一个多步骤侵袭性过程,恶性程度及侵袭能力的改变并非来自单一基因的作用,而是多基因变异的综合效应。乳腺癌8q24区域扩增可能导致该区域的基因过表达,进而引起肿瘤表型变化;8q24区域内的DNA位点也可通过染色质相互作用影响肿瘤进展。8q24区域在乳腺癌扩增的机制及染色质相互作用的功能分析仍需进一步探索和研究。