周慧 何丹 杨学习 李粉霞
应用微阵列比较基因组杂交技术检测乳腺癌患者共有拷贝数变异的初步研究
周慧1何丹2杨学习1李粉霞2
[摘要]目的探讨乳腺癌患者基因组中共有的拷贝数变异与乳腺癌发生发展的关系,为乳腺癌的预防、治疗和预后提供基本依据。方法使用微阵列比较基因组杂交技术检测样本基因组DNA的拷贝数变异。将得到的拷贝数变异在人类基因组变异数据库和孟德尔遗传数据库进行变异分析,寻找样本共有的拷贝数变异并分析其与乳腺癌的关系。结果发现1q21、8p11、8p12、8q11、14q32、14q32.33(其中包含2个片段),20q13和22q11共9个共有拷贝数变异,其中4个拷贝数变异通过人类基因组变异数据库证实为正常多态性拷贝数变异。有5个拷贝数变异在人类基因组变异数据库中不存在相似片段并且在孟德尔遗传数据库中有致病基因,包括4个扩增片段和1个缺失片段。结论1q21.1q42.2、8q21.12q23.3和20q13.2q13.31 3个片段的扩增及8p12p11.23的缺失与乳腺癌的发生和发展有一定联系,但8q11.22q11.23的扩增与乳腺癌的发生、发展的相关性尚有待于进一步验证。
[关键词]乳腺癌;拷贝数变异;微阵列比较基因组杂交
作者单位:1.南方医科大学生物技术学院,广东,广州510515
2.广州市达瑞生物技术股份有限公司,广东,广州510665
乳腺癌是女性最常见的恶性肿瘤之一,其发病率在全球呈明显的上升趋势,严重危害着广大妇女的身体健康。尽管我国女性乳腺癌总体发病率在世界范围处于中低水平[1],但随着工业化的发展、人们生活方式的变化,乳腺癌总发病率在不断提高,特别是在较发达城市如北京、上海、天津、广州等,乳腺癌已成为妇女发病率最高的恶性肿瘤[2]。据世界卫生组织国际癌症研究中心(Inter⁃national Agency for Research on Cancer,IARC)统计,2008年中国女性乳腺癌标化发病率为21.6/ 100 000,在全球184个有统计资料的国家中位列第99位,标化死亡率为5.7/100 000,位列第145位,均显著低于世界平均水平[2]。但是由于人口基数大,却占世界新诊断乳腺癌的12.2%,死亡例数占世界乳腺癌死亡人数的9.6%[3]。如何进行早期预防并降低乳腺癌发病率已经成为乳腺肿瘤研究中的重大现实课题。
乳腺癌是一种遗传异质性肿瘤,临床上根据免疫组化检测ER、PR、HER2和Ki67的结果,将乳腺癌划分为Luminal A型、Luminal B型、HER⁃2阳性和三阴性乳腺癌。各亚型与乳腺癌的疾病转归、患者预后和治疗反应密切相关。不同亚型的乳腺癌在总生存期和无复发生存期上存在显著差异,其中Luminal A型的预后较好,而三阴性乳腺癌的预后交差。但目前临床上免疫组化检测没有统一的检测和评估规范,很难确切的进行分子分型。早在2000年,Perou等[4]就尝试采用基因芯片的方式将乳腺癌分成不同的亚型。根据基因表达谱,可以把乳腺癌分为Luminal A型、Luminal B型、HER⁃2阳性和基底样乳腺癌。其中大部分基底样乳腺癌是三阴性乳腺癌。基于芯片表达谱的分子分型更易进行标准化检测和评估。除此以外,芯片还可以检测到其他癌基因或者抑癌基因的拷贝数变异(copy number variation,CNVs)。这些在人类基因组中广泛存在的缺失、插入、重复和复杂位点的变异,长度为1 kb以上,其突变率远高于单核苷酸多态(single nucleotide polymorphism,SNP)。这些特异的变异可以成为潜在的治疗靶标。例如,AKT1和FGFR1在乳腺癌变异和扩增的频率分别为4%和10%,对特定的抑制剂靶向治疗敏感[5-6]。对这些靶向变异位点的扫描可以帮助我们找到靶向治疗的特定受益人群。微阵列比较基因组杂交(array⁃based comparative genomic hybrid⁃ ization,aCGH)用DNA探针取代了细胞中期染色体,可以检测基因组DNA在相应的序列或基因上的拷贝数变异[7],一次检测相当于对基因组同时进行了成千上万个独立的荧光原位杂交技术(fluorescence in situ hybridization,FISH)。然而,aCGH无法检测不导致CNVs的染色体畸变,如点突变、平衡易位和倒位等[7]。Pollack[8]用aCGH的方法在乳腺癌中不仅证实了比较基因组杂交(comparative genomic hybridization,CGH)探测到的17q和20q上的扩增区域,而且新发现了1q、8q、11q和15q扩增区域,3p、6q、9p、10q和Xq缺失区域[9]。这些片段上含有很多与乳腺癌相关的基因。
本实验拟用aCGH检测中国人群乳腺癌患者的全基因组DNA,寻找与分析乳腺癌共有的CNVs并探讨这些CNVs与中国人群乳腺癌发生发展的关系,期望为乳腺癌的预防、治疗和预后提供基本检测方法和技术依据。
1.1病例资料
样本为南方医科大学南方医院乳腺中心收治的4名汉族女性患者,年龄分别为40岁、57岁、56岁、59岁,平均年龄为53岁。样本均为左侧乳腺浸润性导管癌,根据乳腺癌淋巴结转移(tumor node metastasis,TNM)分期,原发肿瘤体积不大于5 cm,除3号样本无区域淋巴结转移之外,其他均有一定程度区域淋巴结侵犯。所有样本均无远处转移。
1.2芯片检测共有CNVs
安捷伦aCGH试剂盒购自美国Agilent公司,1×TE(pH 8.0)、Molecular grade来自美国Pro⁃mega公司,SureScan Microarray Scanner、Hybridiza⁃tion Oven、CytoGenomix和CytoGenomics Edition分析软件来自美国Agilent公司。
使用QIAamp DNA Mini Kit提取组织中的基因组DNA,用Thermo NanoDrop2000C紫外/可见分光光度计测量提取DNA的浓度和纯度。要求2.0〉260/280〉1.8,260/230〉1.0。分别取0.5 μg样本DNA量和reference量到反应管中,加水至13 μ L。加入随机引物2.5 μ L,然后进行片段化和单链化。随后冰上配制Cy3和Cy5 2种染料的标记混合液,每管加入9.5 μ L的标记控制混合液后孵育标记。用纯化柱子对标记后的DNA进行纯化,然后使用NanoDrop 2000 UV⁃VIS分光光度计来检测并计算产量与比活度。制备Hybridization Mas⁃ter Mix,将标记的被测和对照样品混匀加29 μ L到每管混合物后孵育。使垫圈滑片和杂交室底部磨合和对齐,将杂交样本混合液40 μ L放在垫圈的中央,放上有活性的芯片,后封闭杂交室。将杂交室放入杂交箱,配平,20 rpm,67℃,24 h。从杂交箱拿出杂交盒,取出芯片进行洗涤。
1.3芯片扫描和数据分析
芯片用SureScan Microarray Scanner进行扫描,用Agilent CytoGenomics Edition进行分析得到CNVs。得到所有样本全部CNVs后,筛选4例样本共有CNVs,通过查询DGV(database of genomic variants)数据库、线上《人类盂德尔遗传》(Online Mendelian Inheritance in Man,OMIM)数据库和查找相关文献对实验所得片段进行研究。
2.1乳腺癌共有CNVs
4个乳腺癌样本共发现CNVs总数为295个,其中2号样本有82个,1号、3号和4号样本均为71个(图1)。发现9个共有CNVs,包括2个纯和扩增(8p11.23p11.22和22q11.22),6个杂合扩增(1q21.1q42.2,8q11.22q11.23,8q21.12q23.3,14q32.33中的2个片段和20q13.2q13.31)和1个杂合缺失(8p12p11.23),片段变异范围为117 kb~84 684 kb,包含基因个数为1个~152个基因。
2.2数据库查找结果
通过查询DGV数据库、OMIM数据库和相关文献检索对实验所得片段进行分析。在发现的9个共有CNVs中,4个共有CNVs为正常多态性CNVs,为无关CNVs;5个共有CNVs是致病性CNV,包括1q21.1q42.2、8q11.22q11.23、8q21.12q23.3、20q13.2q13.31这4个片段的扩增和8p12p11.23的缺失(表1)。
随着乳腺癌发病率的持续增长,人们对乳腺癌发生发展机制的研究愈发迫切。在众多发病因素当中,基因拷贝数的变异是重要致病因素之一,通过对基因拷贝数的检测可了解基因状态以及研究一些未知的机制。本实验用aCGH的方法一次检测整个基因组基因的拷贝数变异,得到整个基因组所有的拷贝数变异片段后,寻找4个样本共有的CNVs,通过数据库查询和利用收集的资料对这些片段进行分析。
实验结果发现4例样本的共有CNVs 9个,其中:8p11.23p11.22、14q32.33中的2个片段和22q11.22在DGV数据库中存在相似片段,是正常多态性CNVs,可判断为无关CNVs。在DGV数据库中没有相似片段的CNVs有1q21.1q42.2、8q11.22q11.23、8q21.12q23.3、20q13.2q13.31这4个片段的扩增和8p12p11.23的缺失,共5个CNVs,并且所有这些片段在OMIM数据库中都存在致病基因。
片段1q21.1q42.2里共包含的基因有572个,其中包括了3个1qETS(E⁃twenty six)家族。ETS是转录因子家族中的最大的家族之一,是后生动物所特有的。ETS家族有很多功能,包括细胞分化的调控、细胞周期的调控、细胞迁移、细胞增殖、细胞凋亡、血管生成等。许多ETS都被证实与癌症有关,基因拷贝数增加是一种致癌基因激活的替代机制。经研究表明,在乳腺癌当中,1q扩增是最常见的拷贝数变异[10]。Mesquita等[10]通过染色体CGH评估141乳腺癌全基因组拷贝数变异,显示1q21和1q32是2个基因拷贝数增加最频繁的染色体带。他们通过FISH证实了1q扩增,展示了基因拷贝数增加的ETS基因:ETV3(位于1q21q23),ELF3和ELK4(两者都位于1q32)。用实时定量PCR评估3个1qETS基因表达水平以及其靶基因MYC和CRISP3,展示乳腺癌1q21和1q32的基因拷贝数扩增与ETS转录因子ETV3和ELF3在这些位点过表达有关。3个ETS基因中,ELF3与乳腺癌发生相关,可能是导致1q拷贝数增加的效应因子[10]。利用包括CGH的传统细胞学技术,可以识别乳腺癌细胞系和肿瘤的拷贝数变异常发生的区域。这些CNVs当中,包含已知的或候选的癌基因、一些肿瘤抑制基因以及相关基因,如1q、8q22的扩增和8p的缺失[8]。Yang等[11]研究也表明在乳腺癌中发现8q24、20q13、11q12和8p12⁃p11基因区域扩增。绝大多数的乳腺癌(80%)1q、8q单独扩增或两者兼而有之,也可能出现3种变化(+ 1q,+8q或⁃13q),占肿瘤的91%[12]。本实验所得到的共有CNV中,8p12p11.23的缺失和8q21.12q23.3的扩增与以上研究报道的结果一致,因此我们推断这2个片段的拷贝数变异与乳腺癌的发生发展有关。
表1 乳腺癌样本共有CNVsTable 1 The common CNVs in the breast cancer samples
在目前报道的拷贝数变异与乳腺癌相关关系的研究中,较少提及8q11.22q11.23片段。但我们查找OMIM数据库发现这个片段内有一个致病基因存在:视网膜母细胞瘤基因1诱导卷曲蛋白(RB1⁃inducible coiled⁃coil 1, RB1CC1)基因。RB1CC1基因作用在细胞周期进程,和TSC1⁃TSC2形成肿瘤抑制复合体。RB1CC1可能是RB1表达的上游调节器,在乳腺癌中是一个抑癌基因,它的纯合失活可能参与乳腺癌肿瘤发生[13]。Chano等[13]研究发现,20%的原发性乳腺癌中检测到RB1CC1基因存在突变。在有RB1CC1突变的癌症患者中,野生型RB1CC1和RB1缺失或少于正常,在没有发生该类突变的癌症患者中却比较富余[13]。因此我们推测实验样本中RB1CC1基因未发生突变,野生型RB1CC1比正常多。所以片段8q11.22q11.23的扩增与乳腺癌发生发展也许有一定关系,具体关系的阐明有待进一步研究。
实验得到的20q13.2q13.31片段中包含18个基因,其中包含了锌指蛋白217(zinc finger protein 217,ZNF217)基因。ZNF217编码选择性剪接Kruppel样DNA转录因子、DNA结合域组成成分和脯氨酸转录激活结构域,被普遍认为是参与乳腺癌肿瘤发生的癌基因。锌指蛋白是一类具有手指状结构域的转录因子,由于其自身的结构特点,可以选择性的结合特异的靶结构,使锌指蛋白在转录和翻译水平上调控基因的表达,在细胞分化、胚胎发育等生命过程中发挥重要作用。当ZNF217过表达时能使人乳腺表皮细胞无限增殖。
20q13.2区域的扩增是乳腺癌的一个早期事件,与侵略性的肿瘤行为、永生化和基因组不稳定性有关[14]。用CGH的方法检测到的20号染色体长臂的扩增,共有出现在浸润性导管癌(invasive ductal carcinoma,IDC)和淋巴结转移中[15]。Wer⁃ner等[14]人的研究首次描述了一个扩增的染色体区域20q13,这个片段里包含公认的致癌基因出现在管内增生(intraduct hyperplasia,IH)的进程中。在同样本中非典型导管增生(atypical duct hyper⁃plasia,ADH)、原位管癌(ductal carcinoma in situ,DCIS)和浸润性导管癌(invasive ductal carcinoma,IDC)中也出现20q13扩增,暗示IH和IDC的相关联系[14]。20q13.2区域的扩增可能会刺激正常上皮以加速细胞增殖和导管增生,加上基因变化,包括20 q13.2从低扩增向高扩增的转换,从而促进肿瘤形成,即20q13扩增促进从肿瘤初期(IH)到后阶段(DCIS,IDC)的致癌作用[14]。本实验的样本全取自左侧乳腺浸润性导管癌患者的癌组织,扫描后所得结果显示20q13扩增出现频率为100%。
通过芯片扫描结果、数据库查询和相关文献检索,1q21.1q42.2、8q21.12q23.3、20q13.2q13.31这3个片段的扩增以及8p12p11.23的缺失与乳腺癌的发生和发展可能有一定联系,8q11.22q11.23的扩增与乳腺癌发生发展的关系尚有待一进步验证。由于本研究样品较少,后续需要加大样本量对结果进行验证。
参考文献
[1]黄哲宙,陈万青,吴春晓,等.中国女性乳腺癌的发病和死亡现况——全国32个肿瘤登记点2003-2007年资料分析报告[J].肿瘤,2012,32(6):435-439.
[2]郑莹,吴春晓,张敏璐.乳腺癌在中国的流行状况和疾病特征[J].中国癌症杂志,2013,18(8):561-569.
[3]Fan L,Strasser-Weippl K,Li JJ,et al. Breast cancer in China[J]. The Lancet Oncology,2014,15(7):e279-289.
[4]Perou CM,Sørlie T,Eisen MB,et al. Molecular por⁃traits of human breast tumours[J]. Nature,2000,406 (6797):747-752.
[5]carpten JD,Faber AL,Horn C,et al.A transforming mutation in the pleckstrin homology domain of AKT1 in cancer[J]. Nature,2007,448(7152):439-444.
[6]Andre F,Bachelot T,Campone M,et al. Targeting EGFR with dovinib(TKI258):preclinical and clinical data in breast cancer[J]. Clin Cancer Res,2013,19 (13):3693-3702.
[7]张艳亮,涂植光,戴勇.微阵列比较基因组杂交技术及其在遗传性疾病中的应用[J].中华检验医学杂志,2009,32(10):1188-1190.
[8]Pollack JR,Sorlie T,Perou CM,et al. Microarray analysis reveals a major direct role of DNA copy num⁃ber alteration in the transcriptional program of human breast tumors[J]. Proceedings of the National Academy of Sciences of the United States of America,2002,99(20):12963-12968.
[9]吴英娟,孟令新. array-CGH技术及其在肿瘤学中的应用和意义[J].实用肿瘤学杂志,2004,19(5):389-392.
[10]Mesquita B,Lopes P,Rodrigues A,et al. Frequent copy number gains at 1q21 and 1q32 are associated with overexpression of the ETS transcription factors ETV3 and ELF3 in breast cancer irrespective of molecu⁃lar subtypes[J]. Breast cancer research and treatment,2013,138(1):37-45.
[11]Yang ZQ,Streicher KL,Ray ME,et al. Multiple inter⁃acting oncogenes on the 8p11-p12 amplicon in human breast cancer[J]. Cancer research,2006,66(24):11632-11643.
[12]Tirkkonen M,Tanner M,Karhu R,et al. Molecular cytogenetics of primary breast cancer by CGH[J]. Genes,Chromosomes &Cancer,1998,21(3):177-184.
[13]Chano T,Kontani K,Teramoto K,et al. Truncating mutations of RB1CC1 in human breast cancer[J]. Na⁃ture genetics,2002,31(3):285-288.
[14]Werner M,Mattis A,Aubele M,et al. 20q13.2 ampli⁃fication in intraductal hyperplasia adjacent to in situ and invasive ductal carcinoma of the breast[J]. Vir⁃chowsArchiv,1999,435(5):469-472.
[15]Aubele M,Mattis A,Zitzelsberger H,et al. Intratu⁃moral heterogeneity in breast carcinoma revealed by la⁃ser-microdissection and comparative genomic hybrid⁃ization[J]. Cancer genetics and cytogenetics,1999,110(2):94-102.
论著
Preliminary study of common copy number variations of breast cancer patients detected by array⁃based comparative genomic hybridization technology
ZHOU Hui1,HE Dan2,YANG Xuexi1,LI Fenxia2
(1. School of Biotechnology,Southern Medical University,Guangzhou,Guangdong,China,510515;
2. Guangzhou Darui Biotechnology Co. LTD,Guangzhou,Guangdong,China,510665)
[ABSTRACT]Objective To explore associations between the common copy number variations (CNVs) in breast cancer patients and the occurrence and development of breast cancer, which may provide the foundation to study the prevention, treatment and prognosis of breast cancer. Methods CNVs of genomic DNA were obtained by array⁃based comparative genomic hybridization techniques. Then the CNVs were analyzed in terms of the Database of Genomic Variants and Online Mendelian Inheritance in Man, revealing a relationship between common CNVs and breast cancer. Results In 4 breast cancer samples, 9 common copy number variations 1q21, 8p11, 8p12, 8q11, 14q32, 14q32.33(including 2 CNVs), 20q13 and 22q11 were selected out. And 4 of them were confirmed as normal polymorphism copy number variations. While the remaining 5 CNVs were, including 4 amplification and 1 loss, could not be identified through the Database of Genomic Variants and Online Mendelian Inheritance in Man. Conclusion Amplified 1q21.1q42.2, 8q21.12q23.3, 20q13.2q13.31 and loss of 8p12p11.23 may be associated with the occurrence and development of breast cancer. The connections between amplifications of 8q11.22 q11.23 and breast cancerstill needs furtherverification.
[KEY WORDS]Breast cancer;Copy numbervariation;Array⁃based comparative genomichybridization
基金项目:国家自然科学基金(81302327);广州市科技计划攻关项目(2060404)
通讯作者:李粉霞,E⁃mail:lifenxia123@gmail.com