邵营波,张 瑾
到目前为止,人们对肿瘤发生机制的认识可归纳为几个基本假说,即基因突变、染色体易位、表观遗传修饰和干细胞起源。然而到目前为止,仅有一小部分的基因变异得到证实,获得的信息非常有限。而那些在肿瘤发生、发展过程中起关键作用的基因变化还不明确。因此,要回答基因突变与肿瘤关系这一问题,首先需要揭示全部基因变异的规律,进一步利用这一研究成果,实现肿瘤个体化治疗。而实现这一目标的前提在于要从全基因组水平上阐明肿瘤基因变异的规律,这不仅是分子医学发展的基础,也是未来医药科学发展的基础。而人类基因变异组计划(HVP)[1]为肿瘤全基因组及其他疾病的研究开辟了新的道路,具有广阔的发展前景。
人类基因组计划的完成标志着后基因组时代的开始,人类基因组计划完成了人类基因组的全部测序工作,为后基因组时代研究基因如何影响生命活动奠定了坚实的基础。随着越来越多的基因变异被研究者发现,亟须建立一个完善的系统来收集、记录、储存这些变异基因信息以指导临床实践和基础研究。2006年,HVP正式启动,HVP是一项浩大的首创性国际合作工程,旨在收集所有与人类疾病相关的遗传变异,使得全世界的临床医生和科学家能够共享这些疾病相关遗传数据,应用于基础研究和临床实践中[2-4]。
基因变异与大约10%的人类疾病相关,据推断,在世界范围内有60%的人口受到基因变异的影响,5%的人口受基因变异影响的时间超过25年。1949年,人类已经在分子水平上详细阐释了与疾病相关的基因变异,但是直到20世纪80年代,基因变异数据的收集整理工作才由Victor Mckusick教授启动,由他建立的人类孟德尔遗传在线数据库 (online Medelian inheritance in man,OMIM)搜集了大量的基因变异信息。人类基因突变数据库(HGMD)[5-6]是由英国卡尔地夫医学遗传研究所构建的,从约250种期刊中收集突变信息。用计算机和手工结合的方法来扫描这些期刊以寻找相关基因变异信息,包括在编码区、调控区和剪接区域的点突变,还包括插入、缺失、复制及重复。OMIM以及后来建立的HGMD收集了已经发表的基因变异信息,但是在实验室和临床中发现的但尚未发表的基因变异信息并未收录在内。
为了解决基因变异数据系统性收集的问题,1994年,在美国人类遗传学的蒙特利尔会议上,一些遗传学家提出建立位点特异性变异库 (locus specific databases,LSDBs)[7],收集与某一特定基因相关的突变信息。这次会议促使国际人类基因组组织 (HUGO)成立了人类基因组织突变数据库行动组,并进一步发展成为人类基因组突变学会 (human genome variation society,HGVS)。此后,研究又发现基因变异除了与遗传性疾病相关外,与一些常见的疾病和耐药性也可能相关,这促使人们对单核苷酸多态性 (SNPs)[8]进行研究,研究数据主要收录在单核苷酸多态性数据库 (dbSNP)中。上述数据库的建立为基因变异的研究创造了有利条件,但遗憾的是上述数据库仍不能完整收录与人类疾病相关的所有基因变异信息。
2006年,在澳大利亚墨尔本会议上,来自各个国家的遗传学家一致同意启动HVP,HVP旨在收集、校对和发表所有的与人类健康相关的基因变异相关信息。自此,HVP正式启动。HVP旨在全面建立各个基因座位专一数据库 (locus-specific database,LSDB),收集输入所有文献报道和研究、临床机构尚未发表的致病突变和非致病变异,分析揭示基因型和临床表型的相关关系及发病的分子机制,以期能够准确进行临床基因诊断,正确防治疾病,实现个性化医疗。
2.1 获得所有与人类疾病相关的基因变异数据,对每个基因上的突变逐一进行人工校阅后存储在一个中心结点 (数据库)。在不同国家提供该中心节点的镜像网站,并最大限度保证数据安全和一致性,用户可以通过一个统一的界面查阅这些数据。
2.2 提供一个标准的系统 (包括统一的基因变异领域的所有专业术语以及基因参考序列)和各种支持系统 (主要是软件),方便医学诊断实验室使用,并对人类变异知识的积累有所贡献。
2.3 建立各种系统,确保人类变异信息得到足够的人工校阅,并提高校阅的准确度,减少错误。校阅范围可以是基因(位点)特异性突变、国家或人种特异性突变、疾病特异性突变等。最终目标是建立一个覆盖人类基因组的、广泛的变异数据集合。
2.4 建立一套结构化的分层机制,确保临床工作人员可以使用它对与某个遗传变异可能导致的潜在结果 (如疾病)进行判定。加强变异数据提供者与使用者之间的相互沟通,鼓励临床工作人员提供数据或者对数据进行修正和补充。
2.5 支持发展中国家全面参与人类变异信息的收集、分析和共享,并开展相关研究。在世界范围内建立一个通信与教育项目,收集并传播与人类变异有关的知识。
HVP[13-14]是一项涉及临床医生、生物学家、生物分子实验室的国际性工程。伦理、命名与标准、论文发表、临床数据收集、数据存取整合、实验室数据收集、致病性分析、国家数据收集、应用转化及个体化医学、数据传送、储存和鉴别、资金筹集及支持构成了HVP的工作框架。
3.1 数据来源、校对与命名 临床医生可以及时发现变异临床表型,实验室能够为临床医师检测基因变异序列,因此临床医师和实验室是基因变异数据的主要来源。传统的基因突变的检测方法有:单链构象异构多态分析技术 (SSCP)、异质性双链构象多态性分析 (HTX)、变性梯度凝胶电泳 (DGGE)等[15],随着 HVP的完成和生物芯片、测序技术及生物信息学分析方法的快速发展,基因芯片与新型DNA测序这2种高通量基因组学研究技术的成熟与应用,使全基因组结构和功能研究成为可能。临床医师和实验室获得的基因变异数据传递到负责收集突变数据的WayStation系统。在WayStation系统官方网 站 (www.centralmutations.org/)上,用户可以方便地上传基因数据。数据上传之后,WayStation系统审核委员会负责对数据进行审核、校对,WayStation系统审核委员会由一些基因编辑组成,每个基因编辑负责对自己熟悉的基因所包括的突变进行审核,这些专家可以得到各类开放软件和信息学家的技术支持。WayStation系统还在不断招募基因编辑进行基因审核、校对工作。
HVP收集了大量的基因变异序列,这就需要制定基因突变的规范统一的描述标准、简化复杂基因突变序列的描述以及制定位点特异性基因序列格式。在HGVS网站 (www.hgvs.org/mutnomen)上收录了变异序列的详细描述和标准化的专业术语。第3届人类基因变异组大会上,专家同意将位点相关基因 (LRG)序列格式[16]作为新的描述变异序列的标准,在LRG网站 (www.lrg-sequence.org)上可以得到详细的信息。对复制数量变异的基因以及复杂基因的描述标准正在探讨中。
3.2 数据库的建立 提交到WayStation系统并且通过WayStation审核委员会审核的突变数据,将集中并存储到中心突变数据 库 中。 在 HGVS 网 站 上(www.hgvs.org/dblist/glsdb.html)已经收录了1 550 个 LSDBs[17-18],LSDBs需经过HVP认证,并使用统一的参考序列、命名系统和数据库标准。LSDBs需要包括高质量的临床信息和表型信息,声明每个变异实例,标示数据质量,并且接收各种数据提交。校阅后的序列 (及变异)数据需要提交给公共数据库供查阅。这些数据库收录了大量的临床表型-基因变异型资料,对于患者、医生以及基础研究者是宝贵的资源。在中心数据库之外,尚有疾病相关特异性基因变异数据库,这些数据库对于特定疾病的诊断和治疗具有重要的意义。目前疾病相关特异性基因变异研究组织有国际遗传性胃肠道肿瘤协会[19]、微营养基因工程[20]以及神经遗传学合作组织[21-22]。HVP旨在收集全球范围内基因变异信息,但是不同国家和人种文化的差异是HVP面临的一大挑战,这就需要建立多个国家特异性节点来完成基因变异信息的收集。目前已经建立的国家特异性基因变异研究机构有中国-HVP、韩国-HVP、阿拉伯基因研究中心、澳大利亚-HVP、DMUDB-UK 等[23-25]。
此外,HVP的工作内容还有伦理学问题、数据的转化及公众教育[26]、资金资助及支持、病因评估、鼓励发展中国家的参与及合作等,这里不再详细叙述。
4.1 HVP与结直肠癌 2007年,国际胃肠道遗传性肿瘤协会 (InSiGHT)[19]与HVP合作,启动了HVP-InSiGHT计划,收集结肠癌易感性相关基因变异。国际胃肠道遗传性肿瘤协会是一个国际性的多学科合作组织,旨在提高携带遗传性胃肠道肿瘤变异基因患者的诊断和治疗水平。HVP-InSiGHT计划在遗传性结直肠肿瘤,特别是在遗传性非息肉性大肠癌,即Lynch综合征研究中取得了很大的进展。研究表明Lynch综合征[27]是一种由错配修复基因 (mismatch repair gene,MMR)种系突变而引起的常染色体显性遗传病。而MMR的种系突变以及由突变而引起的微卫星序列不稳定 (microsatellite instability,MSI)是Lynch综合征发生的遗传学基础。每个 MMR基因 (包括 hMLH1、hMSH2、hPMS1、hPMS2、hMSH3和 hMSH6等)都编码一个参与DNA错配修复的蛋白质。这些蛋白质纠正DNA复制的错误。遗传性非息肉病性结直肠癌(HNPCC)患者遗传性获得胚系突变的MMR基因,一旦其靶器官 (大肠、子宫内膜、小肠、肾盂输尿管等)的黏膜上皮中另一条正常的等位基因发生体细胞突变或缺失,则使该基因失活,相应的编码蛋白的缺失将影响DNA错配修复功能,从而使细胞具有恶变的可能性。当MMR基因发生突变和功能缺陷时,DNA复制错误的增加将使基因组DNA的微卫星序列发生延长或缩短,从而出现明显的重复次数变化的不稳定性——即MSI。HVPInSiGHT计划在对错配修复基因MMR研究中建立了遗传性非息肉性大肠癌疾病基因变异数据库。这个数据库属于基于基因位点变异格式的数据库 (LOVD),收录了6个易感基因 LSDBs,包括 MLH1、MLH3、MSH2、MSH6、PMS1 和 PMS2。国际胃肠道遗传性肿瘤协会与HVP的合作促进了遗传性结直肠癌基因变异数据库的建立,为结直肠癌全基因变异组数据库的最终建立奠定了坚实的基础。
4.2 HVP与乳腺癌及卵巢癌 对肿瘤易感性的基因检测[28]开始于20世纪90年代,主要针对具有家族性肿瘤遗传病史个体的筛查,确定是否携带有肿瘤易感基因,以制定临床干预方案。然而在基因检测过程中以及研究中发现的基因变异并非都是致病性基因变异,很大比例的基因变异类型目前尚不能确定是否是致病性基因变异,这部分基因变异一般被称为未分类的基因变异 (UVs)[29]。HVP研究基因变异的目的在于建立临床表型-基因变异型资料,使基因变异数据用于疾病的诊断和治疗,因此必须首先明确UVs的性质,即病因评估。病因评估是HVP研究的重要内容。
约7%的乳腺癌和10%的卵巢癌是遗传性的,而84%的遗传性的乳腺癌和卵巢癌是由 BRCA基因变异引起的[30]。BRCA2基因染色体13q12-13区域突变的个体,一生患乳腺癌的风险为60%~85%,患卵巢癌的风险为15% ~30%,这是明确的致病性BRCA基因突变。而乳腺癌中心数据库的资料表明,已发现的BRCA基因突变类型中有50%属于UVs,如何处理携带有未分类BRCA基因变异的个体是目前比较棘手的问题。
HVP在BRCA未分类基因变异研究中取得了很大的进展。国际肿瘤研究机构(IARC)建立了 BRCA1和 BRCA2数据库[31],在这个数据库中以 IARC分类系统为标准,将BRCA致病性基因变异和UVs进行等级分类,BRCA基因变异类型分为5个等级,致病可能性大于99%定义为class 5,而致病可能性小于1%定义为class 1。4级和5级需要遗传学咨询,3级需要考虑家族史等其他相关因素,而1级和2级为低风险,不需要处理。HVP BRCA数据库的建立和不断完善,为分类、鉴别未分类的BRCA基因变异提供了有力的工具。
由于基因突变对于肿瘤基因组学的意义以及其在医学生物学各领域中的应用前景,有关基因突变的研究将是21世纪生命科学的热点。肿瘤个体化治疗是今后的发展方向,实现这一目标的核心是系统、全面地揭示肿瘤发生、发展的规律和发展先进的诊疗方法。这项艰巨的工作与解码生命的奥秘一样,首先要在基因变异组学水平阐明其规律[32],实现基因变异组学与肿瘤生物学的整合与集成,这是肿瘤生物学研究的基础和转折点。HVP在肿瘤的生物学行为研究和防治中具有广阔的应用前景。
1 Ring HZ,Kwok PY,Cotton RG.Human Variome Project:an international collaboration to catalogue human genetic variation[J].Pharmacogenomics,2006,7(7):969-972.
2 Cotton RG,Kazazian HH.Toward a Human VariomeProject [J].Human Mutation,2005,26(6):499-499.
3 Horaitis O,Cotton RG.The challenge of documenting mutation across the genome:The human genome variation society approach [J].Human Mutation,2004,23(5):447-452.
4 Cotton RG,Hardman L.Human Variome Project:progress and plans[J].Personalized Medicine,2008,5(2):99-100.
5 Stenson PD,Mort M,Ball EV,et al.The Human Gene Mutation Database:2008 update[J].Genome Med,2009,1(1):13.
6 Cooper DN,Stenson PD,Chuzhanova NA.The Human Gene Mutation Database(HGMD)and its exploitation in the study of mutational mechanisms [J].Curr Protoc Bioinformatics,2006,1(1):13.
7 Horaitis O,Talbot CC,Phommarinh M,et al.A database of locus-specific databases[J].Nature Genetics,2007,39(4):425-425.
8 Cotton RG.Recommendations of the 2006 Human Variome Project meeting [J].Nature Genetics,2007,39(4):433-436.
9 Kaput J,Cotton RG,Hardman L,et al.Planning the Human Variome Project:The Spain report[J].Human Mutation,2009,30(4):496-510.
10 高山,张宁,张磊,等.人类变异组计划及其进展 [J].遗传,2010,32(11):1105-1113.
11 Kohonen-Corish MR,Al-Aama JY,Auerbach AD,et al.How to catch all those mutations——the report of the third Human Variome Project Meeting,UNESCO Paris,May 2010 [J].Human Mutation,2010,31(12):1374-1381.
12 Cotton RG.Collection of variation causing disease.The Human Variome Project[J].Human Genomics,2010,3(4):301-303.
13 Cotton R,Auerbach A,Axton M,et al.The Human Variome Project[J].Science,2008,322(5903):861-862.
14 Editor T.What is the Human Variome Project? [J].Nature Genetics,2007,39,423.
15 张明,吴登俊,郑鸿培.基因突变检测策略[J].生命科学趋势,2003,1(4):37-41.
16 Oetting WS.Clinical genetics&human genome variation:the 2008 Human Genome Variation Society scientific meeting [J].Human Mutation,2009,30(5):852-856.
17 Dalgleish R,Flicek P,Cunningham F,et al.Reference genomic sequences:an improved basis for describing human DNA variants[J].Genome Med,2010,2(4):24.
18 Povey S,Aqeel AI,Cambon-Thomsen A,et al.Practical guidelines addressing ethical issues pertaining to the curation of human locus-specific variation databases(LSDBs)[J].Human Mutation,2010,31:1179-1184.
19 Kohonen-Corish M,Thomas K,Lindblom WA,et al.Report of the combined meeting of the International Society for Gastrointestinal Hereditary Tumours,theHumanVariome Project and the National Cancer Institute Colon Cancer Family Registry, Duesseldorf,Germany,24 June 2009 [J].Familial Cancer,2010,9:705-711.
20 Kaput J,Evelo C,Perozzi G,et al.Connecting the Human Variome Project to nutrigenomics[J].Genes and Nutrition,2010,5:275-283.
21 Kao WT,Wang Y,Kleinman JE,et al.Common genetic variation in Neuregulin 3(NRG3)influencesrisk for schizophrenia and impacts NRG3 expression in human brain[J].Proc Natl Acad Sci USA,2010,107(35):15619-24.
22 Nakata K,Lipska BK,Hyde TM,et al.Newburn EN:DISC1 splice variants are upregulated in schizophrenia and associated with risk polymorphisms[J].Proc Natl Acad Sci U S A,2009,106(37):15873-15878.
23 Cotton RG,Al Aqeel AI,Al-Mulla F,et al.Capturing all disease-causing mutations for clinical and research use:Toward an effortless system for the Human Variome Project[J].Genetics in Medicine,2009,11(12),843-849.
24 Patrinos GP,Al Aama J,Al Aqeel A,et al.Recommendations for genetic variation data capture in developing countries to ensure a comprehensive worldwide data collection [J].Human Mutation,2010,32(1):2-9.
25 den Dunnen JT,Sijmons RH,Andersen PS,et al.Sharing data between LSDBs and centralrepositories [J]. Human Mutation,2009,30(4):493-495.
26 Howard HJ,Horaitis O,Cotton RG,et al.The human variome project(HVP)2009 forum"towards establishing standards" [J].Human Mutation,2010,31(3):366-367.
27 王石林,顾国利.遗传性结直肠肿瘤研究进展[J].世界华人消化杂志,2009,17(30):3075-3085.
28 Plon SE,Eccles DM,Easton D,et al.Sequence variant classification and reporting:recommendations for improving the interpretation of cancer susceptibility genetic test results[J].Human Mutation,2008,29(11):1282-1291.
29 Wu K,Hinson SR,Ohashi A,et al.Functional evaluation and cancer risk assessment of BRCA2 unclassified variants [J].Cancer Res,2005,65:417-426.
30 Radice P,De Summa S,Caleca L,et al.Unclassified variants in BRCA genes:guidelines for interpretation [J].Annals of Oncology,2011,22(suppl 1):i18-i23.
31 Tavtigian SV,Greenblatt MS,Goldgar DE,et al.Assessing pathogenicity:overview of results from the IARC unclassified genetic variants working group [J].Human Mutation,2008,29(11):1261-1264.
32 吕有勇,陈凤.肿瘤全基因组变异分析的意义评述 [J].诊断学理论与实践,2009,8(1):1-5.