薛开先
遗传学是生物学的核心学科之一,与医学研究关系密切。在传统遗传学发展的100多年间,阐明了性状的遗传规律,证明遗传信息贮存于DNA序列之中,人类基因组的测序将这一方向的研究推向极致,虽取得不少成果,但已发现的传统遗传学的问题依然存在,又提出了新的问题,却未能如预期在医疗实践中取得重大突破;另一方面,近几十年来表遗传学(epigenetics或译成表观遗传学)异军突起,成为主流医学生物学的重要研究领域,尤其在肿瘤表遗传学研究中更是取得了重大进展,弥补了传统遗传学研究之不足。
遗传学是现代医学生物学的重要研究领域,关于遗传学的定义各家有不同的表述,主要有如下几类:(1)遗传学是研究遗传性状遗传与表达的生物学分支;(2)遗传学是生物学的一个分支,是研究机体的遗传,特别是亲缘机体间遗传性状遗传和变异的机制;(3)遗传学是研究基因的结构功能及其变异、传递和表达规律的学科。
关于遗传性状遗传方式的研究,应追溯到1865年孟德尔发表的“植物杂交试验”,他在自花授粉的豌豆研究中发现了一对性状遗传的“分离律”,以及两对性状遗传的“自由组合律”,为解释这些遗传现象,提出了遗传因子学说;但他的理论在1900年被重新发现前,一直未受到重视[1]。
Bateson在1905年创造出遗传学(genetics)一词。1910年后摩尔根和他的学生相继发现了伴性遗传和连锁遗传现象,证明基因在染色体上呈线性排列;同一条染色体上的基因有连锁遗传的倾向,但可发生交换;而不同染色体间基因则遵循孟德尔遗传规律。可见摩尔根的基因论丰富和发展了孟德尔的遗传因子学说[1]。
随着研究的深入,一些遗传现象不能用上述遗传规律来解释,例如 (1)在印记基因遗传中,表现的性状取决于亲本的来源,而传统理论认为来自双亲的等位基因对遗传贡献是相等的;(2)核移植所形成的克隆胚胎,胚胎发育出现各种异常,多数在出生前夭亡,少数存活的个体也多有畸形,而克隆胚胎具有完整的基因组;(3)人类同卵双生子具有完全相同的基因组,部分同卵双生子20岁后可出现特征、个性和疾病易感性等方面的差异[2]。
这些问题反映了传统遗传学对性状发育和表型遗传机制研究之不足,两个相关的核心生物学问题尚待阐明:一是如何从基因型相同的单一受精卵分化形成由表型各异的、多种细胞类型组成的复杂有机体;二是什么样的分子机制参与表型遗传。上述所谓遗传律,实质上只是说明基因在配子形成中的行为规律,而对遗传性状在个体发育中如何实现未有阐明。在认知上,决定性状基因的世代间传递与遗传性状在发育中形成是一个问题的两个方面,缺少其中一个方面的研究就不能构成一门完整的科学[2]。早期作为胚胎学家的摩尔根,当时就已认识到这一点,1925年他在《基因论》一书中预见:“明了基因如何对发育中个体发生影响,毫无疑义地将使我们对遗传的观点进一步扩大,对于目前还不了解的许多现象也多半会有所阐明”。
基因是遗传学的核心概念。1865年孟德尔提出的遗传因子是根据科学实验推测的、决定遗传性状的功能单位;1909年约翰逊把遗传因子称为基因(gene),并区分基因型和表型;1910年后摩尔根等发现连锁遗传现象,证明基因位于染色体上,同一条染色体上的基因彼此间连锁遗传;并认为基因是染色体上占有一定位置的、遗传的结构与功能单位,即所谓颗粒基因(particulate gene)理论。然而他们提出的基因是遗传、突变和重组最小单位的观点则被后人的研究所否定[2]。
20世纪40年代后,随着生化、分子遗传学的兴起,基于突变可引起先天性代谢缺陷,提出了“一个基因一个酶”理论;细菌转化和噬菌体转染试验证明,DNA是遗传的物质载体;DNA双螺旋结构和遗传密码的发现,和随后遗传工程技术发展与应用,传统遗传学基本接受了如下的定义:基因是编码一条多肽链的DNA片段;1961年Jacob操纵子的研究,将表达调控序列也列为基因;他还认为,基因组应包括调控它们实施的方法或机制,然而这一重要的预见未受到应有的重视[2]。
颗粒基因的理论一直受到挑战,在20世纪20、30年代的果蝇易位研究中就已发现,仅改变基因在染色体上位置,就能改变遗传性状;至今仍未发现能隔开基因的隔离子存在;重叠基因的发现,以及在基因间和内含子内发现了新的转录序列,并证明它们对基因组有重要调节功能。上述研究结果都表明,要把基因如此复杂的工作概念转变为有明确界限的、不连续的物理结构可能总是有问题的。因此,一些作者倾向于认为,基因是功能单位[2]。
传统遗传学根据DNA是唯一的遗传物质,以及分子生物学中心法则,为解码生命,阐明物种间和个体间差异的起因、疾病发生的机制,以及要在医学和农业实践中取得突破,逻辑推论的结果必然是要开展全基因组测序的研究[3-4]。自20世纪90年代以来,先后开展了人类、模式和重要经济动植物等全基因组的测序,以及后基因组计划的研究,虽获得一系列重大成果,但也获得了许多意想不到的结果,对传统基因中心论观点形成了冲击,并对上述逻辑前提出了疑问[4-5]。
人类基因组测序结果表明,编码蛋白质的基因数不是原预测的100 000,而是不足25 000;也不是如原来推测的那样,机体愈复杂,基因数愈多,如在整个脊椎动物编码蛋白质基因的数量和编码序列的长度并没有显著改变,甚至所有的多细胞生物基因数低于某些单细胞生物。可见基因的数量和序列的长度不是机体复杂性的决定性因素[4-5]。
深入研究发现,生物学复杂性通常与非蛋白质编码的基因组部分相关,目前已检出数千种非蛋白质编码的调节RNA(regulatory non-protein-coding RNAs ncRNAs),并已明确这些 ncRNA在转录和转录后调节和构建染色质修饰复合物中起关键作用;ncRNA促进正常发育和生理过程,一旦功能异常就引发疾病。还有研究指出,占复杂有机体基因组绝大部分为非编码DNA,是顺式调控元件和非蛋白质编码的功能序列扩展的结果[5]。
长期以来分子生物学中心法则认为,遗传学信息正常是从DNA经过RNA流向蛋白质,RNA仅作为携带遗传信息的中间递体,最终按遗传密码合成蛋白质;而占基因组绝大部分的非蛋白质编码序列被认为多数没有功能,甚至被称为“垃圾”。近年来的研究结果表明,ncRNA是一大类功能分子,是由内源性基因家族所编码,在进化上相当保守;具有重要而多样的生物学功能,成为重要的真核生物遗传现象,如转录和转录后基因沉默、X染色体剂量补偿、生殖细胞重编程和副突变等。这些研究表明,传统遗传学对RNA的认识是片面的,没有认识到它在生物遗传中的重要意义[6-7]。
近年来大协作全基因组关联性研究(Genomewide association studies,GWAS),可提供在没有现有知识情况下,有效地鉴定常见的、低外显率的疾病相关位点的方法,如在5种常见的癌症:乳腺癌、前列腺癌、大肠癌、肺癌和黑色素瘤中进行的GWAS研究,已鉴定出超过20种疾病位点,确认这些肿瘤的易感性是多基因的,其中多数为低效检出。在其他多发疾病与常见遗传变体相关性研究中,也获得了大致相似的结果。这些研究提示,需要研究新的疾病机制[7-8]。
国际权威杂志《nature》在社评人类基因组计划完成后的十年研究时指出,由于生物系统本身的复杂性,测序结果很快地运用于医疗实践的希望破灭了;旨在找到常见的遗传变体与疾病之间关系的研究,所取得的成功亦相当有限;由于大多数的癌症有各自的遗传学特征,这也使得试图找到一种能够广泛适用的治疗癌症的方法变得非常困难,结合本文上述讨论,在开放、复杂的生物学系统中,尤其是在高等生物中DNA中心论思想是存在局限性的,需要突破和发展[1-2,8]。
遗传学和发育生物学是密切相关的学科,然而在20世纪的最初几十年,遗传学和发育生物学各自发展,很少考虑对方的成果和方法。至40年代初一些重要生物学家认识到这些研究方法的局限性,其中通晓发育生物学和遗传学的Waddington主张将两个学科联系起来研究,首先引入epigenetics概念,简言之表遗传学是研究基因型产生表型的机制,但当时并没有受到学术界的重视[1,9]。
20世纪80年代Hollidy重提表遗传学研究,并首先与DNA甲基化现象联系起来。他认为高等生物基因本质的研究,应包括基因在生物世代间的传递机制,以及从受精卵至成体发育过程中基因的作用方式;在发育和成体阶段,可遗传的基因表达改变经有丝分裂和减数分裂在细胞和个体世代间传递,而没有DNA序列的改变。至90年代,表遗传学研究取得了一系列重大突破,例如:(1)小鼠的基因剔除实验表明,失去DNA甲基化酶小鼠发育异常,提示甲基化酶在正常发育中起重要作用;(2)在各种人类肿瘤研究发现,肿瘤抑制基因p16高甲基化后灭活,并可用去甲基化制剂使之逆转。目前积累的大量资料已证明,异常DNA甲基化是肿瘤抑制基因灭活的重要途径;(3)发现了多种与DNA修饰相关的甲基化酶,以及检测DNA甲基化状态的简便、敏感的技术等。
2001年《Science》的编辑发表一组述评,系统而全面地介绍了表遗传学研究领域及其进展,这表明表遗传学已进入主流生物学。此后,表遗传学和表基因组的研究受到广泛的关注,在医学、生物学的研究尤其在肿瘤理论和临床应用研究中取得重大进展,表遗传学研究进入了全新的发展阶段。
受精卵及其发育形成的复杂有机体,绝大多数体细胞具有相同的基因组,维持细胞正常功能仅需要数千个基因,它们只占基因组的一小部分,这样在胚胎发育、细胞周期和应答环境改变等生命活动中,根据一定的时空和内外环境条件,如何选择一组基因活化、另一组基因灭活已成为这些过程的关键,而表遗传学调控提供了这一选择的分子机制。
表遗传学是研究没有DNA序列变化的、可遗传的表达改变。表遗传学调控的机制主要有DNA甲基化、组蛋白修饰、组蛋白变体置换、染色质重塑和ncRNA等,近年来又提出新的表遗传学机制,如核小体的占位和周转、高层次的染色质折叠、PcG与TrxG蛋白以及DNA和RNA编辑等[8],但其中关键的分子机制是DNA甲基化、组蛋白修饰和ncRNA,它们分别或相互作用,构成了多层次的表遗传学调控机制。
DNA甲基化由酶介导的添加甲基的化学修饰,5甲基胞嘧啶是哺乳动物中唯一已知的、天然DNA修饰,仅发生在CpG二核苷酸,可能是最关键的表遗传学调节。DNA甲基化所引起的基因灭活,多为长期、相对刚性的改变,提供了特定序列如转座子、印记基因和干细胞多能性相关基因等的沉默;组蛋白是与DNA结合的小分子碱性蛋白,在进化上高度保守。组蛋白翻译后修饰包括乙酰化、甲基化、磷酸化、泛素化和苏素化等,组蛋白修饰所产生的基因灭活多为短期、柔性的改变,用于转录因子基因等的抑制;基因组非编码DNA转录产生数千种、不同大小的调节ncRNA,其序列种间保守,ncRNA以时序性和组织特异性的方式表达,各种类型的ncRNA几乎调节每个水平的基因表达[10]。
与DNA甲基化和组蛋白修饰等相关的、表遗传学调节蛋白如DNA甲基转移酶、甲基CpG结合区蛋白、组蛋白修饰酶、染色质重塑因子以及ncRNA等相结合,产生各种抑制性复合物,引发染色质构型的改变,决定了转录复合物与靶基因可接近的程度,显示染色质修饰作为基因转录活性调控的基本机制[9]。这样,DNA甲基化、组蛋白修饰、ncRNA和染色质重塑等多层次的表遗传学调控机制间的分工合作构成了一个巨大而高效的基因调控网络[5,10]。
传统遗传学研究的不完整性和存在问题,意味着需要修正和发展,而表遗传学的发展正在弥补其不足。
2.3.1 传统遗传学与表遗传学是遗传学的一体两面 遗传与变异是生命的基本现象,作为完整的遗传学科,不仅如传统遗传学那样,研究遗传性状在生物世代间的传递规律,研究遗传物质DNA的复制、修复和变异等的机制,而且要研究遗传性状在个体发育中的形成与变异,研究调控和实施遗传学信息的分子机制,而后者正是表遗传学的研究范畴。可见,传统遗传学和表遗传学应是科学的遗传学的不可分离的两个组成部分。首先发现肿瘤DNA甲基化改变的美国表遗传学家Feinberg,在本世纪初讨论肿瘤遗传学和表遗传学关系时比喻为“阴阳”,并用太极图示意两者间的转化。老子《道德经》云:“万物负阴而抱阳”,表示世间任何事物的阴阳两面既相互区别与制约,又相辅相成而具有同一性。作为遗传学的两个组成部分的传统遗传学和表遗传学,正是这样“负阴抱阳”的关系[1-2]。
目前认为,DNA是遗传信息的物质载体,遗传信息贮存在DNA的序列之中;表遗传信息贮存在原始基因组结构表面的、各类染色质修饰及其组合之中。于是人类基因组含有两类遗传学信息,遗传信息提供了合成生命所必需蛋白质的模板;表遗传信息提供了何时、何地和以何种方式应用遗传学信息的指令,后者是更高层次、更特化的遗传信息,它们在与遗传信息和环境的相互作用中,遗传性状(表型)形成[1-2],这样表遗传学将基因型和环境与表型和疾病连接起来[11]。由此可见,在遗传性状的世代传递中,不仅DNA、而且表遗传学修饰都是必不可少的遗传物质基础,故有作者建议把基因或遗传物质组成从一定的DNA序列延扩至相应部分的表遗传学修饰,目前一些作者把基因限定在DNA及其包装蛋白(组蛋白)水平,因为它们是遗传信息和表遗传信息贮存、复制、传递和实现的物质基础[1]。
2.3.2 表遗传学正在解开传统遗传学之谜 随着表遗传学的深入发展,新的研究成果正在逐步阐明传统遗传学不能合理解释的遗传现象,例如在印记基因决定性状的遗传中,不符合孟德尔规律,表现的性状取决于亲本的来源。在小鼠胰岛素生长因子2(insulin-like growth factor 2,Igf2)基因只表达父源等位基因,而母源等位基因被印记不予表达;相反,在胰岛素生长因子2受体(insulin-like growth factor 2 receptor,Igf2r)基因只表达母源,而不表达印记的父源性等位基因,这些都是因为特定亲本印记等位基因中差异甲基化区(DMR)高甲基化的结果。
将成体组织细胞核移植进卵细胞质所形成的克隆胚胎具有全套基因,根据基因中心论应能正常发育,但实际上在胚胎发育过程中常会出现各种异常,多数在出生前夭亡,少数生存的个体也可有多方面的改变,如克隆羊的体型可比正常羊大得多,还有诸多健康问题。表遗传学研究表明,这是由于未经过配子发生、受精和重编程等正常生物学过程,克隆胚胎存在基因组印记等一系列表遗传学异常的必然结果[2]。
同卵双生子具有完全相同的基因组,根据基因中心论应发育成完全相似的两个个体,然而其中约1/3的同卵双生子,20岁后可出现个性和疾病易感性等的差异,并且年龄、医疗和环境因素会影响这些差异。表遗传学研究表明,这些有差异的同卵双生子之间的基因组甲基化模式存在不同,测序发现52%的差别发生在重复区域,余下的多发生在基因启动子区,提示会对基因的表达产生影响。进一步芯片分析还表明,3岁的双生子间基因表达的特征基本保持一致,但在50岁的双生子间差别已很显著。看来同卵双生子之间的差异是在生长发育和生活过程中随体内外环境的不同表遗传学修饰差异积累的结果[7]。
近年来日益增多的证据表明,表遗传学机制调控发育过程。表遗传学研究调控发育遗传程序的实施,以及决定各种类型分化细胞表型的机制。从受精卵发育而来的成体具有各种类型的组织器官和分化细胞,它们具有相同的基因型,但有各别的细胞表型,每一种分化细胞的基因表达模式(pattern)称之为表基因型(epigenotype),这种表达模式是由表遗传学机制所决定,确保了特殊一组基因活化,而另一组基因被灭活,并通过表遗传学记忆,将各种类型细胞特有的表达状态在本谱系细胞间遗传,以维持各自的表达特征,从而确保了在世代交替中遗传性状在发育中的形成,尽管其中一些机制的细节仍需要进一步研究[12-14]。
肿瘤表遗传学是表遗传学中基础研究活跃、取得成果最多的领域,本文仅作简介,要详细了解临床应用与基础研究,可参阅即将出版的《肿瘤表遗传学》*:薛开先主编《肿瘤表遗传学》,科学出版社2011年出版。,要得知最新进展,可参阅参考文献[5,10,13,15]。
近50年来,体细胞突变理论已成为癌变的主流学说,并认为就本质而论肿瘤是一种遗传学疾病。这一理论认为,在癌变的多阶段过程,基因突变不断积累,当改变基因功能使细胞获得了生长优势,就可能发生细胞癌变。这里所说的基因突变是广义的,包括基因缺失和扩增,以及染色体结构和数量上的改变等;癌变主要涉及两类基因:一类是肿瘤抑制基因,它们抑制细胞的生长和存活:另一类为癌基因,它们能促进细胞的生长和生存。现已明确,癌变是一个多因素、多基因、多途径的复杂多阶段过程,癌细胞要获得充分的恶性表型并得以维持,必须有一组肿瘤抑制基因的灭活和原癌基因的活化,这是一个漫长的过程,这也为肿瘤的早期预防提供了机会。
随着肿瘤表遗传学研究的进展,2002年Esteller首先提出癌症是遗传学疾病,也是表遗传学疾病。目前多数肿瘤表遗传学研究者接受了这一观点。实际上在癌症发生的所有阶段都存在表遗传学异常改变,同样可引起肿瘤抑制基因的灭活和原癌基因的活化,还与肿瘤遗传学改变间存在相互作用,协同促进癌症的发生和演进。有研究表明,最早的表遗传学异常发生在癌症起动之前;不同于遗传学改变,表遗传学改变是逐步发生的,导致特定基因渐进沉默,成为某些癌症起动的关键事件;因此,从癌变过程机制而论,癌症也应是表遗传学[15]。
几乎每种类型的肿瘤都有一组癌相关基因的、特异性的甲基化模式,可作为肿瘤生物学标志,用于肿瘤的分子分型、早期诊断、随访和监测。在方法学上值得指出,检测基因启动子区的高甲基,是检出增益性信号,远比检出信号的丢失如等位基因杂合性丢失(LOH)、微卫星不稳定性(MSI)等更敏感和可靠;正基于此,这类方法能从癌和癌前组织排出到体液(血液、尿液和痰液等)的微量DNA中,检出特异性的异常甲基化改变。这类无创性表遗传学标志的检测在近几年倍受关注;近来又发现了肿瘤相关的、组蛋白修饰和染色重塑的改变,更扩大了表遗传学标志系统[15]。
3.2.1 监测有恶变倾向的高危个体 许多恶性肿瘤的演进过程中存在癌前病变,如能从中检出具有恶变倾向的个体,及早诊治,将会改善临床结果。例如,慢性溃疡性结肠炎(UC)患者大肠癌的发病率显著增加,尤其是有不典型增生者。应用MSP检测与细胞迁移、分化和癌变密切相关的E-钙粘蛋白基因(CDH1)启动子的异常甲基化的结果表明,在长期UC患者的不典型增生的活检标本中CDH1的高甲基化发生率高达93%,而无不典型增生者仅有6%。同时,应用免疫组化方法亦证明,在不典型增生标本中仅有低水平的E-钙粘蛋白,可见CDH1基因启动子的甲基化,提供了在UC患者中检出易患大肠癌高危个体的生物学标志。
3.2.2 早期诊断 早期发现肿瘤是提高癌症患者生存率的重要措施之一。应用癌相关基因的异常甲基化改变作为生物学标志,但值得注意的是,用肿瘤组织和血清标本来源的DNA几乎有相同的甲基化异常的检出率。例如最近在105例非小细胞肺癌的研究结果表明,在肺癌组织p16基因高甲基化检出率为79.3%,血清标本为73.3%,两者间符合率达87.7%,见于各期NSCLC,提示p16异常甲基化是NSCLC良好的早期诊断和随访的生物学标志。
3.2.3 分子亚型的分类 肿瘤的病理分型和临床分期是肿瘤处理中有用的一组参数,但临床实践也表明,同一病理类型和同一分期的肿瘤患者,对相似的临床治疗或有着截然不同的反应和预后,推测可能是不同个体肿瘤发生的分子途径不同的结果。如果能应用细胞、分子生物学等技术进一步区分出更接近本身遗传学特质的分子亚型,使治疗方案个体化,就有望进一步提高疗效和降低毒性反应,目前已取得进展。
3.2.4 预后 不同的癌变途径、不同癌相关基因的表遗传学灭活或活化可能影响癌细胞的恶性程度和对治疗的反应,最终可能改变癌症患者的预后。例如在55例周围型膀胱癌中检测了7种癌相关基因启动子的甲基化状态,其中O6-甲基鸟嘌呤-DNA甲基转移酶(MGMT)是DNA修复酶,能除去乌嘌呤上烷基加合物,因而成为对烷化剂抗癌药产生耐药性的主要因素,这样在脑神经胶质瘤对卡氮芥治疗时,MGMT基因甲基化患者组较未甲基化组的反应好,无瘤生存期较长。
3.2.5 治疗 在过去几十年依据体细胞突变理论指导肿瘤治疗研究,然而癌症死亡率的变化很小,故有作者寄希望于表遗传学治疗[16]。不同于遗传学改变,表遗传学改变是可逆的,因此逆转上述改变已成为肿瘤化学治疗的新策略。目前已积累了大量的研究,有的表遗传学药物已进入临床试验阶段,主要有如下几种类型:(1)DNA甲基化抑制剂:多为胞嘧啶5位修饰的类似物,如5-氮胞苷、5-氮2’-脱氧胞苷(decitabine)和假异胞苷等,其中以decitabine实验抑瘤效果较好,然而临床试验虽对白血病有一定的疗效,但毒性较大。(2)组蛋白去乙酰化酶抑制剂:包括短链脂肪酸等在内的多种化合物,它们能抑制体外肿瘤细胞或动物模型中瘤细胞的增殖,或诱导细胞分化和凋亡。(3)联合治疗:如联合应用甲基化抑制剂5-氮脱氧胞苷和去乙酰化酶抑制剂苯丁酸,在人肺癌细胞观察到明显的协同抗肿瘤效应;对乳腺癌细胞也存在相似的协同抗肿瘤效应。
20世纪90年代初我国已开始研究DNA甲基化状态改变与肿瘤发生的关系。1996年笔者在“人类遗传学概论”一书中首次将Epigenetic译成“表遗传”,并介绍了DNA甲基化在基因表达调节中的重要作用。进入21世纪,随着《Science》对表遗传学研究的系统评述,国内对这方面介绍和研究的增多,近几年来,表遗传学和肿瘤表遗传学的介绍和研究日益普及。
关于Epigenetics的中文译名,在本世纪初除表遗传学应用较普及,此外还有10余种,如表观遗传学[17]、外因遗传学[18]和发育遗传学等。2006 年国家名词委员会公布的“遗传学名词”中将epigenetics译成“表观遗传学”,但编委仍认为“名词审定工作难度很大…希望遗传学界同仁提出宝贵意见,使之日臻完善”[19]。确实如此,表遗传学在我国的发展尚属初期,对学科理论的理解尚待提高;另一方面,学科译名更应审慎,它涉及到一组合成词,好的译名应有助于对学科内涵的理解。下面从翻译的“信达雅”角度简要阐述。
从2001年看到《Science》的述评后,笔者认识到表遗传学研究对遗传学发展的战略意义,一直在收集、整理和体悟表遗传学的研究内涵和思考中文译名问题,在反复讨论中认识到,中文翻译应遵循“信、达、雅”的原则,这是清末思想家严复(1854-1921)在《天演论》(1897)“译例言”中提出的,历经100多年,现今仍受到包括季羡林先生在内的中国翻译界的推崇,认为是最简明、实用的翻译理论[20]。再结合自己多年来的实践体会,可以理解“信”为准确、忠实于原文;“达”为译文晓畅通达,能反映原文的内涵;“雅”为遣词造句得体,追求含蓄、典雅。
Epigenetics是由前缀“epi-”加“genetics”构成,目前中文译名较多的是表观遗传学和表遗传学。前缀“epi-”在陆谷逊主编的《英汉大词典》(第二版)中有8种含义,其中与医学生物学相关的含义主要有:(1)表示“在…上面”,如epiderm表皮;(2)表示“在…之外”,如epiblast外胚层;(3)表示“在…之后”,如epigenesis后成论,等等。在该词典的各种前缀“epi-”的含义中,无一有“表观”之含义。将Epigenetics译成“表遗传学”,我已著文详细说明符合Epigenetics的研究内涵:“研究没有DNA序列变化的、可遗传的基因表达或表型改变;表遗传信息贮存及其作用平台都在于原基因组结构的表面”;其中三个关键词是表达、表型和表面,根据汉语共素缩合构词法,“表”为共素,含义有外面、外表、外貌等,与英文前缀“epi-”接近,因此将epigenetics译成“表遗传学”不仅符合中、英文构词法,而且可基本了解该学科的研究内涵,可联想到它的定义和作用机制。相比较,表观遗传学的译名看来不够准确,直白而未能全面反映epigenetics的研究内涵。
科学发展需要突破,表遗传学研究方兴未艾,可以预期随着表遗传学研究的深入,会在更广的领域、更深的层次和更高的水平上取得进展,将为遗传学的发展作出应有的贡献。
[1]薛开先.表遗传学推动新一轮遗传学的发展[J].遗传,2005,27(1):155-159.
[2]薛开先.表遗传学研究内涵及中文译名问题[M]//张飞雄,李绍武.高等院校遗传学教学改革探索.北京:化学工业出版社,2011:367-373.
[3]陈竺,贺林,张伯勤.人类基因组计划与解码生命[M]//贺林.解码生命-人类基因组计划和后基因组计划.北京:科学出版社,2000:3-21.
[4]Dinger ME,Amaral PP,Mercer TR,et al.Pervasive transcription of the eukaryotic genome:functional indices and conceptual implications[J].Brief Funct Genomic Proteomic,2009,8(6):407-423.
[5]薛开先.非编码RNA[J].国际遗传学杂志,2010,33(2):125-129.
[6]Finer S,Holland ML,Nanty L,et al.The hunt for the epiallele[J].Environ Mol Mutagen,2011,52(1):1-11.
[7]Easton DF,Eeles RA.Genome-wide association studies in cancer[J].Hum Mol Genet,2008,17(R2):R109-115.
[8]Editorial.The human genome at ten[J].Nature,2010,464:649-650.
[9]薛开先.重视肿瘤表遗传学的研究[J].肿瘤,2003,23(3):169-170.
[10]薛开先.染色质组织化和组蛋白修饰[J].国际遗传学杂志,2009,32(4):316-320.
[11]Barros SP,Offenbacher S.Epigenetics:connecting environment and genotype to phenotype and disease[J].J Dent Res,2009,88(5):400-408.
[12]Blomen VA,Boonstra J.Stable transmission of reversible modifications:maintenance of epigenetic information through the cell cycle[J].Cell Mol Life Sci,2011,68(1):27-44.
[13]薛开先.表遗传学的发展和基本概念[J].国际遗传学杂志,2009,32(1):76-80.
[14]Ng RK,Gurdon JB.Epigenetic inheritance of cell differentiation status[J].Cell Cycle,2008,7(9):1173-1177.
[15]薛开先.肿瘤的表遗传学改变(1)[J].国际遗传学杂志,2011,34(1):76-80.
[16]López-Lázaro M.A new view of carcinogenesis and an alternative approach to cancer therapy[J].Mol Med,2010,16(3-4):144-153.
[17]赵寿元,乔守怡.现代遗传学[M].北京:高等教育出版社,2003:1-14.
[18]胡楷.外因遗传学及其重要意义[J].遗传,2002,24(6):734-738.
[19]第二届遗传学名词审定委员会.遗传学名词[M].第2版.北京:科学出版社,2006:1.
[20]曾冲明.再论严复的信达雅[EB/OL].http://www.360doc.com/content/10/0425/20/191 190_24859368.shtml.