世界上第一部百科全书诞生在18世纪的法国,共有28卷,含7万多词条和近3000幅插图。当时编撰百科全书的著名法国学者狄德罗等人希望,这部书不仅要涵盖人类知识的全部,而且要以此来启蒙人类的思想向新文明迈进。同样,基因百科全书计划不仅要提供有关人类基因组知识的“百科全书”,而且要以此促进人类彻底和完整地认识自身和生命复杂性。
什么是基因?
1909年,丹麦遗传学家威廉·约翰森创造出了“基因”一词,用来描述一种可令子女遗传父母特质的机制。像他那个时代的其他生物学家一样,约翰森并不了解这个无形的因子是什么东西。
19世纪60年代,奥地利遗传学家孟德尔就提出了生物的性状是由遗传因子控制的观点。
20世纪初期,美国遗传学家摩尔根通过果蝇的遗传实验,认识到基因存在于染色体上,并且在染色体上是呈线性排列,从而得出了染色体是基因载体的结论。
20世纪50年代以后,随着分子遗传学的发展,尤其是英国剑桥大学生物学家沃森和克里克提出双螺旋结构以后,人们才真正认识了基因的本质,即基因是具有遗传效应的DNA片断,是遗传的基本单位。
基因百科全书计划
20世纪70年代至20世纪90年代,科学家们发现了大量非编码的DNA片段存在于蛋白质编码区域,人类基因组中2.1万个蛋白质编码基因只占了整个基因组的1.2%,那么,其余98.8%的基因是做什么的?
1972年,日本遗传学家给这些不能编码蛋白质的DNA片段起了个名字,叫做“垃圾DNA”。而DNA的发现者弗朗西斯·克里克在1980年发表的论文中将这种DNA称为“终极寄生虫”。
但是随着时间的推移,越来越多的科学家认识到,这些垃圾DNA并非垃圾,它们担负着自身的使命。
于是,在2003年9月,美国科学家提出了一个“基因百科全书”研究计划,希望找出人类基因组序列中所有的结构和功能元件,形成一个完整的人类基因组的“元件目录”。
2004年10月,国际人类基因组测序联合体在《自然》周刊上发表了人类基因组常染色质全序列测定的论文,宣布人类基因组的常染色质部分中99%的序列已经被测定。
人类基因组具有许多不同种类的结构和功能元件,这些元件涉及DNA代谢和染色体构成的各个方面。显然,要想实现“基因百科全书”计划拟定的科学目标,需要尽可能地采用和整合现有的各种研究手段。
因此,“基因百科全书”计划具有一个与以往生命科学计划不同的特点,即向所有对该项目有兴趣的学术机构、政府部门和私人公司的研究者开放。
“基因百科全书”计划的项目介绍也写出,此计划不仅要提供有关人类基因组知识的“百科全书”,而且要以此促进人类彻底和完整地认识自身和生命的复杂性。
终于,在2007年,“基因百科全书”计划的团队成员在《自然》等学术刊物发表了几十篇相关论文,报道了他们的第一批研究成果。他们建立了一个目录,详细描述了人类基因组中百分之一的功能元件,被有关科学家认为是人类生物学上的一个里程碑。
2011年,该计划又发布了“小鼠基因百科全书”的第一批数据,作为人类基因百科全书项目的补充研究。这也宣告着,最终写就人类基因百科全书指日可待。
小卡片:
人类有23对染色体、30亿个碱基对(即形成DNA的化学结构),也就是说人类基因组序列中的30亿个字母都已被拼写出来,下一个目标就是定位或识别其中有意义的部分。