冉浩
1953年,沃森和克里克证明了DNA分子具有双螺旋结构,而后,DNA分子作为细胞生物遗传物质的结论也被证实。1957年,克里克又提出了中心法则,阐述了DNA如何控制着生物体内蛋白质的合成。
人们终于了解到,基因是DNA分子上蕴含着遗传信息的片段,对应着一定的生物功能。每一个生物的生长发育和行为虽然受到环境的影响,但同时也由基因所蕴含的信息决定。这些信息由DNA分子中四种特殊的碱基结构——A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)——的排列顺序所编码。
把DNA中碱基的排列顺序读取出来,是解读生物遗传信息的第—步,也被称为测序。从20世纪70年代开始,人们开发出了第一代测序技术,并以此为基础,在80年代提出了堪比登月计划的“人类基因组计划”,致力于获取人类DNA中的全部碱基排列顺序。1990年,由美国、英国、法国、德国、日本和中国等6个國家参与的“人类基因组计划”正式启动,到21世纪初,项目完成。
在这个过程中,基因测序技术经历了迭代发展,第三代高通量测序技术已经开始成为主流,过去几年才能完成的工作,今天可以在极短的时间内完成。借助超级计算机和大数据技术,基于全基因组的分析也已经成为可能。2014年,在由张国捷教授等领衔,全球200余位鸟类学家共同参与的一个项目中,通过对48种鸟类的全基因组分析,我们获得了迄今为止最可靠的鸟类演化谱系。