李方
“基因组”(genome)是指一种生物的全套基因和染色体。“基因组学”(genomics)一词由Thomas Roderick 在1986年提出。目前基因组学存在两个分支,一个是结构基因组学,以构建生物的遗传图谱、物理图谱和转录图谱及其全序列测序为主要目标;另一个是功能基因组学,利用结构基因组学研究获得的大量数据与信息评价基因功能,包括生化功能、细胞功能、发育功能、适应功能等,其主要手段结合了高通量、大规模的实验方法、统计和计算机分析技术。1995年,生物学家提出“后基因组学”的概念,即在基因组静态的作图、碱基序列分析基础上转入对基因组动态的生物学功能研究,亦称“功能基因组学”。植物基因功能研究起步相对较晚,但发展迅速。
一、植物功能基因研究的概念
功能基因组学研究的最终目标是解析所有基因的功能,即从基因水平上大规模批量鉴定基因的功能,进而全面研究控制植物生长发育及响应环境变化的遗传机制,在基因组序列与细胞学行为之间架起桥梁,使其共同承担起从整体水平上解析生命现象的重任。植物功能基因组研究是利用植物全基因组序列的信息,通过发展和应用系统基因组水平的实验方法来研究和鉴别基因组序列的作用,研究基因组结构和组织与植物功能在细胞、有机体和进化上的关系以及基因与基因间的调控关系。植物功能基因组学是植物后基因时代研究的核心内容,它强调发展和应用整体的实验方法分析基因组序列信息、阐明基因功能,其基本策略是从研究单一基因或蛋白质上升到从系统角度研究所有基因或蛋白质。植物功能基因组的研究方法有T-DNA标签法、转座子标签法、反义RNA技术的基因破除、基因陷阱和化学诱变的新发展—TILLING技术,其中,T-DNA标签法是应用最为广泛的研究手段。
二、植物功能基因组研究内容
(一)植物基因组的大规模测序
植物基因组的大规模测序是深入进行基因组研究的前提,其提供了数据和信息支撑。如模式植物拟南芥和水稻基因组测序的完成,公共数据库中已经积累了大量基因序列信息,获得了许多与植物发育相关的功能基因。鉴定和发现表达基因最快的途径是确定cDNA的部分序列(即EST)。这种方法主要是通过对随机挑选的cDNA克隆进行一端或两端长为300~500 bp的测序,这种序列在大多数情况下已足够用于确认对应的基因。
(二)植物基因功能研究
基因的主要功能包括:生物化学功能,如作为蛋白质激酶对特异的蛋白质进行磷酸化修饰;细胞学功能,如参与细胞间和细胞内的信号传递;发育上的功能,如参与形态建成等。研究发现,高等植物中约54%的基因与已知功能基因的序列有相似性。目前,获得一段DNA序列的功能信息的最简单的方法是将该DNA序列与GeneBank中公布的基因序列进行同源性比较,如利用BLASTn和BLASTx两种软件分别进行核苷酸和氨基酸序列同源性比较等。进行功能基因网络的构建是基因功能研究的难点和热点。功能基因网络是指网络中的2个基因相互关联以行使相同的功能,即如果2个基因处于同一生物学过程或者通路,代表这2个基因网络中的2个节点在网络中是相互连接的。
(三)植物蛋白质组研究
基因功能的实现最终是以蛋白质形式体现的,今后生命科学的重点将是在蛋白质组水平上揭示生命现象的本质和活动规律。蛋白质组是指一种基因组、一种生物或一种细胞、组织在精确控制其环境条件下,特定时刻所表达的全套蛋白质。当今,蛋白质研究技术正在不断发展。蛋白质组研究技术主要有:用于蛋白质分离的双向凝胶电泳技术(2D-PAGE)、用于蛋白质鉴定的Edman降解法测N端序列技术、质谱技术、用于蛋白质相互作用的酵母双杂交系统、蛋白质芯片等。
(四)生物技术信息研究
生物信息学是以计算机为工具,用数理及信息科学的理论和方法研究生命的现象,对生物信息进行储存、检索和分析的一门新兴交叉学科,由数据库、计算机网络和应用软件三大部分组成。通过搜索、分析、比较大量的基因和蛋白质序列数据,建立理论模型,进行基因结构的鉴定、分子设计、蛋白质空间模拟和预测、蛋白质结构与功能关系的研究。对日益增长的DNA和蛋白质的序列结构进行收集、整理、储存、发布、提取、加工、分析和发现各DNA片段的功能。同时,在发现了新基因信息之后,了解基因表达的调控机理,根据生物分子在基因调控中的作用,描述生物体生理生化反应的内在规律。
三、展望
植物基因組的研究深度和广度是随着相关研究技术的创新和发展而不断加深和扩展的,所以在功能基因组研究过程中,在完善现有研究手段和技术的同时,还必须发展一些新的基因功能研究技术,加强国际间的学术交流,建立全球共享的植物基因组数据库系统,以最终阐明植物基因组的结构和功能。单独运用一种技术已经很难满足真正获知基因功能的要求,只有将多种技术有机融合起来,取长补短,采用生物技术对植物进行高效、安全的遗传改良才能使真正获知基因功能成为可能。