郭起荣 张 莹 冉 洪 廉 超 胡 陶 冯 云
(国际竹藤中心 国家林业局竹藤科学与技术重点实验室 北京100102)
竹子基因调查分析报告
郭起荣张莹冉洪廉超胡陶冯云
(国际竹藤中心 国家林业局竹藤科学与技术重点实验室 北京100102)
竹子作为一种重要经济植物,具有经济、生态和文化价值。随着生物技术的快速发展,越来越多的以竹类植物为对象的基因序列得到克隆与验证,基于BPG(2012)更新系统,截至2014年底,已经有3 913个竹子基因得到确证,这些基因覆盖了竹亚科的3个族,隶属19个属30个种。文章统计分析了已确认的基因描述、基因类型和参考序列情况,展望了竹子基因发展态势。
竹种;BPG;基因;全基因组测序;基因参考序列
竹子属于禾本科(Poaceae/ Gramineae)竹亚科(Bambusoideae)植物,是禾本科植物中最大的类群,主要分布在热带和亚热带地区,少数种类分布于温带和寒带[1]。竹类植物是地球陆地生态系统的重要组成部分,具有生长快、产量高、用途广、一次造林可以永续利用的特性,是经济效益和生态效益良好结合的林种,在林业经济和产业结构中占有重要地位,被公认为 21 世纪世界上最重要的植物资源之一[2]。世界竹林面积2 200 万hm2[3],我国有竹林面积601 万hm2,占森林资源总面积的3%以上,占世界竹林总面积的1/3[4]。
基因是指携有遗传信息的DNA序列,是控制性状的基本遗传单位,功能性的DNA片段具有遗传效应,控制着生物性状的结构和功能。竹子系统发育研究小组(BPG)2012年更新的一份清单[5]显示,世界竹亚科有3个族:青篱竹族(Arundinarieae)、
竹族(Bambuseae)和莪利竹族(Olyreae)。结合竹子分类学最新进展[6-9],并遵循“国际植物命名法规”,研究认为世界发现的竹类物种数量已超过1 500种。
众所周知,世界最权威的3大核酸序列(DNA)数据库为:美国国家生物技术信息中心(NCBI)的GenBank、欧洲分子生物学实验室(EMBL)的DNA数据库和日本的DNA数据库(DDBJ)。3个数据库间每日都相互交换、更新数据,从而保证了数据的最新性。
截至2014年年底,NCBI中已提交的竹亚科基因数3 913个,占禾本科已提交基因数的1.8%,BEP支系(BEP clade)的4%,基因号(GeneID)8223103是NCBI中的第1个竹子基因记录,于2009年7月10日由中国台湾的中央研究院林崇熙研究组登录(表1)。竹子基因在3个竹族中均有发现,其中青篱竹属(537个)、刚竹属(524 个)、箭竹属(390个)、 竹属(390个)和箬竹属(259个),占已发现基因数的54%。
表1 竹种基因在竹族中的分布
已提交的3 913个竹子基因,是以竹子叶绿体、质体等采用同源比对、基因克隆等方法,从30个竹种(隶属于19个属)中发掘出来的(表2)。
值得一提的是,只有我国特产的贡山竹属(1种)和美洲特产的青篱竹属(3种)2个属内的全部竹种均有基因登记。而且,在1 500多个竹种中,NCBI中注册基因数量最多的是阿巴拉契亚青篱竹(137个),其次为青篱竹(136个);我国全基因组草图已公布的毛竹登录的基因为131个,分子生物学研究较多的麻竹、慈竹、绿竹、孝顺竹、早园竹等并非是登录基因较多的竹种。
NCBI提供了每一个登录基因的描述。调查发现(表3),涉及竹子核糖体、叶绿体的基因是研究的热点之一。其中,与转运RNA有关的基因描述最多,为1 167个,占总基因数的30%。
核糖体是细胞内蛋白质合成的“反应中心”,核糖体RNA(240个)和核糖体蛋白(785个),涉及4.5S rRNA、5S rRNA、16S rRNA和23S rRNA等。光合系统蛋白基因已经登录903个,包括光系统I、光系统Ⅱ、细胞色素、组装、辅基、脱辅基等蛋白、羧化/加氧酶、囊膜、反应中心等亚基的相关基因。呼吸酶包括ATP合酶、NADH脱氢酶等。对于竹子的BaolC_t001Psal、NdhH、InfA、PetN等单个基因,是通过同源比对的方法在绿竹中获得的。
基因类型指示基因属性,包括tRNA、rRNA、snRNA、scRNA、snoRNA、miscRNA、ncRNA、编码蛋白、假定基因、其他和未知等类型。将3 913个竹子基因根据基因属性分为了5个类型,分别为:编码蛋白基因,2 490个,占63.6%;tRNA类型,1167个,占29.8%;rRNA类型,240个,占6.1%;假定基因15个,其他基因(BaolC_t001)1个。
表2 各竹种公开的基因数
表3 已登录的竹子基因描述
NCBI中的参考序列(RefSeq)数据库提供了校正的序列数据和相关信息,为中心法则中从染色体→mRNA→蛋白的分子研究提供参考序列标准,同时也为突变分析、基因表达研究和多态性发现提供了一个稳定的参考点。参考序列数据库是一个参考序列的非冗余集合,包括构建的基因组contig、mRNA、蛋白以及整个染色体。参考序列记录有3种状态:临时基因、预测基因和复查基因。其中,竹子基因状态标注为临时的达2 490个。
近年来,国内外科学工作者克隆了大量竹子基因序列,可以查询到的竹子核苷酸数据达21 126 条。但是,从拿到基因核苷酸序列到确定完整的基因全长(结构与功能)还有好几道坎,再加上竹子开花结实少等原因,限制了包括其系统发育、遗传学等方面的研究。
2013年初,毛竹全基因组测序成果发布,开启了竹类全基因组解码先河,采用基因预测建模确定了31 987 个基因[10],利用毛竹全基因组数据已进行GO功能注释的基因数达3 946 个[11]。据悉,桂竹(Phyllostachys Bambusoideae)、紫竹(Phyllostachys nigra)、麻竹等竹种的全基因组测序工作正在进行中,竹子基因数量、功能即将得到更深刻理解。
随着分子技术的迅猛发展,科技工作者已经可充分利用组学(基因组、转录组、蛋白组、代谢组等)的研究成果,结合传统的基因发掘手段(包括准确的表型鉴定和遗传分析技术)来发现丰富的竹种资源中蕴藏着的有重要价值的基因,不断丰富着竹子基因。
[1]江泽慧.世界竹藤[M].沈阳:辽宁科学技术出版社, 2002: 3.
[2]周芳纯.竹林培育学[M].北京:中国林业出版社, 1998: 1.
[3]Lobovikov M, Ball L, Guardia M, et al. World bamboo resources: a thematic study prepared in the framework of the Global Forest Resources Assessment 2005[M]. FAO, 2007.
[4]国家林业局.中国森林资源报告(2009-2013)[M]. 北京:中国林业出版社, 2014.
[5]Bamboo Phylogeny Group. An updated tribal and subtribal classification of the bamboos (Poaceae: Bambusoideae)[C]// Gielis J, Geert P. Proceedings of the 9th World Bamboo Congress. Antwerp, Belgium: World Bamboo Organization, 2012: 3-27.
[6]李德铢,杨红梅,张玉霄.《中国植物志》(英文版)竹亚科青篱竹属和新小竹属的修订(英文)[J].植物分类与资源学报, 2013, 35(5): 605-612.
[7]Yang J B, Yang H Q, Li D Z, et al. Phylogeny of bambusa and its allies (Poaceae: Bambusoideae) inferred from nuclear GBSSI gene and plastid psbA-trnH, rpl32-trnL and rps16 intron DNA sequences[J]. Taxon, 2010, 59(4): 1102-1110.
[8]杨林,易同培.我国云南西北部箭竹属一新种和井冈寒竹的中文名称[J].四川林业科技, 2013(2): 48-51.
[9]杨林,易同培.云南高黎贡山西坡玉山竹属二新种[J].植物研究, 2014, 34(1): 1-5.
[10]Peng Z, Lu Y, Li L, et al. The draft genome of the fastgrowing non-timber forest species moso bamboo (Phyllostachys heterocycla)[J]. Nature Genetics, 2013, 45(4): 456-461.
[11]Zhao H, Peng Z, Jiang Z, et al. BambooGDB: a bamboo genome database with functional annotation and an analysis platform[J]. Database, 2014, bau006. doi: 10.1093/database/bau006.
Gene Analysis Report for Bamboo
Guo QirongZhang YingRan HongLian ChaoHu TaoFeng Yun
(International Center for Bamboo and Rattan; Key Laboratory of Bamboo and Rattan Science and Technology, State Forestrey Administration, Beijing 100102 China)
Bambusoideae has important economic,ecological and cultural values as an important economic plant. With the rapid development of biotechnology, more and more bamboo gene sequences have been cloned and verified based on the Bamboo Phylogeny Group (2012) system. By the end of 2014, 3 913 bamboo genes had been confirmed, which all cover 3 tribes, 19 genera and 30 species of bambusoideae. The paper made statistical analysis of gene description, gene types and reference sequence of the confirmed genes, and finally prospected the development trend of bamboo genes.
bamboo species, bamboo phylogeny group (BPG), gene, whole genome sequencing, gene reference sequence
10.13640/j.cnki.wbr.2015.02.003
国家自然科学基金项目(31370631);国际竹藤中心基金项目(1632013008)。
郭起荣(1968-),男,博导,教授,主要从事竹子种质资源研究。E-mail:RGUO@icbr.ac.cn。