王 宇,杨文丽,李嘉钰,向雪静,李月萍,蔡佳丽
(1.攀枝花学院附属医院,四川 攀枝花617000;2.攀枝花学院医学院,四川攀枝花617000)
白芨是多年生草本植物,属于兰科白芨属。主要分布在云南、四川、贵州、湖南、湖北、江西等省,多生长在海拔高度为950-3500 m的阔叶林下。白芨及其块茎是我国药典记录的传统中药材之一,最早在《神农本草经》中就有记载,其块茎中含有较丰富的苄类、萜类和多糖类化学成分,具有止血润肺、消肿生肌、抗氧化、清除自由基、预防心血管疾病、抗菌和抗肿瘤等功效,在医药食品等领域已广泛应用[1-4]。
目前,通过构建cDNA文库和高通量转录组测序,已对多种药用植物进行分子生物学研究,挖掘出了一些重要功能基因,对于揭示不同生物学性状的分子机制具有重要意义[5]。
本研究采用高通量测序技术对白芨块茎进行转录组分析,得到白芨的重要功能基因,对其进行功能注释、分类和代谢通路分析,这为下一步研究白芨的药用成分、次生代谢等机制奠定基础。
1.1.1实验材料
植株由攀枝花市丰盛源农林开发有限公司提供。
1.1.2主要仪器与试剂
凝胶成像系统和电泳仪购于美国伯乐公司、超微量核酸分析仪购于杭州奥盛仪器有限公司、RNA提取试剂盒购于天根生化科技有限公司。
1.2.1RNA提取
按照RNA提取试剂盒说明提取总RNA,使用凝胶电泳和超微量核酸分析仪对其质量和浓度进行分析。
1.2.2cDNA文库的构建
首先用磁珠富集poly(A)mRNA,然后以mRNA为模板,经逆转录反应合成第一链cDNA和第二链cDNA,对双链cDNA进行纯化后再进行末端修复、加尾和加接头,片段分选以及PCR扩增,最后构建成cDNA文库,对文库质检后进行测序。
1.2.3生物信息学分析
对测序得到的原始数据用生物信息学软件进行处理,得到有效数据(Unigene序列),再将获得的Unigene序列与SwissProt、Nr、GO、KEGG和COG数据库进行比对,获得功能注释,推测基因的功能与作用。
测序得到5624755条序列,经过组装得到130721条Unigene,N50长度为1490 bp,最短序列长度为201 bp,最长序列长15579 bp,平均长度为802 bp。在130721条Unigene中,76239条在200-500bp之间,占58.32%;21645条在500-1000 bp之间,占16.56%;11919条在1000-1500bp之间,占9.12%;8234条在1500-2000 bp之间,占6.30%;12683条大于2000bp,占9.70%(图1)。
图1 Unigene不同长度区间分布
图2 Unigene在各数据库注释分布
将130721条Unigene序列通过NR、COG、Swissprot、KEGG等数据库进行比对,60827条Unigene获得注释。60033条Unigene在NR数据库中获得注释,占45.92%,30267条Unigene在COG数据库中获得注释,占23.15%;39368条在Swissprot数据库中获得注释,占30.12%;8252条在KEGG数据库中获得注释,占6.31%,见图2。
25820条Unigene得到GO功能注释,共分为54个小类,其中生物进程、有19个小类,主要有:信号转导、细胞调控、细胞自噬、生物调控、刺激反应、繁殖进程等;分子功能有22个小类,主要有:结构分子活性、运输活性、催化活性、营养储存活性、抗氧化活性、与蛋白质结合的转录因子活性、分子功能调控等;细胞组分有13个小类,主要有:细胞膜、突触部分、细胞外基质、大分子复合体等。
COG数据库是由NCBI创建并维护的蛋白数据库,通过比较大量生物的蛋白质序列对基因产物进行同源分类。将Unigene通过COG数据库后进行分类,可以分为RNA加工和修饰、细胞周期控制、防御机制等不同功能,详见图3。
图3 Unigene的COG功能分类
30267条Unigene得到GO功能注释,可分为26类;其中参与“一般功能预测”(General function prediction only)的转录物最多,有4286个,占 14.16%;第二为参与“信号传导机制”(Siganl transduction mechanisms)的转录物,有3733个,比例为12.33%。此外,还包括核酸运输代谢、RNA组装修饰、糖类运输代谢、辅酶运输代谢、脂类运输代谢、能量生产转化等多数生理生化过程。
KEGG代谢途径分析表明,1916条Unigene参与了葡萄糖、果糖、半乳糖等多种糖类代谢,1320条Unigene参与了多种氨基酸代谢;185条Unigene参与了萜类和酮类化合物的代谢,此外,参与脂类、核酸、能量等代谢类型的Unigene有9194条;1147条Unigene参与了各种细胞和组织系统(如运输与分解代谢)进程,4259条Unigene参与了遗传物质(如折叠、分类和降解)和环境信息(如信号转导)的处理和加工过程。
白芨胶质的主要成分为白芨多糖,以葡萄糖和甘露聚糖为主,找到相关合成的酶基因,有利于阐明白芨胶质多糖的生物合成与分解途径。本研究发现了有关白芨多糖合成的多个酶基因,如β-葡萄糖苷酶、β-葡糖醛酸基转移酶、α-甘露糖苷酶、磷酸异构酶、6-磷酸果糖激酶等,这些酶基因都参与了糖代谢途径。
微卫星DNA序列就是简单重复序列,广泛分布于真核生物的基因中,可以作为优良的遗传标记。在白芨中发现39585个星位点,以单核苷酸、双核苷酸和三核苷酸三种类型为主,单核苷酸的基序为A/T/C,二核苷酸基序为AT/AG/CT,三核苷酸的基序为TTC/ATC/CGG。
白芨块茎含有丰富的多糖,具有诱导免疫调节因子表达、增强天然杀伤性细胞活性等免疫功能,因此可以开发为抗肿瘤药物或者化妆品添加物[6]。此外,白芨块茎中含有萜类、甾类以及联苄类物质,研究表明白芨萜类及其衍生物具有抗血管生成,诱导血管内皮细胞凋亡的作用。目前,将白芨的化学成分和药理研究结合起来,对研制新药具有广阔的应用前景[7]。
本研究通过对白芨的转录组进行分析,找到了大量参与白芨多糖和萜类合成与代谢相关的基因,这为研究白芨的药用成分、次生代谢具有重要意义。同时,通过对微卫星DNA序列分析可为白芨的遗传多样性和分子标记辅助育种奠定基础。