董高超,刘 震,莫 朕,孙 林,王丽红,夏亚穆
(青岛科技大学化工学院,山东 青岛 266042)
基因组挖掘在天然产物研究中的应用进展
董高超,刘 震,莫 朕,孙 林,王丽红,夏亚穆*
(青岛科技大学化工学院,山东 青岛 266042)
基因组挖掘是通过对基因组进行测序,然后预测合成的天然产物,进而分离纯化新化合物的技术。基因组挖掘可以促进天然产物的研究,广泛应用于工农业、食品、医药等领域。着重介绍了基因组挖掘在微生物、植物、新药开发等方面的应用研究进展,并展望了基因组挖掘对天然产物研究的推动作用和应用前景。
基因组挖掘;天然产物;次生代谢产物;生物信息学
从自然界存在的生物体内分离、提取得到的有机化合物称为天然产物。天然产物与人类的生活息息相关,被用作工业催化剂、植物杀虫剂、食品添加剂等,另外,它也是人类药物的重要来源。据统计,临床上使用的大部分抗生素是天然产物或者天然产物衍生物[1]。然而,通过对生物次生代谢产物进行活性追踪从而分离得到天然产物的传统方法遇到了越来越多的挑战:由于无法得知活性物质的具体结构,导致所得天然产物很可能是为人所熟知的;由于有些生物体极少或者根本不产生某些天然产物,导致没有足够的化合物用于活性检测,从而限制了天然产物的研究进程[2]。
基因组挖掘是对编码天然产物的基因组进行测序,利用生物信息学预测可能产生的天然产物,然后根据所预测产物的理化性质,进一步对基因簇进行活化或者异源表达,最终分离并鉴定目的产物。该方法的目的性比较强,不受有机体体内的产物含量及目的基因是否表达等因素的影响,从而扩大了天然产物的研究范围。作者在此对基因组挖掘在微生物、植物、新药开发等几方面的应用研究进展进行了综述,并展望了基因组挖掘对天然产物研究的推动作用和应用前景。
1.1 在细菌方面的应用
细菌可以产生许多独特的活性化合物,被广泛用作抗菌药物、抗癌药物等。然而,近年来,从细菌中发现新型天然产物越来越困难,为了克服传统筛选方法的不足,研究者开发了一些新的寻找活性化合物的方法,基因组挖掘就是被广泛使用的方法之一。
陈亮宇等[3]对星海链霉菌进行基因组测序,然后用软件将该序列与已知结构功能的同源基因序列进行比对,通过分析信号位点特征、密码子使用偏好性等的相似性预测了4个聚酮合成酶类基因簇,利用生物信息学分析并预测出该基因簇具有抗活性补体的作用,并从其代谢产物中检测到了较强的抗补体活性。
Mcclerren等[4]使用BLAST对芽孢杆菌B.haloduransC-125进行基因组测序,挖掘出了一个非核糖体肽合成酶类化合物的基因簇,通过生物信息学分析推断了该化合物的结构及功能。生物活性分析表明,该化合物具有抗乳酸链球菌活性。
Gross等[5]将假单胞菌P.fluorescens基因序列与具有结构注释的已知基因序列进行比对,建立相似性特征模型,预测一个基因簇可能合成一种环脂肽。生物活性分析发现,该环脂肽具有抗白色假丝酵母活性。
目前,对链霉菌ATCC23877已经研究很多年,除了纺锤菌素和螺旋霉素,暂且还未发现其它有价值的天然产物。但Bunet等[6]通过基因组挖掘,从该菌株中发现了控制次生代谢产物合成的十几个基因簇和芳香族聚酮化合物kinamycins。
1.2 在真菌方面的应用
真菌产生的许多活性次生代谢产物(如生物碱类化合物、萜类化合物等)具有抗菌、抗癌等生物活性。真菌是生产新药的巨大宝库,仅头孢类药物就有30多种。对真菌的研究热点主要集中在新的抗肿瘤、抗菌等活性化合物的发现。
Robbel等[7]在红霉菌物种中选择一批基因组数据,并用软件分析基因组序列特征,建立统计学模型,然后利用这些模型对糖多孢红霉菌某些保守区的DNA序列的基因结构进行检测,发现了数十个可以控制次生代谢产物合成的基因簇,并对产物结构进行预测。通过同位素标记等方法发现了新型天然产物异羟肟酸型嗜铁素,该物质具有调节生命代谢过程的作用,可应用于生物防治、植物营养学、载体等方面。
König等[8]对烟曲霉的基因组进行测序,然后与其它已知结构功能的序列进行比对,寻找相似性区域以获得基因的天然产物编码区,进而推测基因结构及功能。发现烟曲霉体内的聚酮合酶类基因簇可以控制一种异戊烯化多酚的合成,该化合物可以对生物碱进行异戊烯基化,从而使异戊烯基化后的生物碱具有广泛的药理学活性,如抗有丝分裂及抗癌等。
植物抗逆性是指植物抵抗非生物因素(如干旱)和生物因素(如虫害)的能力,但由于其遗传复杂,提高植物抗逆性一直受到极大的限制。基因组挖掘技术的兴起对植物抗逆性的提高起到了重要作用,该技术通过挖掘新型的抗逆基因和阐述抗逆基因所产生的次生代谢产物在植物抗逆过程中所起到的调控作用,为农作物抗逆育种提供了广阔的前景。
樊龙江等[9]通过软件对普通野生稻保守区域的序列与同源物种的基因序列进行比对,分析相似性的区域及特征,并利用统计学模型发现了基因Pid3-A4与抗稻瘟病基因Pid3具有很高的相似性,从而预测Pid3-A4也是稻瘟病的抗病基因,Pid3-A4对稻瘟病菌的抗谱比Pid3更宽。
Devanna等[10]基于基因Pi54对药用野生稻进行等位基因挖掘,发现了Pi54of基因。功能学分析表明,Pi54of具有广谱的抗病性,通过基因重组技术将其植入水稻中,可提高水稻对病虫害的抗性。实践证明,挖掘抗病基因是防治生物胁迫的重要手段。
赵阳[11]通过BLAST建立玉米同源物种的统计学模型,通过该模型对玉米全基因组进行同源搜索,共鉴定了55个HD-Zip基因。通过干旱表达模式分析预测Zmhdz10基因具有抗逆作用。通过过量表达该基因发现其显著提高了植株耐旱和耐盐性,从而为改良作物的抗逆性提供了优良的基因资源。
刘丹[12]对小麦品种旱选10号进行了基因组测序,结合小麦D基因组数据库,通过软件ESTGenes预测出2个B″亚家族基因与植物抗逆性相关,通过分析逆境下的表达模式发现这2个基因参与了植物对逆境反应的调控网络,由其合成的蛋白磷酸酶可以提高小麦对渗透胁迫和冷害等非生物胁迫的耐受性。从而证明,挖掘抗逆基因并通过这些基因培育新品种是应对逆境胁迫、提高产量的有效途径。
谢莹[13]通过对强筋小麦郑麦366(A1)和弱筋小麦郑麦004(A2)的基因组序列进行比对,利用生物信息学的方法挖掘在强筋和弱筋材料中差异表达的基因,通过差异基因的过表达来分析该基因的功能,从而得到3个高品质基因。这3个基因可以参与AGPase的活动,而AGPase则可以控制淀粉的合成。该研究对改良小麦品质具有重要意义。
Beisson 等[14]通过对拟南芥基因组挖掘,发现了几百个控制油脂合成的基因,为改善拟南芥油脂含量提供了优良的基因资源。
成功研发一种新药,需要筛选几万种化合物,耗资数亿美元,高代价已成为新药研发的限制因素。利用基因组挖掘研发新药是指通过对基因组序列进行分析,筛选目标基因和进行基因表达,进而进行药效研究得到新药候选物,从而缩短新药开发周期及降低研究成本。北京大学人类疾病研究中心以人类功能基因组为基础建立了一系列人类功能基因组研究的新技术平台,通过该平台筛选和鉴定人类某些基因,发现了重组蛋白质药物PDCD5[15]和抗炎多肽新药CKLF1-C19[16]。
Scherlach等[17]用生物信息软件将构巢曲霉基因序列与结构功能已注释的已知序列进行比对,通过生物信息学分析预测基因的结构及其可能产生的化合物的结构和性质,最终发现了抗肿瘤剂异戊烯基喹啉-2-酮生物碱类物质aspoquinolones A-D。
Banskota等[18]对2种放线菌NRRL18422和Eco86进行测序,并对编码PKS的基因簇进行基因检测分析,最终预测了2个化合物的结构与性质,将预测的化合物进行分离和活性分析,发现一个化合物具有抗真菌活性,另一个化合物具有明显的抗革兰氏阳性致病菌活性,都有成为新药的潜力。随着基因组挖掘技术的发展,新药的研发也会迎来快速发展的时期。
目前,大量的天然产物还没有被人类发现,需要通过基因组挖掘等生物技术“挖掘”。基因组挖掘不仅能够发现新颖的天然产物及其同类化合物,而且还能发现它们的合成途径,从而提高从有机体中发现新天然产物的能力。
虽然基因组挖掘的潜力很大,但基因组挖掘在技术上和实用上仍有许多需要克服的难题,比如,用于基因操作和对目标化合物进行结构预测的工具比较匮乏、从复杂的提取物中分离纯化目标化合物的步骤较为繁琐。随着天然产物化学、分子生物学、基因组学、生物化学等学科及高通量基因组测序技术的快速发展,基因组挖掘将更加完善,新的次生代谢产物的研究将因此迎来快速发展的时代。
[1] van LANEN S G,SHEN B.Microbial genomics for the improvement of natural product discovery[J].Current Opinion in Microbiology,2006,9(3):252-260.
[2] 孙文,顾文杰,吴永英,等.基因组水平的基因挖掘与功能分析方法的探讨[J].生物信息学,2007,5(2):94-96.
[3] 陈亮宇,徐小娜,王玉梅,等.利用基因组挖掘技术研究星海链霉菌的生物合成潜能[C]//纪念中国微生物学会成立六十周年大会暨2012年中国微生物学会学术年会论文集,2012.
[4] MCCLERREN A L,COOPER L E,QUAN C,et al.Discovery andinvitrobiosynthesis of haloduracin,a two-component lantibiotic[J].Proceedings of the National Academy of Sciences of the United States of America,2006,103(46):17243-17248.
[5] GROSS H,STOCHWELL V O,HENKENLS M D,et al.The ge-nomisotopic approach:a systematic method to isolate products of orphan biosynthetic gene clusters[J].Chemsitry and Biology,2007,14(1):53-63.
[6] BUNET R,SONG L,MENDES M V,et al.Characterization and manipulation of the pathway-specific late regulator AlpW revealsStreptomycesambofaciensas a new producer of kinamycins[J].Journal of Bacteriology,2011,193(5):1142-1153.
[7] ROBBEL L,KNAPPE T A,LINNE U,et al.Erythrochelin-a hydroxamate-type siderophore predicted from the genome ofSaccharopolysporaerythraea[J].FEBS Journal,2010,277(3):663-676.
[8] KÖNIG C C,SCHERKACH K,SCHROECKH V,et al.Bacterium induces cryptic meroterpenoid pathway in the pathogenic fungusAspergillusfumigatus[J].ChemBioChem:A European Journal of Chemical Biology,2013,14(8):938-942.
[9] 樊龙江,郭兴益.从水稻基因组序列中挖掘生物信息[J].浙江大学学报(农业与生命科学版),2005,31(4):355-361.
[10] DEVANNA N B,VIJAYAN J,SHARMA T R.The blast resistance genePi54ofcloned fromOryzaofficinalisinteracts withAvr-Pi54 through its novel non-LRR domains[J].PLoS One,2014,9(8):e104840.
[11] 赵阳.玉米HD-Zip转录因子家族抗旱相关基因的鉴定及ZnYihdzlo功能分析[D].合肥:安徽农业大学,2013.
[12] 刘丹.小麦抗逆相关基因TaPP2AbB″-α/γ的克隆及功能分析[D].北京:中国农业科学院,2014.
[13] 谢莹.优质麦籽发育转录组构建及品质相关基因的挖掘[D].郑州:郑州大学,2014.
[14] BEISSON F,KOO A J K,RUUSKA S,et al.Arabidopsis genes involved in acyl lipid metabolism.a 2003 census of the candidates,a study of the distribution of expressed sequence tags in organs,and a web-based database[J].Plant Physiology,2003,132(2):681-697.
[15] 陈以乔,马晓莉.PDCD5基因与肿瘤关系的研究进展[J].国际儿科学杂志,2012,39(4):348-351.
[16] 王应,马大龙.抗炎多肽新药——CNKF1-C19的开发研究[C]//新型疫苗与抗体创制关键技术及质量控制研讨会论文集,2011.
[17] SCHERLACH K,HERTWECH C.Discovery of aspoquinolones A-D,prenylated quinoline-2-one alkaloids fromAspergillusnidulans,motivated by genome mining[J].Organic & Biomolecular Chemistry,2006,4(18):3517-3520.
[18] BANSKOTA A H,MCALOINE J B,SORENSEN D,et al.Isolation and identification of three new 5-alkenyl-3,3(2H)-furano-nes from twoStreptomycesspeciesusing a genomic screening approach[J].The Journal of Antibiotics,2006,59(3):168-176.
Application Progress of Genome Mining in Research of Natural Products
DONG Gao-chao,LIU Zhen,MO Zhen,SUN Lin,WANG Li-hong,XIA Ya-mu*
(CollegeofChemicalEngineering,QingdaoUniversityofScience&Technology,Qingdao266042,China)
Genomeminingisanewtechniquetoisolateandpurifyundetectedcompoundsbysequencingthegenomeandpredictingstructureofnaturalproducts.Genomeminingcanpromotetheresearchofnaturalproducts,anditiswidelyusedinindustryandagriculture,food,pharmaceuticalandotherfields.Inthisarticle,theapplicationandresearchprogressofgenomeminingonmicroorganism,plant,developmentofnewdrugareemphaticallyintroduced.Thepromotingeffectandapplicationprospectofgenomeminingonnaturalproductsresearchareprospected.
genomemining;naturalproduct;secondarymetabolite;bioinformatics
国家自然科学基金资助项目(21472105)
2016-09-28
董高超(1990-),男,山东临沂人,硕士研究生,研究方向:药物合成,E-mail:1831813632@qq.com;通讯作者:夏亚穆,博士,副教授,E-mail:xiayamu@126.com。
10.3969/j.issn.1672-5425.2017.02.003
Q 78
A
1672-5425(2017)02-0010-03
董高超,刘震,莫朕,等.基因组挖掘在天然产物研究中的应用进展[J].化学与生物工程,2017,34(2):10-12.