黄 敏,钟民涛
(大连医科大学微生物学教研室,辽宁大连 116044)
香菇(Lentinula edodes),是侧耳科(Pleurotaccae)香菇属的担子菌,是全球人工种植最为普遍的食用菌[1]。近几十年来国内外的研究者对多种食用真菌进行了深入的研究,发现食用真菌在预防、治疗恶性肿瘤方面都具有重要的药用价值。香菇作为主要药用真菌具有健脾开胃、解毒化痰、提高免疫、抑制肿瘤发生发展等作用[2]。大量的临床病例证明,香菇多糖制剂在间接抑制杀伤肿瘤细胞,改善症状体征,减轻不良反应等方面都确实有效,因此香菇多糖制剂现已正式作为辅助化疗药物应用于临床[3-5]。然而,对香菇中蛋白质生物学活性的研究以及从蛋白质水平去发掘其抗肿瘤活性的本质却鲜有报道。我课题组多年来致力于香菇药用价值的研究,发现香菇除多糖外还含有其他抗肿瘤成分:首次从多株香菇菌种中筛选得到1株香菇菌丝体的发酵液具有直接抗肿瘤、抗细菌作用[6-7],因该菌株于1991年3月开始研究,故命名为C91-3,“C”代表“中国,China”。而后对该菌株发酵液进行了一系列后续研究证明:香菇C91-3发酵液粗蛋白能够直接杀死多种肿瘤细胞,大大延长荷瘤动物的生存期且显著改善其生存状态,并发现其机制与诱导肿瘤细胞0凋亡有关[8-9]。目前研究热点表明,寻找活性蛋白的编码基因,克隆、表达及工业化生产抗新型肿瘤活性药物显得尤为重要。
目前,由于香菇基因组及转录组数据的缺乏,给香菇活性蛋白从基因水平上的研究带来了困难。虽然NCBI网站在2006年就已经登记了香港大学正在进行香菇L-54菌株的基因组的测序工作,但至今仍然没有发布香菇基因组。基因表达序列标签(expressed sequence tags,EST)技术被认为是一种研究转录组的有效方法,已广泛应用于新基因发现、基因表达分析和蛋白质组学[10-12]。目前香菇EST在GenBank中已有26 541条(截止4月23日,2012),但大都没有任何的相关功能注释,并且这些EST数据都是通过传统Sanger测序方法获得的。尽管香港大学的Chum等[13]在2011年采用大规模cDNA的焦磷酸测序和Long-SAGE(Long Serial analysis of gene expression,SAGE)测序组合技术获得了一些转录组序列,但仅限于在香菇子实体育种方面的研究,所以现有的数据尚不足以挖掘香菇的功能基因。
随着基因组测序技术的不断发展,越来越多的微生物基因组测序工作的完成,使基因的研究速度突飞猛进。随着后基因组的兴起,“组学”的方面研究成为日益研究的热点。如转录组学,蛋白组学及代谢组学等。转录组是指特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的总和,其中主要包括mRNAs,非编码RNA(non-coding RNAs,ncRNAs)和小RNA(small RNAs)。研究转录组对于解释基因组的功能单位,解释细胞和组织的分子成分,以及对于了解机体发育过程和疾病发生过程都是必要的。转录组研究是基因功能及结构研究的基础和出发点,整个转录组分析的主要目标:对所有的转录产物进行分类;确定基因的转录结构,如其起始位点,5'和3'末端,剪接模式和其他转录后修饰;并量化各转录本在发育过程中和不同条件下(如生理/病理)表达水平的变化[14-15]。而整个转录组学研究是以测序技术的平台为基础。Sanger测序作为第一代的DNA测序方法应用的30多年来,对现代生物学研究起到了极大的促进作用。然而随着大规模基因组学的兴起,多种高通量低成本的测序技术应运而生,并逐步被应用到生物学研究的各个领域。目前,新一代测序技术(Next-generation Sequencing,NGS)核心思想是边合成边测序,即通过捕捉新合成的末端的标记来确定DNA的序列,近年来已经发展为主流的测序技术,而且有助于人们以更低廉的价格,更全面、更深入地分析基因组、转录组及蛋白质之间交互作用组的各项数据,这是Sanger测序无可比拟的。
新一代测序又称作深度测序或高通量测序,是相对于传统的Sanger测序而言,主要特点是测序通量高,测序时间和成本显著下降。目前主要以Illumina公司的Solexa技术、ABI公司的SOLID技术和Roche公司的454技术为主要测序平台。各平台测序原理及技术特点比较见表1。
表1 主要高通量测序平台的比较Table1 The comparison of major high-throughput sequencing technology
Solexa测序技术平台是以单分子阵列原位扩增测序技术为核心的Illumina公司Solexa基因组分析仪(Illumina Solexa Genome Analyzer),通过Solexa高通量测序技术进行转录组研究,可以大大降低测序所需时间和成本,并且可以获得海量的数据,是目前使用最广泛的新一代测序平台,其特点为测序通量高;准确率≥98.5%,有效地解决了多聚重复序列的读取问题;成本低于传统Sanger测序技术的1%;可以进行Pair-end(PE)双向测序。2008年以来,利用该技术开展的研究大幅度上升,报道文献达400多篇(http://www.Illumina.com/systems/)。
Solexa测序原理是首先将细胞中的所有转录产物反转录为cDNA文库,然后将cDNA文库中的DNA随机剪切为小片段(或先将RNA片段化后再反转录),在cDNA两端加上接头再利用Solexa的Genome Analyzer测序仪进行双末端(pairend)测序,将获得reads进行拼接,将拼接后最终所得序列通过比对到参考基因组获得该细胞的转录组信息,如酿酒酵母、拟南芥等转录组已成功采用Solexa测序技术获得[16-17],并在酿酒酵母中发现了487个新转录本,其中有一半用芯片技术没有鉴定出来的[18];若无参考基因组,则进行从头组装(de novo assembling)获得的Unigene比对到各大基因及相关数据库,根据序列同源性获得该物种的转录组信息,如白粉虱转录组的获得[19]。
采用Solexa高通量测序技术首先应用到香菇C91-3转录组的研究中,对香菇C91-3转录组进行测序和从头组装(de novo),并应用生物信息学方法对所得序列与多个蛋白数据库(nr、Swiss-Prot、KEGG和COG)进行比对解析,试图从功能基因组水平上研究香菇重要基因的表达。测序后获得75 bp的reads数为57 998 508个,各项质量统计均说明测序质量良好。经从有组装组装后获得Unigene数为28 923条,平均长度689 bp,具有编码框的Unigene有18 120条。另外,测序随机性结果表示所有reads随机的覆盖了Unigene的从5'到3'端的全长,说明测序覆盖度与深度良好。转录组数据后续分析结果中GO功能分类显示:共有2 853条Unigene分布到38个子功能分类中,可从宏观上认识该物种的基因功能分布特征;在COG数据库中预测有6 203条Unigene分布于25种功能分类中;KEGG的pathway分析结果显示,所获得unigene分布于各种pathway中,相当数量的功能基因同时参与到一种或几种人类疾病与生命活动中[20]。
香菇C91-3大量的Unigene基因序列及其功能注释信息的发现填补了香菇转录组的空白,并为从功能基因组水平上研究香菇活性蛋白的表达及其生物学功能的研究提供了基础数据。
现已证实香菇C91-3菌株发酵液粗提蛋白(LFP91-3)抗肿瘤作用是诱导肿瘤细胞凋亡,其机制可能与调控细胞周期有关[21]。所以以此为依据,首先筛选挖掘香菇C91-3菌株转录组Unigene的功能注释中与细胞周期调控或细胞凋亡相关的功能基因,初步筛选出17个与细胞凋亡相关的功能基因的原始核苷酸序列及对应的翻译后的蛋白质序列。为了形成自主的知识产权,将香菇转录组的基因命名,并已被GenBank接收,为Latcripin。源于香菇为真核生物,在真核表达系统中,选择pPIC9K为表达载体,使其在毕赤酵母(Pichia pastoris)GS115中进行目的基因表达,已成功克隆出Latcripin-1(GenBank Acession Number:JQ327159),并证实它对人肺癌细胞A549具有诱导凋亡作用[22]。为了优化表达条件,为未来工业化开发生产抗肿瘤药物奠定基础,选择原核表达体系,以pET-32a为表达载体,将其在宿主菌Rosetta-gami(DE3)中诱导目的基因表达,Rosetta-gami(DE3)菌是1株可以高效表达真核源性基因的表达菌株,已成功克隆表达出6个Latcripin系列蛋白(GenBank Acession Number:KF772202、KF709447、KF682438、KF682439、KF682440、KF682441),并鉴定出其抗肿瘤活性,同时已申报国家专利。
通过Solexa高通量新一代技术对香菇C91-3转录组的发现,为香菇C91-3的功能基因的挖掘和开发提供了基础数据和新策略,同时也为应用生物技术方法获得其他物种的活性蛋白的编码基因提供了新的研究思路。
[1]Chang,S.Past and present trends in the production ofLentinula edodesin Asia[M].Mushroom Biology and Mush room Products,Proceedings of the 4th Intemational Conference,Cueru avaca,Mexico,2002:1-8.
[2]Shah SK,Walker PA,Moore-Olufemi SD,et al.An evidencebased review of aLentinula edodesmushroom extract as complementary therapy in the surgical oncology patient[J].JPEN J Parenter Enteral Nutr,2011,35(4):449-58.
[3]Hazama S,Watanabe S,Ohashi M,et al.Efficacy of orally administered superfine dispersed lentinan(beta-1,3-glucan)for the treatment of advanced colorectal cancer[J].Anticancer Res,2009,29(7):2611-2617.
[4]Kataoka H,Shimura T,Mizoshita T,et al.Lentinan with S-1 and paclitaxel for gastric cancer chemotherapy improve patient quality of life[J].Hepatogastroenterology,2009,56(90):547-550.
[5]Kubota E,Kataoka H,Hayashi K,et al.Advanced stomach and pancreas cancer successfully treated with combination chemotherapy with S-1/paclitaxel/lentinan[J].Hepatogastroenterology,2009,56(89):106-110.
[6]宁安红,曹婧,黄敏,等.香菇C91-3菌发酵液的抑菌作用的初步探讨[J].中国微生态学杂志,2001,13(1):18-21.
[7]李星云,黄敏,宁安红,等.香菇蛋白LFP91-3-A的分离纯化及其抗肿瘤机制[J].中华微生物学和免疫学杂志,2007,27(9):84.
[8]王晓丽,赵越,李星云,等.香菇C91-3发酵液蛋白的初步分离及其体外抗肿瘤作用检测[J].山东医药,2009,49(45):73-74.
[9]戴兵,黄敏,宁安红,等.香菇C91-3菌丝发酵液蛋白抑制小鼠宫颈癌细胞株U14生长及诱导凋亡的实验研究[J].浙江医学,2004,26(9):656-658.
[10]Boguski MS,Tolstoshev CM,Bassett DE,et al.Gene discovery in dbEST[J].Science,1994,265:1993-1994.
[11]Chen SL,Sun YQ,Song JY,et al.Analysis of expressed sequence tags(EST)from Panax quinquefolium root[J].Acta Pharm Sin,2008,43:657-663.
[12]Wu Q,Song JY,Sun YQ,et al.Transcript profiles of Panax quinquefolius from flower,leaf and root bring new insights into genes related to ginsenosides biosynthesis and transcriptional regulation[J].Physiol Plant,2010,138:124-149.
[13]Chum WW,Kwan HS,Au CH,et al.Cataloging and profiling genes expressed inLentinula edodesfruiting body by massive cDNA pyrosequencing and LongSAGE[J].Fungal Genet Biol,2011,48(4):359-369.
[14]Costa Angelini C,De Feis I,Ciccodicola A.Uncovering the complexity of transcriptomes with RNA-Seq[J].J Biomed Biotechnol,20l0,2010:853916.
[15]Wang Z,Gerstein M,Snyder M.RNA-Seq:a revolutionary tool for transcriptomics[J].Nat Rev Genet,2009,10(1):57-63.
[16]Lister R,O'Malley RC,Tonti-Filippini J,et al.Highly integrated single-base resolution maps of the epigenome in Arabidopsis[J].Cell,133:523-536.
[17]Nagalakshmi U,Wang Z,Waern K,et al.The transcriptional landscape of the yeast genome defined by RNA sequencing[J].Science,2008,320:1344-1349.
[18]Wilhelm BT,Landry JR.RNA-Seq-quantitative measurement of expression through massively parallel RNA sequencing[J].Methods,2009,48:249-257.
[19]Xiao-Wei Wang,Jun-Bo Luan,Jun-Min Li,et al.De novo characterization of a whitefly transcriptome and analysis of its gene expression during development[J].BMC Genomics,2010,11:400
[20]Zhong M,Liu B,Wang X,et al.De novo characterization ofLentinula edodesC(91-3)transcriptome by deep Solexa sequencing[J].Biochem Biophys Res Commun,2013,431(1):111-115.
[21]钟民涛,王晓丽,李星云,等.香菇C91-3菌丝发酵蛋白对H22肿瘤细胞体内外抗肿瘤机制的初探[J]中国微生态学杂志,2011,23(9):816-819
[22]Liu,B,Zhong,M,Lun,Y.,et al.A Novel Apoptosis Correlated Molecule:Expression and Characterization of Protein Latcripin-1 from Lentinula edodes C91-3[J].Int.J.Mol.Sci.,2012,13:6246-6265.