赵 凡,曾秀丽,张姗姗
(西藏自治区农牧科学院蔬菜研究所,西藏 拉萨 850000)
被誉为“花中之王”的牡丹在长期的培育中已经成为世界上园艺化程度最高的花卉之一,在我国已有1500多年的园艺栽培历史。作为观赏植物,在牡丹的众多性状中,花型一直是一个重要的因素,它是由花瓣、雄蕊、雌蕊、萼片的形态数量变异及其排列组合决定的。从其应用角度而言,牡丹花型是其重要的观赏特征之一,直接影响到牡丹的观赏价值;从分类角度而言,花型分类是一种重要的分类方法,能够客观地反映牡丹品种的演进规律。重瓣程度的高低无疑对它的观赏效果有着极大的影响,故而有必要研究其重瓣性瓣化机理,进一步改变其花型从而提高观赏性,2016年,西藏自治区农科院蔬菜所牡丹课题组首次在拉萨驯化栽培的大花黄牡丹中发现了2株雄蕊瓣化后单花花瓣数量达到28瓣,雌蕊为3~4个的变异材料,而多年的野外调查发现大花黄牡丹的花瓣数量为11~12,从未发现过重瓣变异植株。
转录组是特定组织细胞在某一发育阶段转录出来的所有RNA的集合。转录组研究能够从整体水平研究基因功能以及基因结构,揭示特定生物学过程以及疾病发生过程的中的分子机理。转录组测序(RNA-Seq)是利用第2高通量测序技术进行cDNA测序,全面快速地获取某一物种特定器官或组织在某一特定器官或组织在某一状态下的几乎所有转录本。随着后基因组的时代的到来,转录组学、蛋白质组学、代谢组学等各种组学相继出现,其中转录组学是率先发展起来以及应用最广泛的技术[1]。遗传学中心法则表明,遗传信息在精密的调控下通过信使5RNA(mRNA)从DNA传递到蛋白质。因此,mRNA被认为是DNA与蛋白质生物之间信息传递的媒介,而所有表达基因的身份以及其转录水平,一起被称作转录组[2](Transcriptome)转录组是特定组织或细胞在某一发育阶段或功能状态下转录出来的所有RNA的总和,主要包括mRNA和非编码RNA的总和,主要包括非编码RNA(non-codingRNA,ncRNA)[3]。转录组研究是基因功能及结构研究的基础和出发点,了解转录组是解读基因组功能元件和揭示细胞及组织中分子组成所必需的,并且对理解机体发育和疾病具有重要的作用。事实上,大花黄牡丹雄蕊瓣化也是机体病变的过程,应用转录组学技术研究大花黄牡丹雄蕊瓣化将会是一个直接有效的方法。
因此本实验将从生态学和转录组2个方面找出导致大花黄牡丹雄蕊瓣化的因子。
本实验在西藏自治区农牧科学院蔬菜研究所园区大棚内开展。该实验基地的海拔为3650 m,光照充足,紫外线强。雨季多集中在6-9月,土壤为沙壤土,保水保肥能力一般。
从林芝已移栽到拉萨的六年生大花黄牡丹瓣化植株2棵,大花黄牡丹正常植株3棵、液氮罐、干冰、RNA保存液、铝纸、游标卡尺、记号笔、标签、记录本。
本实验采集正常株和变异株对照试验,在形态学上进行花部结构上的观察,选取花芽分化时期顶芽,制作石蜡切片,显微镜观察顶芽结构特征。在转录组方面进行RNA测序unigene的差异性分析。提取大花黄牡丹雄蕊瓣化群体和正常群体样本总RNA,加接头,建库。然后利用11umina HIseq2000测序平台进行生物学分析及功能注释。两种材料转录组进行比较分析,鉴定雄蕊瓣化形成时期相关差异表达基因。
从表1可知,通过3个时间的观察,记录大花黄牡丹正常株和变异株一些形态指标的观察,发现变异植株,从冠幅、长枝长、长枝茎粗、短枝长、短枝茎粗、花蕾数等方面的优势要强于正常株,分别高于正常株0.32 m、0.40 m、0.41 cm、0.13 m、0.04 cm、3.5个,然而在长短枝平均生长量上要弱于正常株0.04 m,正常株与变异株在长枝长度上存在极显著性差异,在长枝茎粗上有显著性差异,在短枝长度和茎粗上没有显著性差异。
2017年11月23日开始,间隔10 d从正常和变异的大花黄牡丹植株上采集花芽,并在体式显微镜下进行观察,采集4次,于2017年12月23日结束。通过4次采集花芽的观察得出,正常花芽刚开始被四周的叶芽包围,且高度高于其中的花芽,到后面花芽生长的很快,叶芽和花芽的数量也不断增加。但叶芽的生长速度要弱于花芽,到后面花芽也高于叶芽;相比较而言,变异花芽从刚开始观察,其花芽就高于叶芽,到后面花芽和叶芽的高度差越来远大,同等时期花芽和叶芽都比正常株长得弱小,1个混合芽中,花芽和叶芽生长速度的快慢、数量、高度差、或许是导致大花黄牡丹雄蕊瓣化的1个形态判断指标。
2.3.1 样品采集 本实验于2017年4月18日、2017年5月10日,2017年6月24日,3个时间点,总计118个样,1个样1个花蕾,变异样品9个,正常样品9个。写上标签,用锡箔纸包裹,置于-80 ℃液氮中保存,于2017年8月底,送至武汉进行样品转录组分析。
注:2017-3-23观察冠幅、标记的各五个长短枝长度、茎粗平均值,2107-04-13统计标记长短枝得总花蕾数、2017-05-17统计标记的长短枝生长量均枝。
表2 不同时间采样情况
2.3.2 样本检测、文库构建和上机测序 对总RNA样本进行1 %的琼脂糖电泳检测RNA样品是否有降解以及杂质;凯奥k5500分光光度计检测样品纯度;安捷伦2100RNA Nano 6000 Assay Kit (Agilent Technologies,CA,USA) 检测RNA样品的完整性和浓度。总RNA样本检测合格后,用带有Oligo(dT)的磁性富集mRNA,向得到的mRNA中加入片段缓冲液使其片段成为短片段,在以片段后的mRNA为模板,用六碱基随机引物合成cDNA第1链,并加入缓冲液、dNTPS、RNaseH和DNA polymerase I继续合成cDNA第2链,经过QIAQUick PCR试剂盒纯化并加EB缓冲液洗脱。洗脱纯化后的双链cDNA再进行末端修复、加碱基A、加测序接头处理,然后经琼脂糖凝胶电泳回收目的大小片段并进行PCR扩增,从而完成整个文库制备工作。
2.3.3 样本信息 项目共有18个样本用于分析,样本信息名称对应到检测时的名称如表3所示:
2.4.1 差异基因的获取 从表中通过计算,可以得出TEST01和CONTRIL01差异基因总数272个、上调基因200个、下调基因72个;TEST02和CONTRIL02差异基因总数2526个、上调基因1403个、下调基因1123个;TEST03和CONTRIL03差异基因总数2539个、上调基因736个下调基因1803个。
表3 18个样本信息名称对应的检测名称
图1 本本差异基因
2.4.2 差异表达基因韦恩图 通过比较处理组和参考组,对不同组别之间的差异表达基因作韦恩图,如下:3个组合加起来共有不重复基因4709个,3个组合互不重合基因4694个,3个组合共同重合的基因有15个。这15个差异基因的部分基因可能是导致大花黄牡丹雄蕊瓣化的基因。
图2 差异基因韦恩图
2.4.3 GO分析 TEST01-CONTRIL01、TEST02-CONTRIL02、TEST03-CONTRIL03 3个组合差异基因将从生物过程(biological process)、细胞组成(cellular component)和分子功能(Molecular Function)3个部分。基因或蛋白质通过ID对应或者序列注释的方法找到与之对应的GO编号,而GO编号可用于对应到Term,即功能类别或者细胞定位。
图3 GO分析样本1
利用Blast2GO,计算每个Term的基因数目。并根据结果绘制柱形图,结果如下:
TEST01-CONTRIL01组合差异基因被定位到了生物过程(biological process)中代谢过程(Metabolic processs)参与基因52个;细胞过程(Cellular processs)参与基因48个;单一生物体过程(Single-organism processs)参与基因32个;刺激反应(Response to stimulus)参与基因17个;生物调节(Biological regulation)参与基因15个;发展过程(Developmental process)参与基因7个;复制过程(Reproductive process)参与基因6个,多微生物过程(Multi-organism process)参与基因6个;细胞组成的组织或生物起源(Cellular component organization or biogenesiss)参与基因6个;多细胞有机体过程(Multicellular organismal process)参与基因2个;生长(Growth)参与基因2个;定位(Localization)参与基因2个;免疫系统过程(Immune system process)参与基因1个。细胞组成(cellular component)中细胞组分(Cell part)参与基因59个;细胞膜组分(Membrane part)参与基因26;细胞器官(Organelle)参与基因29;细胞膜(Membrane)参与基因16个;细胞外区域(Extracellular region)参与基因9个;细胞器官组分(Organelle part)参与基因9个;复杂的大分子(Macromolecular complex)参与基因8个;细胞外区组分(Extracellular region part)参与基因2个。分子功能(Molecular Function)中催化作用(Catalytic)参与基因51;粘合物(Binding)参与基因47个;核转录因子和绑定(Nucleic acid binding transcription factor)参与基因11个;选择载体(Electron carrier)参与基因5个;运输(Transporter)参与基因5个;信号转换器(Signal transducer)参与基因2个;分子传感器(Molecular transducer)参与基因1个;分子结构(Structural molecule)参与基因1个;翻译机构(Translation regulator)参与基因1个;转录因子活性,蛋白质绑定(Transcription factor activity,protein binding)参与基因1个。
图4 GO分析样本2
TEST02-CONTRIL02组合差异基因被定位到了生物过程(biological process)中细胞过程(Cellular processs)参与基因793个;代谢过程(Metabolic processs)参与基因642个;单一生物体过程(Single-organism processs)参与基因475个;生物调节(Biological regulation)参与基因317个;细胞组成的组织或生物起源(Cellular component organization or biogenesiss)参与基因199个;刺激反应(Response to stimulus)参与基因314个;发展过程(Developmental process)参与基因226个;定位(Localization)上下调基因144个;复制过程(Reproductive process)参与基因122个;多细胞有机体过程(Multicellular organismal process)参与基因95个;多微生物过程(Multi-organism process)上下调基因67个;生长(Growth)参与基因20个;生物阶段(Biological phase)参与基因9个;免疫系统过程(Immune system process)参与基因15个;生长运转(Locomotion)参与基因10个;解毒作用(Detoxification)参与基因2个;生物附着(Biological adhesion)参与基因2个;信号(Signaling)参与基因1个;反应(Behavior)参与基因1个;细胞杀伤功能(Cell killing)参与基因1个。细胞组成(cellular component)中细胞组分(Cell part)参与基因943个;细胞器官(Organelle)参与基因577个;细胞器官组分(Organelle part)参与基因322个;复杂的大分子(Macromolecular complex)参与基因187;细胞膜组分(Membrane part)参与基因321个;细胞膜(Membrane)参与基因167个;细胞外区域(Extracellular region)参与基因95个;复杂的超分子(Supramolecular complex)参与基因27个;细胞接合(Cell junction)参与基因40个;细胞外区域(Extracellular region part)参与基因9个;关闭的膜腔(Membrane-enclosed lumen)参与基因7个;拟核(Nucleoid)参与基因2个;;病毒粒子部分(Virion part)参与基因2个;其他有机体的一部分(Other organism part)参与基因2个。分子功能(Molecular Function)中粘合物(Binding)参与基因786个;催化作用(Catalytic)参与基因636个;运输(Transporter)参与基因95个;核转录因子和绑定(Nucleic acid binding transcription factor)参与基因97个;分子结构(Structural molecule)参与基因34个;分子功能监管机构(Molecular function regulator)参与基因20个;选择载体(Electron carrier)参与基因35个;信号转换器(Signal transducer)参与基因21个;分子传感器(Molecular transducer)参与基因9个;转录因子活性,蛋白质绑定(Transcription factor activity,protein binding)参与基因4个;抗氧化(Antioxidant)参与基因4个;抗氧化(Nutrient reservoir)参与基因3个。
图5 GO分析样本3
TEST03-CONTRIL03组合差异基因被定位到了生物过程(biological process)中代谢过程(Metabolic processs)参与基因651个;细胞过程(Cellular processs)参与基因652个;单一生物体过程(Single-organism processs)参与基因424个;生物调节(Biological regulation)参与基因277个;(Response to stimulus)参与基因311个;刺激反应发展过程(Developmental process)参与基因128个;定位(Localization)参与基因125个;复制过程(Reproductive process)参与基因78个;多细胞有机体过程(Multicellular organismal process)参与基因67个;细胞组成的组织或生物起源(Cellular component organization or biogenesiss)参与基因83个;多微生物过程(Multi-organism process)参与基因68个;免疫系统过程(Immune system process)参与基因29个;生长(Growth)参与基因25个;信号(Signaling)参与基因5个;有节奏的过程(Rhythmic process)参与基因3个;反应(Behavior)参与基因3个; 复制(Reproduction)参与基因1个;生物附着(Biological adhesion)参与基因2个;生长运转(Locomotion)参与基因2个。细胞组成(cellular component)中细胞组分(Cell part)参与基因820个;细胞器官(Organelle)参与基因435个;细胞膜组分(Membrane part)参与基因379个;细胞膜(Membrane)参与基因310个;细胞器官组分(Organelle part)参与基因226个;细胞外区域(Extracellular region)参与基因115个;复杂大分子(Macromolecular complex)参与基因93个;细胞接合(Cell junction)参与基因48个;细胞外区域(Extracellular region part)参与基因14个;复杂的超分子(Supramolecular complex)参与基因10个;突触部分(Synapse part)参与基因1个;关闭的膜腔(Membrane-enclosed lumen)参与基因3个。分子功能(Molecular Function)中催化作用(Catalytic)参与基因711个;粘合物(Binding)参与基因703个;核转录因子和绑定(Nucleic acid binding transcription factor)参与基因115个;运输(Transporter)参与基因93个;选择载体(Electron carrier)参与基因67个;信号转换器(Signal transducer)参与基因39个;分子结构(Structural molecule)参与基因25个;分子传感器(Molecular transducer)参与基因22个;分子功能监管机构(Molecular function regulator)参与基因27个;氧化(Antioxidant)参与基因6个;抗氧化(Nutrient reservoir)参与基因5个;转录因子活性,蛋白质绑定(Transcription factor activity,protein binding)参与基因2个。
2.4.4 KEGG通路分析 KEGG(Kyoto Encyclopedia of genes and Genomes,京都基因与基因组百科全书)是基因组破译方面的数据库,在给出染色体中一套完整基因的情况下,它可以对蛋白质交互(互动)网络在各种各样的细胞活动中起的作用进行预测。为了方便查看PAthway在每个比较中的富集程度,取所有样品的显著性Map的并集,并根据q值做出分布图,结果如下:
图6 KEGG通路分析
取所有样品富集的GO条目进行分析,纵坐标为GO的条目,横坐标为不同样品的名称,不同的颜色,代表不同的富集程度。通过图表可以看出,3个对照组合样品PAthway的富集程度显著性,主要体现在DNA replication(DNA复制)、Homologous reciombination(同源性重组)、Mismatch repair(错配修复)、Nucleotide excision repair(核苷酸切除修复)、Plant hormone signal transduction(植物荷尔蒙信号传导)、Non-homologous end-joining(非同源末端连接物)、Base excision repair(碱基切除修复)、Phenylpopanoid biosythesis(苯丙素生物合成)、Isoflavonoid biosynthesis(异黄酮类生物合成)、Brassinosteroid biosynthesis(油菜类固醇生物合成)、Thiamine metabolism(硫胺素新陈代谢)这11个代谢过程。
通过GO和KEGG通路分析,将差异基因比对到不同的分子功能及代谢途径中,发现两个基因调控的蛋白质和大花黄牡丹的雄蕊瓣化有关。参考Hua Ling等[5]关于油菜雄性不育和Seonghoe Jang等[6]关于水稻多花的研究。分别筛选得到GDSL esterase/lipase At1g54790、Polygalacturonase-inhibiting protein 2个基因参与大花黄牡丹的雄蕊瓣化。
针对Hua Ling等人关于油菜雄性不育和Seonghoe Jang等人关于水稻多花的文章。油菜雄性不育代谢过程中的GDSL esterase/lipase At1g54790基因和大花黄牡丹雄蕊瓣化所调控的基因有相似之处。但是雄蕊的瓣化最终的结果就是不育。不育并一定就代表雄蕊瓣化,这其中有许多基因的协同作用,因而只能说油菜的不育和大花黄牡丹的雄蕊瓣化有着类似的基因注释的功能蛋白。水稻多花的代谢过程中基因不再叶片上表达,该基因被干涉后导致水稻花器官数量改变,包括雄蕊、外面的颖壳等。同时该基因表达影响多个花器官发育相关基因的改变。polygalacturonase proteing基因可作为导致大花黄牡丹雄蕊瓣化的重点。
通过对2个相关基因的比较,Seonghoe Jang等人关于水稻多花的文章中,提出的polygalacturonase proteing基因,是导致大花黄牡丹雄蕊瓣化的最有可能的基因,接下来的工作,找到大花黄牡丹中该基因进行验证,确定它是否是导致大花黄牡丹雄蕊瓣化的基因。