刘 虹,薛 青,黄 文,覃 瑞
(中南民族大学 生命科学学院, 武陵山区特色资源植物种质保护与利用湖北省重点实验室,武汉430074)
茶藨子属(RibesL.)隶属于虎耳草科,全球约160种,主要分布于北半球温带和较寒冷地区,少数种类延伸到亚热带和热带山地. 我国产59种30变种,隶属于4亚属10组15系,主产西南部、西北部及东北部[1]. 目前,国内外对茶藨子属分类、代谢物等研究较多,但在分类上仍以经典的形态学分类为主[2],虽然对茶藨子属植物的化学分类、花粉和叶片形态和种子蛋白血清学等进行了一定研究,但对该属的分类位置尚未取得一致的结论[3,4]. 茶藨子属与虎耳草科的其他属之间呈现出形态上的连续性和间断性,表明它们有较近的亲缘关系,伴随本属一些新种不断的发现[5],一些学者认为茶藨子属应独立成科. 由于茶藨子属植物形态变异幅度较大,仅根据形态学难以进行准确分类,有必要采用分子生物学的手段对茶藨子属植物的系统发育及物种间的亲缘关系进行分析.
目前,物种的分类研究已经从过去的形态学分类转变为分子系统学及代谢组学研究[6-7],这种转变使物种进化关系的研究取得了突破性进展. 与形态学特征相比,DNA反映的是物种的遗传本质,受环境影响小,能够较好地解析种内和种间的差异. 另一方面,由于DNA的进化速率存在差异,所以不同分类阶元的系统发育研究会选择不同来源的DNA[8]. 由于核基因组中的非编码序列的进化速率比编码序列的进化速率更快,其中的ITS序列常用来研究种间系统发育关系,ITS序列在被子植物中的长度一般小于700 bp,对ITS序列的分析已成为在分子水平上探讨植物高阶元系统发育的重要手段[9-10]. ITS区域由ITS1、ITS2和5.8 Sr DNA 3部分构成,其中5.8 Sr DNA高度保守,基本无变异,ITS1和ITS2都属于中度保守序列,进化速率快且片段较小,常用来区分不同的物种和鉴定物种间的亲缘关系. ITS2序列(内转录间隔区2,Internal Transcribed Spacer 2)介于5.8 S和26 S之间,属于中度保守序列,序列长度较短且进化速度较快,适于科以下的低分类阶元如属内及种间的系统学研究[11-13]. 基于上述因素,本研究采用生物信息学的方法对茶藨子属的ITS2序列进行了一系列分析,以期为中国茶藨子属植物的分子系统发育及种间亲缘关系分析提供初步的科学依据.
本研究共涉及茶藨子属(Ribes)30个物种的ITS2序列,所有序列均从Genbank获得,实验数据来源详见表1,外源对比物种选用桔梗科Campanulaceae党参属的羊乳Codonopsislanceolata(Sieb. et Zucc.) Trautv. 因其与所选择的茶藨子的ITS2序列的相似度最高,所以本文选取羊乳作为分支分析的外类群.
从Genbank上下载ITS2序列经人工校对后,用Clustal W软件进行多序列比对,通过MEGA7.0软件计算遗传距离(K2P),比较30个物种序列间的差异性,并以羊乳的ITS2序列为外类群进行比较,bootstrap proportions(BP)参数值设为重复1000次,构建邻接(NJ)聚类树. 所有序列用RNA Structure5.4软件预测其二级结构.
茶藨子属30个物种的ITS2序列长度为222~240 bp,碱基鸟嘌呤-胞嘧啶(GC)质量分数为57.14%~59.24%(表1),不同物种间的变异位点为27个,简约信息位点为13个. 30个物种的ITS2序列二级结构的A、B、C、D臂的突环、内环和发卡环数据统计见表2. ITS2序列在种间变异较大,种间遗传变异(遗传距离为0.004~0.039)大于种内遗传变异(表3).
表1 所选茶藨子属植物名称及GenBank号Tab.1 The origin and GenBank number of Ribes spp.
表2 茶藨子属30个种A、B、C、D臂的突环、内环和发卡环部分数据统计Tab. 2 Partial data statistics of hairpin, bulge, internal loop of arm A, B, C and D of 30 species in Ribes
表3 茶藨子属ITS2序列的K2P遗传距离Tab. 3 K2P genetic distance of the ITS2 sequence in genus Ribes
茶藨子属的二级拓扑结构预测结果显示,与大多数真核生物ITS2二级结构相似,茶藨子属的二级结构类似三叶草状,以一个大的多分枝环为中心,四周延长出至少4个臂,其基序为U-U mismatch和U-U mismatch with AAA和UGGU(图1,2). 编号从5′端开始,在3'端结束. 拓扑结构差异主要体现在茎环的位置、数目、大小及螺旋发出时的角度不同. 预测的茶藨子属的二级拓扑结构可分为α型和β型两种结构,区别在于:α型在A臂中含有4个突环,2个内环和1个发夹环,发夹环的碱基为TCTACGG,而β型在A臂中含有5个突环,1个内环和1个发夹环,发夹环的碱基为TCTAGCG. α型和β型两种拓扑结构的其他臂结构类似,其中B臂都含有2个突环和1个发夹环,C臂的臂长最长且结构最为复杂,含有9个突环,2个内环和1个发夹环,D臂的臂长最短,结构最为稳定,含有1个突环和1个发夹环,均具有属的特异性. 从图1~2可以看出茶藨子属30个种的结构类型趋向一致,变化性特征性较少.
图1 茶藨子属的ITS2二级结构的α型Fig.1 α - type of ITS2 secondary structure of genus Ribes
图2 茶藨子属的ITS2二级结构的β型Fig.2 β - type of ITS2 secondary structure of genus Ribes
茶藨子属30个物种的平均遗传距离为0 < d = 0.017 < 1,可构建邻接聚类树. 以羊乳为外类群构建的系统发育树如图3所示,结果显示30个种都聚成1大枝11小枝,与陆玲娣等[2-6]依据形态学对茶藨子属的分类结果基本一致.
图3 茶藨子属基于ITS2序列构建的邻接聚类树Fig.3 Adjacent clustering tree constructed based on ITS2 sequence
茶藨子属植物主要通过形态特征等对其进行划分,各国学者对该属的分类位置和属下类群的划分均有争议[2,5,6]. 本研究通过对茶藨子属的ITS2序列进行二级结构预测和系统发育树的构建,进一步验证了前人对茶藨子属的经典分类学研究结果.
在植物的基因组中,不同的基因具有不同的进化速率,进化速率较快的基因可用来解决物种间的关系问题,ITS序列具有高度的变异性又有相对保守的二级结构,适用于在较低的分类阶元上解决植物的分子鉴定及系统发育问题[9,12,13]. 植物系统在长期的演化过程中,不仅在一级结构水平上保留进化痕迹,在二级结构水平上也同样如此,高级结构与其功能之间的联系更为密切,在这一层面上的二级结构相对于一级结构可以更直观地揭示物种进化史[8,9,10]. 王毅等[8]对紫菀族的32个物种的ITS2序列的二级结构分析表明了ITS2二级结构对紫菀族各种的鉴定及亲缘关系研究的可行性. 吴亚男等[14]通过对茄科酸浆属ITS序列聚类分析表明该法能有效地区分物种种内关系. 李倩等[15]通过对绒泡菌目黏菌的ITS1和ITS2的二级结构分析,发现虽然在不同物种形成螺旋的位置和数目不同,但是它们都仍具有一些保守的螺旋结构.
为了鉴定并对茶藨子属进行分类,本研究不仅利用ITS2的一级序列的分歧分析了其序列的碱基GC含量、计算变异位点和信息位点等,也使用了ITS2二级拓扑结构的信息来进行研究. 以分子形态特征对茶藨子属建立系统发育的鉴定,通过对茶藨子属30个种进行二级结构预测,确定了ITS2二级结构均有类似的结构特征,通过统计内环、突环数量以及发卡环碱基数可知(表2),A臂结构变异较大可分为α型和β型两种拓扑结构,其中α型(图1)在A臂中含有4个突环,2个内环和1个发夹环,而β型(图2),在A臂中含有5个突环,1个内环和1个发夹环.两种拓扑结构的其他臂结构类似,且茎环的大小、位置和碱基类型都呈现出高度保守的特点,说明在二级结构上也具有遗传信息的保守性,这为茶藨子属的分类提供了参考价值. 研究发现ITS2的一级结构突变丰富,但是在二级结构上的一些区域较保守(如ITS2中B臂、C臂、D臂区),大部分的点突变并未造成这些区域上臂环构型的改变,可以推测这些臂环结构对ITS行使其加工功能有关键的作用,这些臂环结构主要由G-C、G-T、A-T键构成,GC含量较高,A-U键较少,这些稳定的臂环结构可能行使类似于tRNA中反密码子的功能,通过结合特定的反式作用因子对前体rRNA进行加工. 这些类似的UGGU、UAAA保守区域是否作为识别位点存在,ITS区域二级结构能否通过臂区碱基高度匹配,将这些识别位点通过环的形式突出于空间结构,使得剪接体能够更高效地识别,提高整个核糖体40S前体RNA的剪接效率?这种现象是否真实存在,有待进一步验证.
研究以K2P模型构建ITS2的系统进化树,结果显示构建的聚类树中,Ribesalpestre与简羊乳的ITS2序列在一支,而与属内其他种聚在不同枝,可能是环境等因素引起了个别碱基发生变异,从而聚为不同枝. 结合以前通过植物形态构建的聚类树,证实了ITS2序列及其二级结构分析对系统进化树的构建及亲缘关系的判定作用.这表明,采用ITS序列能够满足茶藨子属大多数种类的鉴定,为茶藨子属的系统分类提供了新的科学依据.