雷 慧,李 鸽,王娜玉
(忻州师范学院生物系,山西忻州034000)
金莲花(Trollius chinensis Bunge)又名寒金莲、旱地莲,为毛茛科金莲花属植物,喜冷凉湿润环境,在内蒙古、河北、山西等省区海拔1 800 m 以上的高山草甸或疏林地带常有分布[1]。金莲花为五台山特色植物之一,不仅观赏价值高,也具有良好的药用价值,具有清热解毒功效,可用于治疗扁桃体炎、上呼吸道感染、急性中耳炎和咽炎等[2]。
叶绿体是光合作用的重要细胞器,在生物合成淀粉、脂肪酸等方面扮演着重要角色,且通过母系遗传有自主的遗传体系,成为近年来研究的热点。截至2018 年12 月19 日,NCBI 网站上已公布叶绿体基因组2 356 个,包括植物、蓝藻和真菌等,其中,以经济作物、农作物和药用植物的叶绿体基因组为主要研究对象[3]。以叶绿体为代表的质体基因工程研究已取得了一系列重要进展。人们已成功应用叶绿体遗传转化手段将抗菌、综合抗性、编码渗透保护剂等相关基因导入烟草中,可提高其抗真菌、病原体、昆虫的能力和增加耐盐、耐旱等非生物压力[4-6]。
密码子在生物体遗传信息的传递过程中起着关键作用,由不同的密码子编码同一个氨基酸的密码子称为同义密码子[7]。同义密码子的使用在蛋白质翻译的过程中并不是随机选择的结果。研究发现,密码子的使用存在着不均等现象,即使是同一物种,其不同蛋白质中相同氨基酸对密码子的选用频率也不同,即密码子的使用具有偏好性,使用频率高的密码子为高频优越密码子[8]。吴彦庆等[9]研究发现,不同植物中的花分生组织决定基因APETALAI的密码子使用模式存在一定差异,进化关系较密切的物种具有显著的相似密码子使用模式,但每个物种都有自己的最优密码子,通过对密码子使用模式的研究确定物种最优密码子,为叶绿体遗传转化手段提供便利,并进一步提高外源基因的表达。
目前,五台山野生金莲花数量锐减,但对其研究多局限于化学成分如黄酮类、有机酸、生物碱和萜类等化合物的分离提取上。为促进药用植物种质资源的保护和可持续利用,前期研究已对金莲花叶绿体基因组进行测序、组装和注释,并在GenBank注册(序列号为KX752098)。已在很多植物如蝴蝶兰[10]、蒺藜苜蓿[11]、苦荞[12]以及包括杉木在内的5 种针叶树[13]进行过叶绿体基因组的密码子分析。
本研究通过对金莲花叶绿体密码子使用模式及基因表达和转基因研究的异源受体进行分析,旨在为进一步研究金莲花分子系统进化、提高外源基因表达及遗传转化等奠定基础。
从GenBank 中获取山西五台山野生金莲花叶绿体基因组序列(编号为KX752098),全长160 191 bp,共有85 条蛋白质编码基因。为了减少误差,准确地计算出有效密码子数,研究时选取长度大于300 bp、以AUG 为起始密码子和中间无终止密码子的49 条序列作为各项数据研究的对象[14]。
分析时去除不存在偏好性的密码子,如色氨酸的唯一密码子UGG;蛋氨酸的唯一密码子AUG;终止密码子UAA、UGA、UAG。使用Codon W 软件对49 条编码蛋白质的DNA 序列进行密码子的使用特性参数进行3 次重复分析,再用Excel、SPSS 软件分析这些参数间的相关性[15]。最优密码子的确定是以49 个基因的有效密码子数值(Effective Number of Codon,ENC)大小为标准,两边各选10%的基因建立高低表达基因偏性库,选取两库相对同义密码子使用度(Relative Synonymous Codon Usage,RSCU)差值大于0.08 且在高表达基因库中RSCU 值大于1 的密码子[16]。从数据库Codon Usage Database(http://www.kazusa.or.jp/codon/)中搜索拟南芥(Arabidopsis thaliana)、水稻(Oryza sativa)、酵母菌(Saccharomyces cerevisiae)和大肠杆菌(Escherichia coli)基因组密码子的选用偏好性数据,再与金莲花的叶绿体基因组密码子使用偏好性进行对比。
用Codon W 软件对金莲花叶绿体编码蛋白序列分析,结果显示(表1),基因编码区GC 含量在30.70%~46.60%内波动,平均值为38.73%;同义密码子第3 位碱基出现U 和A 频率的平均值较大,分别为45.61%和42.01%;第3 位碱基出现G 和C 频率的平均值较小,分别为17.50%和18.11%;第3 位密码子的GC 含量(GC3s)平均值为27.60%。这些碱基组成偏好性表明,金莲花叶绿体蛋白编码序列密码子中AU 的使用频率高于GC,密码子第3 位上的偏好性表明,大部分密码子以A/U 结尾。
有效密码子数(ENC)的大小可量化一个基因的密码子使用频率与同义密码子平均使用频率的偏差,从而检测单个基因密码子的偏好程度,若每个氨基酸只使用一个密码子,此基因的ENC 值为20;反之,除3 个终止密码子不编码任何蛋白外,每个密码子都被均衡使用,则ENC 值为61。一个基因的ENC 值越小,密码子使用偏好程度越大,对应的基因表达量往往也越高,可以通过ENC 值判断基因表达量的高低。当ENC 值大于35 时,一般认为表达水平较低,在编码氨基酸时,对密码子的选用偏好性也较弱[17]。金莲花叶绿体的ENC 值在40.21~55.54 波动,平均值为48.30,说明金莲花叶绿体基因密码子的偏好性较弱。
金莲花叶绿体基因密码子部分使用参数的相关性分析结果表明(表2),有效密码子数ENC 与U3s、A3s 呈极显著负相关(P<0.01),与G3s、GC3s呈极显著正相关(P<0.01),说明同义密码子第3 位上的碱基含量直接影响密码子使用偏好程度和基因的表达水平。密码子使用偏好性越强的基因,ENC 值越小,越偏好使用U/A 结尾的密码子,这与第3 位密码子富含A 和U 相一致。
RSCU 表示一个密码子的实际使用频率与无偏好性时理论使用频率之间的比值[18]。若一个密码子的RSCU 值为1,表示其使用没有偏好性;若大于1,则表示该密码子的使用较频繁,反之亦然[19]。金莲花叶绿体基因组18 种氨基酸59 个密码子的RSCU 数值分析结果列于表3,RSCU 值小于1 的密码子,多以C 或G 结尾,每种氨基酸的最高频优越密码子RSCU 值均大于1,且以A 或U 结尾,即金莲花叶绿体密码子第3 位A/U 比C/G 的偏好性强,同义密码子第3 位的碱基含量对基因表达程度和密码子使用偏好性范围起到一定的作用。
表1 金莲花叶绿体各基因密码子组成和使用参数
表2 金莲花叶绿体基因密码子使用参数的相关性分析
表3 金莲花各氨基酸相对同义密码子使用度
续表3
根据金莲花叶绿体49 条基因的ENC 大小进行排序,从排好的两侧各取基因总数的10%即5 条基因,组成高低表达偏好性样本库,若在两库中RSCU的差值即ΔRSCU≥0.08,则相对应的密码子为高表达优越密码子[16],再结合高表达基因库中RSCU>1即高频优越的密码子为最优密码子。最终得到表4中*标记的UUU 编码苯丙氨酸(Phe)、UAU 酪氨酸(Tyr)、UUA 亮氨酸(Leu)、AGA 精氨酸(Arg)、AAU天冬酰胺(Asn)、UCA 丝氨酸(Ser)、CAU 组氨酸(His)、ACA 苏氨酸(Thr)、GGA 甘氨酸(Gly)共9 个最优密码子。
表4 金莲花叶绿体最优密码子的确定
密码子使用频率比值是衡量不同物种间密码子使用偏性差异的指标,若2 个物种间比值大于0.50 小于2.00,说明密码子使用特性较一致;否则差异较大[20]。根据表3 统计的金莲花叶绿体各密码子选用频率分别与Codon Usage Database 中大肠杆菌、酵母菌、拟南芥、水稻密码子使用频率进行比较,结果表明(表5),金莲花与大肠杆菌使用偏好性差异较大的密码子有24 个,与酵母菌差异较大的密码子仅有6 个,说明真核表达系统更适合金莲花叶绿体基因异源表达试验。在分别与单、双子叶遗传转化模式植物水稻、拟南芥的比较发现,金莲花与水稻、拟南芥密码子使用频率差异较大的分别有24个和7 个,说明双子叶植物拟南芥更适合成为金莲花叶绿体基因遗传转化功能验证理想的受体。
表5 金莲花与其他生物密码子偏好性比较
续表5
密码子是生物体内信息传递的基本环节。在生物的遗传密码中,除色氨酸和蛋氨酸只有一个密码子外,其他氨基酸都有一个以上的同义密码子。编码同一个氨基酸的同义密码子在不同物种中使用的频率是不相同的,即使同科属的植物对密码子的使用偏好性也存在差异。本研究中,金莲花叶绿体基因组编码精氨酸偏好使用密码子AGA,但同是毛茛科的大兔葵叶绿体基因组偏好使用CGU[21]。研究发现,叶绿体基因密码子的偏好性虽然较弱,但可能也比核基因的要稍高一些。刘慧敏等[22]在研究杜仲转录组密码子使用偏好性时发现,ENC 的平均值为54.31,拟南芥细胞核中编码高亲和性K+载体蛋白的POT 基因[23]和芍药、牡丹、碧桃、苹果细胞核中花分生组织决定基因APETALAI[9]的ENC 值均大于50,平均值为55 左右。糜子叶绿体基因组的ENC 平均值为49.26[24],苦荞叶绿体基因组整体的ENC 值为50.32[12],金莲花叶绿体的ENC 平均值为48.30。
本试验结果表明,金莲花的叶绿体基因组综合每种氨基酸的高频优越密码子和高表达优越密码子得到的9 个最优密码子,全部以A/U 结尾。结果显示,不管是杜仲核基因转录组或拟南芥、芍药等细胞核中的一些基因还是糜子、苦荞、金莲花叶绿体基因组,在碱基选择时编码区倾向于A+U,且密码子都偏好于使用A/U 结尾的密码子。关于生物体对密码子的选用偏好性研究,有人认为,高等种子植物可以分为偏好A/U 结尾的双子叶植物和偏好C/G 结尾的单子叶植物[25],如双子叶植物小桐子HXT基因密码子的第3 位偏好使用A/U[26],小麦CBL4 基因密码子的第3 位偏好使用C/G[27],但是最近发现,很多单子叶植物密码子的偏好性分析如糜子、霍山石斛也偏好A/U 结尾[24,28]。也有研究认为,低等生物中富含GC 最优密码子,GC 含量也较高;高等生物反之[29]。本试验的金莲花属于高等双子叶植物,其密码子偏向以A/U 结尾,但通过内共生方式从低等生物蓝细菌进化成为叶绿体受到的影响因素还需进一步研究。
本试验通过金莲花叶绿体与原核、真核单细胞、单子叶、双子叶模式生物的密码子使用频率比较发现,金莲花叶绿体与原核的大肠杆菌和单子叶植物水稻的密码子使用频率差异较大,而与双子叶植物苦荞叶绿体的研究一致[12]。所以,真核的酵母菌更适合金莲花叶绿体基因的宿主,双子叶植物拟南芥更适合作为研究金莲花转基因研究的异源受体。