刘慧敏 ,乌云塔娜 ,杜红岩
(1.中国林业科学研究院经济林研究开发中心,河南 郑州 450003;2.国家林业局杜仲工程技术研究中心,河南 郑州 450003)
杜仲是我国名贵的经济树种,千百年来以作为中国传统的中药材而广为人知[1]。近二十年来,随着对杜仲研究的逐渐深入,科研工作者发现杜仲除了作为药用植物外,还有其他重要的用途,其果皮、叶片和树皮中都含有丰富的白色胶丝——杜仲胶[2]。杜仲胶(反式聚异戊二烯)是三叶橡胶(顺势聚异戊二烯)的同分异构体,杜仲胶具有“橡塑”二重性[3],使其在海底电缆、高尔夫球、轮胎、医疗器械等多领域发挥独特作用[4]。与三叶橡胶相比,杜仲有病虫害少、适应性广等多种优点,又是我国特有的树种,已被提到国家战略资源的高度[5],因此具有巨大的开发价值,是能够替代三叶橡胶的最佳胶源树种。
尽管杜仲具有很高的经济价值,其杜仲胶合成途径尚不完全清楚,杜仲胶合成上游有两条途径MEP和MVA途径,MEP和MVA途径在植物中广泛存在,它们的终产物IPP是所有萜类物质合成的前体物质。杜仲胶合成下游涉及的基因主要有橡胶延长因子(Rubber elongation factor)、小颗粒橡胶蛋白(Small rubber particle protein)等。橡胶延伸因子(Ref)基因是巴西橡胶树产胶相关的重要功能基因,是一种与橡胶粒子紧密结合的蛋白,约为14 kDa,占胶乳总蛋白的10%~60%,是异戊二烯基转移酶催化多聚异戊二烯单元添加到橡胶分子中不可缺少的成分。已有研究者克隆了三叶橡胶Ref基因的全长或cDNA片段[6-8],并对其在橡胶树基因组中进行了物理定位[9],然而该基因在杜仲研究较少,2012年Suzuki等人在构建杜仲EST文库时发现在杜仲中存在该基因[10]。
本研究用到的杜仲Ref基因序列来源于GenBank(accession number: KJ413007),经过人工检验,该基因序列以ATG开头,以TAA结尾,序列长度为678 bp,且序列中间无N或终止密码子,可以进行后续分析。
数据分析用到的四种模式生物大肠杆菌(Escherichia coli)、 酵 母(Saccharonmyces cerevisine)、拟南芥(Arabidopsis thaliana)和烟草(Nicotiana tabacum)的密码子偏性数据下载于 Codon Usage Database(http://www.kazusa.or.jp/codon/)数据库。
首先运用CUSP和CodonW软件对杜仲Ref基因进行密码子组成和使用偏好性分析,密码子组成分析主要包括GC含量(鸟嘌呤和胞嘧啶含量);A3s、T3s、G3s、C3s(同义密码子在第3位上腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶的出现频率);GC3s(同义密码子第3位的G+C含量)。密码子使用偏好性分析主要包括ENC(有效密码子数);RSCU(同义相对密码子使用度);Frequency(密码子使用频率);Fraction(单个密码子在其同义密码子中出现的比例)。
有效密码子数(effective number of codons,ENC or Nc)是检测单个基因的密码子偏好程度,取值范围为20(每个氨基酸只使用一个密码子)到61(各个密码子被均衡使用)。其值越低,表明该基因的密码子使用偏好性越强[11-12]。
同义密码子相对使用度(relative synonymous codon usage, RSCU)是指对于某一特定的密码子,在编码对应氨基酸的同义密码子间的相对概率,去除了氨基酸组成对密码子使用的影响。该值的计算方法为某一密码子所使用的频率与其在无偏使用时预期频率之间的比值[13-14],如果密码子使用无偏好性,则RSCU值为1;如果该密码子比其他密码子使用更频繁,则其RSCU值大于1;反之亦然[15]。
运用CodonW统计杜仲Ref基因的密码子组成及有效密码字数(ENC),结果见表1。杜仲Ref基因的ENC值为56.18,表明杜仲Ref基因密码子偏好性比较弱且基因表达水平偏低。Ref基因的GC含量为49%,密码子第三位碱基的GC含量GC3s为59%,表明杜仲Ref基因编码区序列中G+C含量(49%)与A+T(51%)含量相当,略微偏好于使用以G/C结尾的密码子。Ref第三位上各个碱基(A、T、G、C)的含量分别为:23%、28%、31%和43%。
表1 杜仲Ref基因的密码子组成及使用参数Table 1 Composition and parameters of EuRef gene
运用CodonW和CUSPS分析杜仲Ref基因的密码子使用偏好性,包括RSCU(同义密码子相对使用度)和Fraction(单个密码子在其同义密码子中出现的比例,每个氨基酸的同义密码子fraction的和等于1),结果见表2。结果表明:在杜仲Ref基因的密码子中共有28个密码子的RSCU值大于1,为杜仲Ref基因的偏好密码子,其中17个密码子以G/C结尾,9个密码子以A/T结尾,与其密码子第三位碱基组成中GC含量(59%)的结果相吻合;同义密码子相对使用度RSCU值较大的密码子其相应的Fraction值也比较大;其中4个密码子(GTA、ACT、CGG、AGT)的相对使用度为0,在杜仲Ref基因中未被使用。
杜仲Ref基因的密码子与大肠杆菌、酵母、拟南芥和烟草基因组的密码子偏好性比较
表3列出了杜仲Ref基因、大肠杆菌、酵母、拟南芥和烟草基因组的密码子使用频率(单个密码子在编码基因总密码子出现的频率,1/1 000),并计算杜仲Ref基因密码子使用频率与其它4个模式物种密码子使用频率的比值,不同物种或基因的密码子使用频率比值在0.5~2.0之间的,表明对该密码子的使用偏好性较为接近;反之,,若比值≤0.5或≥2.0,表明对该密码子的使用偏好差异较大。
杜仲Ref基因与大肠杆菌相比有23个密码子使用差异较大,与拟南芥相比有22个密码子的使用差异较大,与烟草相比有25个密码子的使用差异较大,与酵母相比有24个密码子的使用差异较大。
表2 杜仲Ref基因的密码子偏好性Table 2 Codon bias of EuRef gene
本研究以杜仲Ref基因为研究对象,运用CodonW等软件分析了杜仲Ref基因的密码子组成及偏好性,基因的GC含量为49%,密码子第三位碱基的GC含量GC3s为59%,有效密码子数为56.18,表明杜仲Ref基因的密码子偏好性较弱且基因的表达水平较低。
同义密码子相对使用度和Fraction分析表明,杜仲Ref偏好使用28个密码子且这些密码子大部分(17)个以G/C结尾。
通过将杜仲Ref基因的密码子使用频率与大肠杆菌、酵母、拟南芥和烟草比较发现,杜仲Ref基因的密码子使用偏好与四个物种的密码子使用偏好差异均较大,与拟南芥密码子的使用偏好相对较接近,考虑到拟南芥中有杜仲胶合成上游途径MEP和MVA途径,因此拟南芥更适宜作为Ref转基因的受体,通过密码子改造可以提高Ref基因在宿主中的表达。杜仲Ref基因与烟草密码子的使用偏好差异最大,可能是因为Ref基因的长度较短,密码子数量较少引起的。
表3 杜仲Ref基因的密码子与大肠杆菌、酵母、拟南芥、烟草的密码子偏好性比较Table 3 Comparison of codon bias among EuRef gene and E.coli, A.thaliana, N.tabacum and S.cerevisiae
此分析结果可应用于杜仲Ref转基因功能验证中模式生物的选取,Ref基因密码子的优化改造,为该基因后续研究工作的开展提供理论基础。
续表 3Continuation of table 3
参考文献:
[1]刘慧敏,乌云塔娜,王 淋,等.杜仲MEP途径系列基因表达差异的研究[J].中南林业科技大学学报,2014,34(2):26-33.
[2]乌云塔娜,刘慧敏,杜红岩.杜仲MEP途径系列基因5’端非编码区的顺式作用元件预测[J].经济林研究, 2013,31(4):9-15.
[3]刘慧敏,乌云塔娜,杜红岩.杜仲MEP途径系列基因的基因结构预测[J].经济林研究,2013,31(4):39-44.
[4]张继川,薛兆弘,严瑞芳,等.天然高分子材料——杜仲胶的研究进展[J].高分子学报,2011,(10):1105-1117.
[5]黎云昆.一个树种的国家战略[J].中国林业产业,2012, (Z2):102.
[6]彭世清,傅相辉,吴坤鑫,等.巴西橡胶树死皮病相关基因HbMyb1的结构分析及表达[J].植物生理与分子生物学学报,2003, 29(2):147-152.
[7]Attanyaka DPSTG, Kekwick RGO, Franklin FCH. Molecular cloning and nucleotide sequencing of the rubber elongation factor gene from Hevea Brasiliensis[J]. Plant Molecular Biology, 1991,16:1079-1081.
[8]Goyvaerts E, Dennis M, Light D, Chua HN. Cloning Sequencing of the cDNA Encoding the Rubber Elongation Factor of Hevea brasiliensis[J]. Plant Physiology, 1991, 97:317-321.
[9]邱海燕.巴西橡胶树REF、RT和SRPP基因物理定位的研究[D].海口:海南大学,2010.
[10]Nobuaki Suzuki, Hirotaka Uefuji, Takashi Nishikawa,et al.Construction and analysis of EST libraries of the transpolyisoprene producing plant,Eucommia ulmoidesOliver[J].Planta, 2012,(236):1405-1417.
[11]Wright F. The effective number of codons used in a gene[J].Gene, 1990,87:23-29.
[12]Gupta S K, Bhattacharyya T K, Ghosh T C. Synonymous codon usage in lactococcuslatis: mutational bias versus translational selection[J]. Biomol. Struct. Dyn.,2004,21:1-9.
[13]Sharp P M, Haney T M F, Mosurski K R. Codon usage in yeast:cluster analysisclearly differentiates highly and lowly expressed genes [J]. Nucl. Acids Res., 1986,14: 5125-5143.
[14]Sau K, Gupta S K, Sau S,et al.Analysis of factors shaping codon usage in the mitochondrion genome ofOraza sativa[J].Mitochondrion, 2004,4:313-320.
[15]Sau K, Gupta S K, Sau S,et al.Analysis of factors shaping codon usage in the mitochondrion genome ofOraza sativa[J].Mitochondrion, 2004,4:313-320.