郑 晔,赵义勇,吴丽华,林 娟
(复旦大学 生命科学学院 植物科学研究所,上海 200438)
异源多倍化事件是物种形成的一个重要方式,是一种通过杂交产生杂合体,经过地理隔离继而达到生殖隔离的物种形成过程[1-2].目前普遍认为杂交形成的两个亚基因组间的相互干扰会对生物的生长发育造成一系列负面影响[3],但是也有一些异源多倍体生物成功存活并且表现出一系列超越亲本的优良品质[4].四倍体荠菜(Capsellabursa-pastoris)是两个二倍体荠菜(Capsellarubella或Capsellagrandiflora)的共同祖先和Capsellaorientalis通过杂交和基因渐渗作用于近期(100~300kya)形成的异源多倍体,是全球分布最广的物种之一[5-6].二倍体荠菜C.grandiflora和C.orientalis曾出现过分布区域重合[5],并在多个地理区域发生了杂交和多倍化事件,从而形成了四倍体荠菜(C.bursa-pastoris)[4].四倍体荠菜在亚洲、欧洲和非洲均有分布,而四倍体荠菜的祖先亲本二倍体荠菜分布范围则呈现明显的局限性: 祖先亲本C.rubella目前主要分布在地中海及欧洲中部地区,C.grandiflora分布在阿尔巴尼亚及希腊西北部,C.orientalis目前主要分布在东欧以及亚洲中部地区.随着人类的农耕活动和迁徙,C.grandiflora和C.orientalis逐渐发生了地理隔离,在约73kya年前,C.grandiflora支系的最近共同祖先发生分化并逐步演变形成了现在的C.grandiflora和C.rubella[7].已有研究证明四倍体荠菜在演化过程中未发生大规模的基因丢失事件,其来自于父本和母本祖先的两个亚基因组独立进化,且没有出现亚基因组间的重组.这两个亚基因组在基因数量和表达谱上具有高度一致性[5,8-9].目前检测到的四倍体荠菜基因的功能性突变均继承自其二倍体亲本祖先,四倍体荠菜基因组中有害单核苷酸多态性突变(deleterious SNPs)同样也在其二倍体亲本祖先的基因组中存在[5,8].转录组研究发现四倍体荠菜的两个亚基因组间的差异表达基因非常有限,差异表达基因的功能主要与胁迫响应相关[8].
温度是植物生长发育的必要条件,也是植物繁殖的必需条件之一[10].植物对低温的适应主要是通过冷信号引起的一系列基因表达变化完成的,这些基因能在短时间内影响植物细胞的生理状态,对植物抗冷起到重要作用[11].植物低温应答是一个复杂的应激过程,涉及低温信号的感应受体、转导途径、转导途径中的转录因子和一系列效应蛋白等[12].离子转运蛋白是一类膜蛋白,具有维持细胞内稳态、促成胞质Ca2+信号转导的功能,而这两项功能都在植物应对环境胁迫过程中具有重要意义[13-15].拟南芥基因组中约有3%的基因编码转运蛋白,其中大量为由质子梯度和膜电势供能的二级转运蛋白[16].Ca2+/阳离子逆转运蛋白超家族CaCAs是植物内环境Ca2+循环系统的主要成员,通常是借助Na+、K+、H+等的电化学梯度供能,实现逆浓度梯度Ca2+的跨膜转运.所有CaCAs至少有一个Na_Ca_ex(PfamID: PF01699)保守结构域,且蛋白质拓扑结构较为保守[17],平均10个跨膜螺旋结构(TM helices)组成一个Ca2+转运通道,在TM helices的2~3和7~8位是两个保守的α重复序列(α-repeats)[18].CaCAs广泛存在于古生菌、细菌、真菌和植物中,并呈现出不断扩张的趋势[17].植物CaCAs主要有4个转运蛋白家族: H+/阳离子转运蛋白(CAX)、阳离子/Ca2+转运蛋白(CCX)、阳离子/Mg2+转运蛋白(MHX)和EF-hand特征结构蛋白(NCL)[17].有关植物CaCAs的研究主要针对部分高等植物的CaCAs成员展开,研究显示植物CaCAs在冷胁迫响应、盐胁迫响应、胞质pH调节以及激素转导等生理过程中均发挥功能,在植物对多种环境的适应中发挥了不同的作用[19-20],转入CbCAX51基因的烟草表现出更强的抗冷性[21].
四倍体荠菜的广泛分布与其多样化的逆境适应能力密切相关.作为跨纬度分布较广的物种,其对温度变化的适应性至关重要;而CaCAs作为植物应对多种非生物胁迫的重要成员,其在荠菜中的分布和功能还几乎没有报道.本研究利用3种荠菜的基因组测序数据,在基因组层面分析了四倍体荠菜及其两种二倍体荠菜C.rubella和C.grandiflora的CaCA家族,从基因家族各成员的系统发育关系、拷贝数差异、序列结构差异以及直系同源基因在低温应答中的表达谱来探讨基因家族拷贝数的变异对四倍体荠菜环境适应性的贡献,该研究为进一步探究四倍体荠菜的物种形成、基因组进化、比较基因组学以及CaCAs超家族在逆境响应等方面的功能提供了有益的参考.
拟南芥(Arabidopsisthaliana)、二倍体荠菜(Capsellarubella和Capsellagrandiflora)的基因组和蛋白质序列数据均来自phytozome v12.1数据库(https: ∥phytozome.jgi.doe.gov/pz/portal.html),四倍体荠菜(Capsellabursa-pastoris)的基因组序列来自Kasianov等在线发表的全基因组拼接数据(http: ∥capsella.org/)[8].二倍体荠菜(C.rubella)RNA-seq数据来自NCBI网站的SRR3993759、SRR3993756、SRR3993757、SRR1944439和SRR1944438数据包;二倍体荠菜(C.grandiflora)RNA-seq数据来自NCBI网站SRA数据库中SRR797566、SRR797553、SRR1944440和SRR1944441数据集;四倍体荠菜(C.bursa-pastoris)RNA-seq数据来自NCBI网站SRA数据库中SRR5387477、SRR5387479、SRR5387449、SRR5387451、SRR5387473和SRR5387475数据集.
由于荠菜全基因组测序结果中基因没有完整的注释,为方便后续分析,作者根据基因家族进化树中的亲缘关系将二倍体荠菜的基因名称和其直系同源的AtCaCAs基因名称进行了统一命名.此外,根据Kasianov等对C.bursa-pastoris中成对出现的基因与其祖先亲本C.rubella和C.orientalis的同源性匹配结果[8],将四倍体荠菜中与同一个AtCaCAs基因同源的一对基因进行了祖先亲本的匹配,来自C.rubella亲本的基因以“r”标注,来自C.orientalis基因以“o”标注,详见表1.
表1 四倍体荠菜CaCAs基因原始注释名与简化名对应表Tab.1 Correspondence table between the original annotated name and simplified name of C.bursa-pastoris CaCAs genes
(续表)
拟南芥哥伦比亚野生型(Col-0)种子购自Tair网站(http: ∥www.arabidopsis.org),四倍体荠菜(C.bursa-pastoris)种子来自中国科学院植物学研究所郭亚龙研究员实验室馈赠.
将生长6周的拟南芥和荠菜植株置于4℃冷驯化3d后在-5℃进行1h冷冻处理,随后放回22℃培养箱继续培养,观察并统计植物的存活率.
1.3.1 CaCA家族序列的获取和鉴定
拟南芥基因组和蛋白质序列根据Pittman等于2016年发表的拟南芥AtCaCAs序列在phytozome v12.1数据库通过“Keyword Search”获得[20];二倍体荠菜(C.rubella和C.grandiflora)的基因组和蛋白质序列依据AtCaCAs序列在phytozome v12.1数据库通过“Blast”获得;四倍体荠菜的蛋白质和基因组序列依据AtCaCAs序列比对Kasianov等在线发表的全基因组拼接数据获得.获得以上序列后,将全部序列输入pFam数据库进行保守结构域检索,包含一个及以上Na_Ca_ex(PfamID: PF01699)保守结构域的序列被最终确定为CaCA家族成员[22].
1.3.2 序列比对及分析
多序列蛋白比对在MAFFT网站(https: ∥mafft.cbrc.jp/alignment/server/)上在线完成[23-24],比对模型为E-INS-I.比对完成后使用BioEdit 7.1及Mega6[25]进行序列手动调整.使用IQtree网站(http: ∥iqtree.cibiv.univie.ac.at)[26]进行进化树构建参数检测,使用JTT+F+G4模型进行进化树构建.保守基序分析采用MEME软件(http: ∥meme-suite.org)[27]完成.跨膜域分析采用TMHMM软件(http: ∥www.cbs.dtu.dk/services/TMHMM/)[28]完成.基因染色体定位采用Mcanx软件[29]完成.
1.3.3 转录组表达谱分析
转录组数据来自NCBI-SRA数据库.使用Trimmomatic软件对转录组进行质量与接头的严格过滤,使所有reads错误率达到Q30(1‰)之下,用R软件求得生物学重复样本间的相关系数,此外通过Hisat2软件将reads回帖到参考基因组,用StringTie进行进行定量,计算得到FPKM值,采用Heatmapper软件(http: ∥www2.heatmapper.ca/expression/)[30]绘制表达谱热图.
1.3.4 冷响应基因的表达分析
将生长6周的拟南芥和荠菜植株置于4℃培养箱进行冷处理,取样时间分别为1h、3h、6h和12h.RNA抽提选用CWBIO公司的植物RNA提取试剂盒,cDNA的获取使用TaKaRa公司反转录试剂盒,Realtime PCR扩增使用TaKaRa公司TB GREEN试剂盒.CbpActin和AtActin分别为四倍体荠菜和拟南芥的内参基因.Realtime PCR程序: 95℃(10min);95℃(15s);60℃(1min),40个循环.根据程序导出CT值数据利用2-ΔΔCT获得相对表达量数据,每个样本3次生物性重复.Realtime PCR扩增基因对应引物详见表2.
表2 qRT-PCR引物表Tab.2 Primers used for qRT-PCR
以拟南芥CaCA家族成员的氨基酸序列为参考,从phytozome数据库中鉴定到两个二倍体荠菜C.rubella和C.grandiflora中各有12个CaCAs基因成员,从全基因组重测序数据[8]中鉴定到四倍体荠菜中有23个CaCAs基因成员.二倍体荠菜C.rubella中的CaCA蛋白家族称为CrCaCAs、C.grandiflora中的称为CgCaCAs、C.bursa-pastoris中的称为CbpCaCAs.参照进化树上模式植物拟南芥的CaCAs成员的位置,将拟南芥、二倍体荠菜(C.rubella和C.grandiflora)以及四倍体荠菜中所有CaCAs成员分为4个基因簇,分别为CAX、CCX、NCL和MHX基因簇,代表4个亚家族.
表3 拟南芥和荠菜在CaCA各亚家族的拷贝数分布情况Tab.3 Copy number distribution of Arabidopsis andCapsella in CaCA subfamilies
两个二倍体荠菜的基因拷贝数以及亚家族分布情况高度一致,CAX、CCX中各有5条序列,MHX和NCL中各有1条序列.四倍体荠菜中基因的拷贝数多于二倍体荠菜,在CAX中有10条序列,CCX中有9条序列,MHX和NCL中各有2条序列(表3).荠菜CaCAs基因的编码蛋白与拟南芥CaCAs在保守结构域的种类和排列上是相同的,均具有2个串联的Na_Ca_ex保守结构域(图1).荠菜与拟南芥共同的保守基序分析结果显示,同一亚家族共有一套保守基序,且保守基序的分布与CaCAs特征结构域Na_Ca_ex的分布相对应.此外,CaCAs在N端和两个保守结构域的间隔区段均存在50bp到100bp长度的可变区,除处于AtCAX2/AtCAX5/AtCAX6亚枝的序列在C端保守外,其余CaCAs成员均在C端也存在可变区(图1(b),图1(c)).
从荠菜CaCA各亚家族的分布情况可以看出,CrCaCAs相较于AtCaCAs在CAX家族中丢失了一个拷贝,在四倍体荠菜中CbpCaCA的拷贝数变化,并不是两个二倍体荠菜的简单加倍.为进一步探究荠菜中CaCAs拷贝数的变化,作者选了十字花科近亲杨柳科代表性物种毛果杨(Populustrichocarpa)、基部双子叶植物耧斗菜(Aquilegiacoerulea)和基部被子植物无油樟(Amborellatrichopoda)做为陆生植物的代表性物种对荠菜CaCA家族进行系统发育分析(图2).
从图2可以看出,与拟南芥相比3种荠菜在4个分支上都有拷贝数的变化,在AtCAX6分支上3种荠菜均丢失了一个拷贝,在AtCAX1和AtCCX3分枝上只有四倍体荠菜丢失了一个拷贝,在AtCAX5分枝也只有四倍体荠菜多了一个拷贝(表4),四倍体荠菜CaCAs基因在多个基因簇出现亚基因组基因的丢失或增加,
表4 荠菜CaCAs的拷贝数变异情况Tab.4 Copy number variation of theCaCAs in Capsella
这与四倍体荠菜两套亚基因组在进化上独立的结论一致[8].参考毛果杨基因的位置,可以推测CbpCaCAs的拷贝数变异发生在十字花科祖先加倍时期[31],即AtCAX1、AtCAX5/AtCAX6和AtCCX3分枝中均出现了十字花科祖先加倍后拷贝丢失的现象.鉴于四倍体荠菜形成时期较短且基因数量保守性较高,CbpCaCAs 13个亚枝中有4个亚枝出现拷贝数变异(3个隶属于CAX亚家族,1个隶属于CCX亚家族),推测CaCAs在四倍体荠菜中可能扮演了与环境适应有关的重要角色.
对荠菜和拟南芥全部CaCAs序列的保守基序的分析主要呈现了各亚家族内序列的保守性,但不足以显示序列间可能存在的分化情况.进一步分析荠菜中具有拷贝数变异的基因在保守基序和跨膜域结构上的变化,对拷贝数差异分支单独进行了保守基序分析,结果显示,AtCAX1亚枝中并没有出现四倍体荠菜特有的保守基序增加或缺失,而AtCAX5/AtCAX6分支中CbpCAX5a,CbpCAX5b和CbpCAX5c的N端“可变区”在四倍体荠菜种内是高度保守的,该区域存在两个特异于拟南芥及二倍体荠菜的同源保守基序(5号和7号).此外,该亚枝中的CbpCAX5c还缺失了一个其他同源序列共有的C端保守基序(4号)(图3(b)).
通过序列联配,发现在AtCAX5|AtCAX6基因簇中,5号基序是一段物种特异的插入序列,7号基序的增加是由在10号基序中插入的一段氨基酸序列造成的,4号基序的丢失是由一段12aa的片段丢失造成的(图3(b)).而CCX3亚枝中,四倍体荠菜成员CbpCCX3不存在特异的基序,相较于其他同源序列,它存在N端可变区且丢失了两个处于C端保守结构域的基序(3号和6号)(图3(c)),这两个基序的丢失同样也是由保守区段中氨基酸片段的插入或丢失导致的.此外,CbpCCX3特有一段N端非保守区.可以看出,发生拷贝数变异的CbpCaCAs蛋白由于多处短氨基酸片段的插入或丢失导致了与直系同源基因中保守的基序的差异,这些氨基酸片段的插入或丢失可能与转座事件有关,暗示了四倍体荠菜亚基因组拷贝数变异可能与转座子介导的基因片段的增加或丢失有关.
CaCAs为多次跨膜的膜定位蛋白,膜蛋白N端的序列差异可能对蛋白质结构产生影响.在拷贝数变异的各个分枝中,CbpCaCA蛋白的跨膜域结构也存在一定的变化.如AtCAX5/AtCAX6亚枝中,四倍体荠菜的3个拷贝在N端均为3个跨膜域,少于其同源序列的5个跨膜域,CbpCAX5c在C端只有3个跨膜域.CbpCAX5a,CbpCAX5b和CbpCAX5c和AtCCX3亚枝中的CbpCCX3在N端均存在一段较长的胞外域,但在其他同源序列中,N端肽段均定位在胞内.AtCAX1亚枝中,CbpCAX1在蛋白质序列上并没有发生分化,同样地,在跨膜结构上它也与其同源序列高度相似.对拟南芥CaCAs的研究表明,AtCAX家族蛋白质的N端为一段信号肽[32],且AtCAX家族基因的表达受到N端区域的调控[33],CbpCaCA蛋白N端亚细胞定位的差异可能对其表达和信号响应产生影响.
表5 发生拷贝数变异基因簇及其最近同源基因簇的理化性质Tab.5 Physical and chemical properties of gene clades with copy number variation and their homologous gene clades
鉴于荠菜CaCAs存在蛋白质序列和结构上的差异,本论文对相应蛋白质的理化性质进行了预测.结果显示,在氨基酸长度、分子量、等电点(pI)和平均亲水系数(GRAVY)4项指标上,在进化树中在同一个亚枝聚类的4个物种之间保守性较高,而不同亚枝之间存在明显的理化性质差异.在存在拷贝数变异的亚枝中,AtCAX5亚枝中的CbpCAX5a,CbpCAX5b和CbpCAX5c的氨基酸长度显著长于其亲本祖先,且其他指标也存在明显差异.而这3个拷贝内部也存在分化,其中CbpCAX5a和CbpCAX5b的所有指标均一致,而CbpCAX5c则呈现出更大的氨基酸长度、更高的等电点和更低的亲水系数.AtCCX3亚枝中仅有的一个CbpCCX3则更为特殊,它的氨基酸数目达942个,平均亲水系数仅为0.121(表5).由此可以看出,CbpCaCAs中出现的拷贝数变异的基因簇成员在蛋白序列结构和蛋白质性质上出现了不同程度的分化,这提示了发生拷贝数变异的基因簇可能存在表达和功能上的分化.
通过NCBI数据库检索,获得了二倍体荠菜C.rubella与四倍体荠菜的组织表达转录组数据(图5).与C.rubella在各个组织中的表达模式相比,CbpCaCA家族中与C.rubella同源的基因在组织表达上存在3种分化模式: 1) 与祖先亲本表达模式一致,这类基因有CbpCAX1、CbpCAX2r、CbpCAX4r、CbpCAX5a、CbpCAX5b、CbpCAX5c和CbpCCX4r;2) 与祖先亲本同为组成型表达,但在各组织的表达分布出现差异,这类基因有CbpCAX3r、CbpNCLr、CbpCCX5r和CbpMHX1r;3) 在祖先亲本中为组成型表达,而在四倍体荠菜中为组织特异性表达,这类基因有CbpCCX1r和CbpCCX2r.此外,虽然目前无法获得拷贝数增加的AtCAX5基因簇中3个CbpCaCA成员(CbpCAX5a、CbpCAX5b、CbpCAX5c)和拷贝数减少的AtCAX1基因簇成员CbpCAX1、AtCCX3基因簇成员CbpCCX3与祖先亲本的同源性关系,但作者通过组织表达数据发现,CbpCAX5a、CbpCAX5b和CbpCAX5c与CrCAX5的组织表达模式相似,均为组成型表达,且在花器官中表达量最高,在叶片中表达量最低.CbpCAX5a和CbpCAX5b的组织表达模式高度一致,与CbpCAX5c相比,CbpCAX5a和CbpCAX5b在各个组织表达量均偏低.CbpCAX1与CrCAX1的组织表达模式也非常相似,两者均为组成型表达,且在花器官和叶片中表达量较高.由此推测CbpCAX5a以及CbpCAX1是与C.rubella同源的拷贝.CbpCAX5a、CbpCAX5b可能来自C.orientalis.CbpCCX3与CrCCX3的表达模式存在明显差异,CbpCCX3为组成型表达,而CrCCX3仅在种子和花中表达,目前无法判断这种差异是同源基因的表达分化还是CbpCCX3继承自C.orientalis亲本导致的(图5).可以看出,CbpCaCAs在组织表达上的分化较为普遍.在未出现拷贝数变异的9组基因中,仅CbpCAX2r、CbpCAX4r和CbpCCX4r继承了祖先亲本的表达模式,60%的基因发生了分化.此外,这种分化在四倍体荠菜的两个亚基因组内是非常保守的,即与亲本C.orientalis同源的拷贝的组织表达模式与继承自C.rubella的拷贝高度一致,这进一步提示CaCAs在四倍体荠菜获得胜过其祖先亲本的环境适应性能力方面具有重要功能.
为探究四倍体荠菜拷贝数变异基因与其环境适应性之间的关系,检测了四倍体荠菜与拟南芥的抗冷性差异.将拟南芥和四倍体荠菜正常生长4周的幼苗置于4℃冷驯化后在-5℃进行冷冻处理,冷驯化后的拟南芥幼苗出现了叶片边缘萎蔫,叶片颜色发紫等低温损伤表型,而四倍体荠菜仅出现了叶片蜷曲的现象;冷冻处理后的拟南芥叶片为深绿色,且严重失水皱缩,荠菜叶片颜色轻微加深,但叶片没有明显的皱缩现象.在恢复22℃生长4d后,拟南芥已完全枯萎,而荠菜幼苗恢复正常生长,叶片颜色也恢复到嫩绿状态(图6(a)).存活率统计结果显示,冷冻处理后荠菜存活率为48%,显著高于拟南芥的9.8%(图6(b)),荠菜的抗冻性显著强于拟南芥.
将拟南芥和四倍体荠菜经1、3、6、12h时间梯度4℃冷处理后,对四倍体荠菜拷贝数变异基因簇及其临近基因簇中的拟南芥和四倍体荠菜CaCAs基因进行了表达量检测.结果显示,拟南芥AtCAX1、AtCAX2、AtCAX3和AtCCX4均有不同程度的冷响应表达上调情况,而四倍体荠菜中,仅有CbpCAX5a和CbpCAX5b在冷处理后上调,且在处理1h后即达到峰值(图6(d)),在拟南芥中的同源基因AtCAX5和AtCAX6均对冷处理没有响应,CbpCaCAs与拟南芥相比,对冷刺激的响应模式发生了明显分化,AtCAX5亚枝中四倍体荠菜特异的拷贝数增加可能与其对冷响应的表达分化有关.
本研究对二倍体荠菜(C.rubella和C.grandiflora)以及四倍体荠菜(C.bursa-pastoris)的CaCA家族成员进行了鉴定,并通过系统发育分析获得了这3个荠菜物种的CaCAs成员在各个CaCAs亚家族的分布情况,以及与拟南芥CaCAs相比,荠菜CaCAs的拷贝数变化情况等.通过蛋白质序列及结构的分析,发现二倍体荠菜CaCAs在拷贝数分布、蛋白序列及结构等方面均与拟南芥保持了较高的一致性;而四倍体荠菜的CaCAs则在多个基因簇中出现了拷贝数变异,且这些拷贝数变异基因簇中的CbpCaCAs基因在序列保守性和蛋白质结构等方面与其同源的拟南芥及二倍体荠菜基因相比均发生了明显分化.在AtCAX1和AtCCX3亚枝中,CbpCaCAs各丢失了一个拷贝,在AtCAX5亚枝中,CbpCaCAs多出了一个拷贝,而与AtCAX5同源的AtCAX6亚枝则丢失了所有荠菜中的同源基因.由于四倍体荠菜的基因表达沉默、基因丢失及突变均继承自其祖先亲本,且存在亚基因组层面的倾向性[5],作者尝试通过染色体定位分析以及基因的结构和表达特征对拷贝数变异基因的来源进行分析.结果显示CbpCAX1在蛋白质序列保守性、蛋白质跨膜结构、理化性质和组织表达模式上均与CrCAX1一致,而CbpCCX3与CrCCX3相比,序列上出现了保守基序丢失,且N端肽段定位、蛋白质理化性质和组织表达模式均与CrCCX3不同,推测AtCAX1亚枝中与C.orientalis同源的拷贝发生了丢失,仅保留了与C.rubella同源的拷贝;而AtCCX3亚枝中,与C.rubella同源的拷贝发生了丢失,仅保留了与C.orientalis同源的拷贝,这可能与CAX1和CCX3基因在C.rubella和C.orientalis作为祖先亲本时期不同程度的基因沉默及变异水平有关.AtCAX5亚枝中CbpCaCAs的3个拷贝在组织表达上均与CrCAX5相似,CbpCAX5a与CbpCAX5b在序列、结构和组织表达层面均十分相似,且与C.rubella中的同源基因CrCAX5存在明显差异,而CbpCAX5c序列和结构与CrCAX5明显不同,且与CbpCAX5a和CbpCAX5b也存在差异.染色体定位表明CbpCAX5a,CbpCAX5b和CbpCAX5c均不存在串联关系,以上结果使得AtCAX5亚枝中CbpCaCAs拷贝数变异的来源存在多种可能.鉴于scaffold水平的定位结果显示CbpCAX5a和CbpCAX5c的距离较近(gtt注释编号MPGU01000286.1;MPGU01000581.1),而CbpCAX5b(gtt注释编号MPGU01006706.1)与CbpCAX5a和CbpCAX5c的距离较远,推测CbpCAX5c是与C.rubella同源的拷贝,CbpCAX5b是与C.orientalis同源的拷贝,CbpCAX5a可能是CbpCAX5c自身加倍后保留的拷贝,这需要定位到染色体水平的序列拼接结果来支持.
组织表达数据表明,虽然CbpCaCAs亚基因组之间的表达是保守的,但与祖先亲本相比,CbpCaCAs的同源基因在组织表达上的分化较为普遍.此外,Kasianov等通过转录组数据分析认为四倍体荠菜在胁迫响应上的表达与拟南芥基因具有很高的一致性,在冷响应方面,在四倍体荠菜的1322个拟南芥COR家族同源基因中,99%的基因出现了上调,且60%基因的表达与拟南芥同源基因一一对应[8].本研究对四倍体荠菜和拟南芥CaCAs成员的冷响应研究发现,CaCAs在这两个物种中对冷刺激的响应出现了明显分化: 在拟南芥中冷响应上调的CAX1、CAX2、CAX3和CCX4基因在四倍体荠菜中均没有响应,而拟南芥中对冷信号没有响应的CAX5基因则在四倍体荠菜中出现了应激响应,这提示在四倍体荠菜中,CaCAs的逆境响应模式发生了偏倚.
四倍体荠菜作为一个近期形成的物种,其受“亲本继承”模式以及松弛的进化选择影响[5],基因退化、丢失和表达分化现象均非常少见.本研究通过生物信息学和表达谱研究,发现CaCAs在四倍体荠菜中出现了较为特殊的拷贝数变异和表达分化,提示CaCAs可能在四倍体荠菜获得环境适应优势的过程中起到重要作用.此外,目前仍缺乏四倍体荠菜和其母本祖先C.orientalis的染色体水平全基因组测序数据,以上数据的获得将有助于深入分析CbpCaCAs的拷贝数变异来源,进一步解释四倍体荠菜的多倍化过程对其环境适应性的影响.