巩文靓,康雪蒙,马梦影,段海燕*,姜恭好*
(1.黑龙江大学生命科学学院,黑龙江哈尔滨150080;2.黑龙江大学农业资源与环境学院,黑龙江哈尔滨150080)
亚麻(Linum usitatissimum.L)是亚麻科亚麻属一年生草本植物,是在世界范围内广泛栽培的经济作物,我国新疆、黑龙江、内蒙古等多地均有种植。根据用途,可将亚麻分为油用亚麻、纤维用亚麻和油纤兼用三种。油用亚麻又称胡麻,是我国五大油料作物之一。亚麻籽油中含有大量α-亚麻酸、亚油酸和木酚素等,目前越来越多地被应用于医疗保健领域。亚麻纤维具有强韧、柔细、吸湿、透气等优良性状,早在约3万年前即被用于纺织[1-2]。在麻类纺织纤维贸易中,亚麻占比超过70%[3]。除食品、医疗保健和纺织外,亚麻在其他领域同样具有很高的经济价值。亚麻饼粕中粗蛋白质和总磷含量高,可作为家禽饲料使用[4];亚麻籽油可作为保湿剂和调理剂添加到护肤和护发产品中[5];亚麻屑可用作杏鲍菇的栽培主料,并能使出菇期缩短[6];亚麻对重金属有较强的耐受能力和吸附能力,可用于重金属污染土壤的修复治理[7]等。
随着分子标记技术的飞速发展,SSR、SNP、RFLP、SRAP等分子标记越来越多地被应用于亚麻遗传连锁图谱的构建和数量性状位点(quantitative trait loci,QTL)定位中。亚麻的多数农艺性状,如品质、产量、抗病性等,均由QTL控制,因此利用分子标记快速高效地进行高密度遗传连锁图谱构建和重要农艺性状QTL定位逐渐成为亚麻育种研究中一个重要方向。此外,由于效率高、构建群体所需时间短等优点,利用全基因组关联分析(genome-wide association study,GWAS)定位QTL也越来越受到研究者的青睐。至2015年,我国已成为亚麻籽第二进口国[8],亚麻纤维第一进口国[3],加快亚麻育种速度,丰富亚麻优良种质资源,将有助于缓解我国亚麻产需缺口不断扩大的现状。
遗传连锁图谱(genetic linkagemap)是根据连锁的遗传标记间的重组频率确定其相对位置所得到的线性排列图,是QTL定位的重要依据,也是分子标记辅助育种的有力工具之一。
用于构建遗传连锁图谱的群体分为暂时性分离群体和永久性分离群体两大类。F2群体是暂时性分离群体中最为常用的作图群体,因其省时省力的特性而被广泛用于构建遗传图谱。但F2群体中的杂合子要求研究者尽量使用共显性标记才能区分群体基因型,并且F2群体很难保持遗传结构,这两个缺点使得F2群体无法成为作图群体的最佳选择,因此研究者越来越倾向于使用双单倍体(doubled haploid,DH)群体和重组自交系(recombinant inbreed lines,RIL)群体等永久性分离群体。尽管永久性群体遗传结构稳定,但DH群体构建过程复杂,RIL群体构建耗时长,因此目前已有的亚麻遗传图谱仍有半数以上是基于F2群体构建的(见表1)。
2000年,OH等[9]利用RFLP和RAPD标记构建了包含15个连锁群、覆盖总长度为1000 cm的遗传图谱。然而RAPD标记的稳定性和重复性不甚理想,因此近十年构建的亚麻遗传图谱大多数使用数量丰富、可重复性好的SSR标记。此外,高通量测序技术,尤其是简化基因组测序技术的发展为亚麻高密度遗传图谱的构建带来了极大便利。2017年,Yi等[10]基于SLAF-seq技术构建出包含4145个SNP标记和15个连锁群、标记间平均距离仅为0.64 cm的高密度遗传图谱。Wu等[11]在2018年利用SLAF标签进行遗传图谱构建,得到总长度为1483.25 cm、标记间距为0.63 cm的遗传连锁图谱,是目前密度最高的亚麻遗传连锁图谱。
表1 亚麻遗传连锁图谱构建情况Table 1 Construction of genetic linkagemaps of flax
续表1
油用亚麻主要农艺性状包括产量相关性状,如种子产量、千粒重、单株果数、单株粒重、单果粒数等,以及亚麻籽品质相关性状,如粗脂肪、亚麻酸、亚油酸、硬脂酸、油酸等。Cloutier等[13]利用SSR标记定位到与亚麻酸、亚油酸、碘值、棕榈酸相关的QTL共7个,其中,与亚麻酸相关的2个QTL分别解释了25%和约20%的表型变异;与亚油酸相关的2个QTL解释了约54%的表型变异;与碘值相关的QTL有2个,分别解释约29%和13%的表型变异;与棕榈酸相关的1个QTL解释表型变异率约为42%。姜硕[16]基于SRAP标记检测到4个与下部分枝相关的QTL,14个与上部分枝相关的QTL,以及与百粒重相关的8个微效QTL。Kumar等[19]定位到与粗脂肪、蛋白质含量、亚麻酸、棕榈酸相关QTL各1个;亚油酸、碘值相关QTL各2个;硬脂酸、油酸相关QTL各3个。除亚麻籽品质性状对应QTL外,还鉴定到与产量、每果粒数、千粒重、成熟期性状相关QTL各1个。Chandrawati等[20]检测到1个分枝数相关QTL,解释4.64%的表型变异;3个单株果数相关QTL,分别解释6.92%、6.27%、1.49%的表型变异;1个单株粒重相关QTL,解释表型变异率为10.3%;2个每果粒数相关QTL,分别解释11.1%和12.75%表型变异;2个粗脂肪相关QTL,解释表型变异率分别为0.84%和8.39%。Wu等[11]定位到3个与种子产量相关的QTL,解释表型变异率为10.11%~19.33%。高凤云[22]利用简化基因组SLAF测序技术开发SNP标记,检测出与单株果数、果粒数、单株粒重、油酸相关QTL各1个;分枝数、硬脂酸相关QTL各2个;棕榈酸相关QTL3个;亚麻酸、千粒重相关QTL各4个;亚油酸、粗脂肪相关QTL各5个。
纤维相关性状主要包括株高、工艺长度、纤维含量、原茎重等。姜硕[16]利用复合作图法检测出1个与茎粗相关的微效基因;3个与株高相关的具有加性效应的QTL;4个与工艺长度有关的QTL;3个与主茎原茎重相关的主效基因;3个表现出显性效应的与主茎纤维重相关的QTL;与纤维含量相关的3个主效基因和1个微效基因。Kumar等[19]定位到与原茎重和细胞壁相关的QTL各1个,对表型的解释率分别为30%和14%。Chandrawati等[20]定位到2个与株高相关的QTL,其中1个解释了15.23%的表型变异。高凤云[22]检测到3个与株高相关的QTL,包括1个加效基因和2个减效基因;此外还检测到3个与工艺长度相关的QTL,包括2个加效基因和1个减效基因。宋夏夏[23]通过基因组重测序初步确定10个与株高相关的QTL,并通过结合传统QTL定位方法,确定其中1个为株高主效基因。Wu等[11]对亚麻纤维相关的性状进行QTL定位,分析得到1个与株高相关的QTL,解释了18.77%的表型变异;1个与工艺长度相关的QTL,表型解释率为11.17%;3个与原茎产量相关的QTL,解释表型变异率范围为10.91%~15.81%;2个与纤维产量相关的QTL,分别解释19.09%和25.98%的表型变异;2个与纤维含量相关的QTL,分别解释15.14%和13.27%的表型变异。Zhang等[21]构建了一张整合图谱,并利用其定位到与株高和工艺长度相关的共19个QTL,其中5个QTL为两个性状共用。
亚麻的主要病害包括锈病、白粉病、枯萎病、派斯莫病等10余种[24],其中大部分由真菌侵染所引起。这些病害可导致亚麻的品质受损和产量降低,严重影响其经济效益,但关于亚麻抗病害的QTL定位研究相对较少。Spielmeyer等[12]定位到2个与枯萎病抗性相关的QTL,这也是亚麻最早定位到的QTL,其表型解释率分别为38%和26%。Asgarinia等[18]利用SSR标记构建遗传连锁图谱并定位到3个与抗白粉病相关的QTL,共解释了97%的表型变异。
除上述重要农艺性状外,还有一些其他农艺性状相关QTL被定位。Cloutier等[13]鉴定出2个与种子颜色相关的QTL,其中,与亮度相关的QTL解释了72%的表型变异,与黄色色度相关的QTL解释了79%的表型变异。姜硕[16]定位到与初花日数相关的13个QTL,9个与花色相关的QTL,7个与裂果相关的QTL。Sudarshan等[25]定位到1个与花色和种皮颜色相关的基因“D”,并对其相关代谢机理进行了研究。
GWAS又称关联作图,区别于传统QTL原理,GWAS是基于连锁不平衡的原理鉴定目标性状候选基因。随着高通量测序技术不断成熟、成本不断下降,GWAS定位QTL的成本也不断降低。GWAS通常选择自然群体作为材料,因此相对传统QTL定位要求的遗传群体所需的构建时间更短。此外,GWAS还具有效率高、精度高等优点,因此越来越多的研究者倾向于利用GWAS来定位QTL。
近5年来,GWAS在亚麻的农艺性状QTL研究中也得到了应用。Soto-Cerda等[26]2014年对390份加拿大亚麻核心种质材料进行关联作图,确定了与6个农艺性状关联的12个标记位点,其中位于LG6的两个标记位点确定了与抗倒伏相关的1个QTL。随后,Soto-Cerda等[27]又通过关联作图鉴定出与粗脂肪、硬脂酸、亚油酸、亚麻酸、碘值5个种子品质性状相关的9个QTL。2018年,Soto-Cerda等[28]利用200份亚麻种质材料针对亚麻籽粘质物含量(mucilage content,MC)和亚麻籽壳含量(hull content,HC)两个性状进行GWAS,利用GLM-PCA模型进行分析,鉴定出分别与两个性状相关联的12个和17个SNP位点,确定了与MC相关的7个QTL和与HC相关的4个QTL,并参考拟南芥的相关基因信息预测了几个候选基因。
Xie等[29]利用SLAF-seq技术对224份核心亚麻种质进行GWAS,首先鉴定出与株高、工艺长度、分枝数、单株果数、千粒重相关的SNP位点共42个,并利用GLM和MLM模型在这些SNP位点的10 kb范围内筛选出15个候选基因,确定UGT和PL为株高的候选基因,GRAS和XTH为分枝数的候选基因,Contig1437和LU0019C12为单株果数的候选基因,PHO1为千粒重的候选基因。随后又对13个农艺性状进行分析,利用EMMAX模型鉴定出与油6个农艺性状相关的16个SNP位点,并预测了棕榈酸和亚油酸的候选基因;利用GLM模型检测出与纤维相关性状相关联的几个位点,预测了出麻率和株高的候选基因;利用转录组分析预测了粗脂肪和千粒重的候选基因[30]。此外,Xie等[31]还通过GWAS检测到与亚麻籽脂肪酸含量相关的16个SNP位点,并结合RNA-seq分析和比对KEGG数据库,在10个候选基因中筛选出包含在重要脂肪酸代谢途径中的6个候选基因。
You等[32]利用GLM和MLM模型在260个亚麻品系中共鉴定出33个QTL,包括种子产量相关QTL 1个,粗脂肪相关QTL 8个,株高相关QTL 5个,棕榈酸相关QTL 4个,碘值、亚油酸、亚麻酸相关QTL各3个,成熟期、硬脂酸相关QTL各2个,蛋白质含量、油酸相关QTL各1个,其中粗脂肪、碘值、棕榈酸、亚油酸、亚麻酸相关QTL解释了48%~73%的表型变异。He等[33]对370份亚麻核心种质材料进行GWAS分析,鉴定到67个与抗派斯莫病相关的QTL,解释了总变异的32%~64%。伊六喜等[34]以269份亚麻种质材料为GWAS分析对象,得到与木酚素含量相关的13个SNP位点,并预测了21个候选基因。
截至目前,已发表的亚麻遗传连锁图谱已有十余张,其中不乏高密度遗传图谱,但多数图谱是基于F2等临时群体构建的,在可靠性、可重复性以及检测微效基因的能力方面存在一定的缺陷。因此今后的研究中,应尽量采用RIL、DH等永久群体。此外,为满足精细作图的需求,研究中还应增加次级作图群体如残留异质系(residual heterozygous lines,RHLs)群体和近等基因系(near isogenic lines,NILs)群体的构建。
利用GWAS定位作物QTL的方法相对于传统QTL定位方法虽然有一定优势,但同时也存在假阳性等问题。对此,可采用传统QTL作图与GWAS结合的方式,或采用构建同时具有连锁分析和关联作图优点的复杂群体如巢式关联作图(nested association mapping,NAM)群体等方式。
尽管亚麻相当一部分性状由QTL控制,但相对于水稻等作物来说,亚麻QTL的研究数量仍然较少。You等[35]整合了目前为止发表的13篇英文文献中的297个亚麻QTL,并成功地将195个QTL映射到同一套假染色体上,这无疑为后续的QTL定位、功能分析以及相关育种工作提供了便利。目前鉴定的QTL中以油用亚麻性状相关QTL为主,其次是纤维相关性状QTL,与抗逆性相关的QTL较少,仅有与抗白粉病、抗派斯莫病、抗枯萎病相关的QTL,更多的抗逆性相关QTL以及其他重要农艺性状相关QTL仍有待于发掘。
此外,亚麻遗传连锁图谱的构建及后续QTL定位旨在加速优化亚麻育种进程,但基于这些研究的后续应用为数尚少。目前亚麻已定位到油用性状、纤维相关性状、抗病性状等农艺性状的QTL,但相关的基因克隆、基因功能验证及优良基因遗传转化等工作仍需进一步研究。