吴嫚,李龙云,裴文锋,Zhang Jinfa,于霁雯*
(1.中国农业科学院棉花研究所/ 棉花生物学国家重点实验室郑州大学研究基地,河南安阳455000;2.Department of Plant and Environmental Science,New Mexico State University,Las Cruces,NM 88003,USA)
棉花是我国重要的经济作物,棉纤维是重要的天然植物纤维[1]。 马克隆值是衡量棉纤维品质的重要指标之一,它综合反映了纤维的粗细程度和成熟度, 三者与棉纺工艺设备的清杂效率、棉纱外观品质、棉纱强力和可纺性有密切关系[1-3]。因此,合理的原棉马克隆值是提高纺纱质量的基础[4]。因此,从分子水平筛选并鉴定调控棉纤维发育的关键因子,对棉花品质分子育种和解析棉纤维发育的分子机制具有重要的理论价值。
棉纤维细胞由胚珠外珠被单个细胞分化而来,是高等植物中伸长最快、合成纤维素最多的模式单细胞[5]。 其分化和发育过程可分为4 个时期:纤维发育的起始期、伸长期、次生壁增厚期和成熟期。 棉纤维细度、成熟度和马克隆值主要受纤维次生壁形成特性的影响。 棉纤维细胞的次生壁增厚是1 个复杂的生理过程,涉及细胞壁的松弛,液泡膨压的反作用力,膜脂、细胞壁成分和相关蛋白的生物合成及运输过程,受到许多基因的表达调控[6-8]。 迄今,已有一些相关的遗传和数量性状位点(Quantitative trait locus,QTL)定位的报导[9-16]。 Yu 等[17]以陆地棉 SG747 和海岛棉 Giza75为亲本,构建回交近交系BIL 群体,在5 个环境下检测到8 个马克隆值QTLs, 解释表型变异7.16%~17.57%,分布于 1、9、12、14、16、18、19 和24 号染色体。徐鹏等[18]以二倍体棉花Gossypium klotzschianumL.为供体亲本,以陆地棉Simian2为轮回亲本, 构建染色体片段代换系BC2F4群体, 检测到2 个与马克隆值相关的稳定的QTLqFMIC-7-1 和qFMIC-7-2, 最高解释9.0%表型变异率。 Shang 等[19]以 GX1135 和 GX100-2g 为亲本构建了 1 个 RIL 群体, 检测到 4 个马克隆值QTLs,其中qFM-chr19-1 在多个环境下被检测到。但目前利用QTLs精细定位方法获得的棉纤维发育相关基因还比较少。 基因芯片是大规模分析基因表达谱的有效手段之一, 它能够同时检测几万个基因的转录水平, 由此可以检测不同条件下差异表达的基因,了解这些基因的表达调控和功能[20-23]。近年来, 美国Affymetrix 的棉花基因组芯片已被广泛应用于棉花基因表达谱的分析[24-31]。Gilbert 等[32]利用Affymetrix 公司的棉花寡聚核苷酸芯片对2个Li2近等基因系Li2Li2和li2li2的纤维 (3、12 和16 DPA)进行了基因富集和代谢途径分析,发现乙烯生物合成和初生细胞壁合成过程参与了棉纤维的发育过程。 Wu 等[33]利用 Affymetrix 公司的棉花基因芯片对棉花皮棉产量存在显著差异的两组回交近交系进行分析, 并结合QTLs 共定位和SSCP 分析获得了3 个与皮棉相关的SNP位点。 Wu 等[34]利用 Affymetrix 公司的棉花基因芯片对棉纤维长度性状存在显著差异的两组回交近交系进行差异表达基因分析,并结合荧光定量PCR(Polymerase chain reaction)发现类动蛋白和过氧化物酶2 个基因与纤维发育存在密切关系。 Hande 等[35]利用 Affymetrix 公司的棉花基因芯片对棉花突变体Fl 和野生型0 DPA 和10 DPA进行分析发现 AP2-EREBP、C2H2、C3H、HB 等参与了棉纤维细胞伸长过程。 虽然到目前为止,已经利用基因芯片或者RNA-seq 等技术筛选获得了大量与纤维发育相关的基因,但利用2 个马克隆值存在显著差异的回交近交系研究棉纤维发育相关基因目前还比较少。
本研究选用马克隆值差异较大的2 个回交近交系NMGA-140 和NMGA-051, 利用基因芯片比较两者间开花后10 DPA 发育纤维中的转录表达谱,旨在筛选和鉴定棉纤维发育相关的差异表达基因,为棉纤维发育关键候选基因的克隆和功能验证提供丰富的基因资源。
试验地点位于河南省安阳县白璧镇中棉所试验基地进行(36o06'N,114o21'E),室内试验在安阳市中国农业科学院棉花研究所棉花生物学重点实验室进行。
海陆高世代回交自交系(Backcross introgression line,BIL)群体引自 Yu 等[17]。 利用 SAS 软件对海陆高世代BILs 群体2006―2008 年纤维品质数据进行Duncan Grouping 显著性分析, 从中选择马克隆值最大的材料NMGA-140 (马克隆值:6.2)和马克隆值最小的材料NMGA-051(马克隆值:4.0)。 开花当天对棉铃进行挂牌标记,选取 5、10、15、20、25 DPA 棉铃,剥取纤维后迅速浸入液氮速冻,保存在-80℃冰箱中备用。 同时采集了叶、花瓣和蕾,处理方法同上。 每个样品取3个生物学重复。
1.3.1RNA 提取和质量检测。利用改良的CTAB法提取棉纤维样品(5、10、15、20 和 25 DPA)及不同组织部位(叶、花、蕾)的总 RNA[36]。 每个样品 3个生物学重复分开提取RNA。 用1.5%琼脂糖凝胶电泳检测总 RNA 的 28S 和 18S rRNA 比例,以评估总RNA 的完整性及纯度。 利用DU800 核酸 / 蛋白质分析仪 (Beckman Coulter,Brea,CA,USA)检测RNA 的质量和浓度。
1.3.2基因芯片的制备及差异表达基因的筛选。GeneChip○R棉花基因组芯片购自美国 Affymetrix公司,基因芯片杂交及分析由上海晶泰生物技术有限公司完成。 每个样品3 个生物学重复混合成1 个RNA 池,反转录成cDNA 与芯片杂交,用高分辨率扫描仪GeneChip Scanner 3000 对染色后的芯片进行扫描。 然后利用GeneChip Operating Software (GCOS),使用 MAS5 方法进行数据均一化,综合考虑PM 和MM 探针的信号值来判定基因的表达情况和变化情况[29]。
1.3.3差异表达基因的功能预测。利用COG 库(Clusters of orthologous groups)和 COGNITOR程序(http://www.ncbi.nlm.nih.gov/COG/)对筛选出的差异表达基因进行功能预测分析。
1.3.4qRT-PCR。利用 AMV 反转录试剂盒将RNA 合成cDNA(普洛麦格北京生物技术有限公司)。 从差异表达基因中随机挑选2 个上调基因和2 个下调基因, 使用Oligo 软件设计引物 (表1),以看家基因18S rRNA 为内参对照,利用Go-Taq qPCR Master Mix(普洛麦格北京生物技术有限公司) 在荧光定量PCR 仪Roche Light Cycler 480(Roche 公司)进行 qRT-PCR 分析。 引物合成由上海英骏生物技术有限公司完成。 数据分析采用双标准曲线法分析2 个材料间的相对表达量:F=(样品1 目的基因浓度/ 样品 1 看家基因浓度)/(样品2 目的基因浓度/ 样品2 看家基因浓度)。 每个样品qRT-PCR 设置3 个生物学重复。
表1 实时荧光定量PCR 所用基因及其引物序列Table1 Gene Primers for quantitative RT-PCR analysis
对NMGA-140 与NMGA-051 的纤维长度、马克隆值、断裂比强度、伸长率、整齐度指数的平均值进行t测验,检验材料间差异的显著性。纤维品质包括2006 年安阳4 个点和 2007 年安阳2个点共6 个点的数据。 根据双尾t测验的结果,NMGA-140 与 NMGA-051 的纤维长度、马克隆值、断裂比强度、整齐度指数都达到差异显著水平,其中纤维长度和马克隆值达到了极显著水平(表2)。 这说明以马克隆值存在显著差异的NMGA-140 与NMGA-051 筛选到的差异表达基因在纤维发育过程中对纤维长度和纤维强度性状可能也存在潜在的影响。
表2 NMGA-140 和NMGA-051 纤维品质性状差异Table 2 Fiber quality traits difference between NMGA-140 and NMGA-051
本研究参考李龙云等[29]对基因芯片数据的质控评估验证方法。 从NMGA-140 与NMGA-051芯片杂交实验质控评估结果来看,各项芯片实验参数满足Affymetrix 质量控制标准。 其一,芯片平均杂交背景信号值低于50,满足不大于100 的标准;其二,芯片上不存在大于芯片面积2.5%的痕迹;其三,RPT 文件(.rpt)所列的芯片上的内参基因中至少有1 个基因, 其3'端的探针集合的杂交信号不超过其5'端探针集合的杂交信号的3 倍。
从图1 中可以看出 NMGA-140 与 NMGA-051 中基因表达量的比例信息和信号强度的关系。在基因表达谱的散点图上,每1 个点表示1个基因。 散点图中共有8 条斜线,平行对称分布着 2 倍、3 倍、10 倍、30 倍 Fold change lines,它们由 上 至 下 分 别 为 30、10、3、2、-2、-3、-10和-30。 图1 结果显示基因表达谱中基因分布较为分散,2 和-2 线外存在大量的信号信息(NMGA-051 和 NMGA-140 信号比值为±2),表明通过分析比较2 张芯片得到了大量的差异表达基因。 棉花基因组芯片共有24 029 个探针组成,从表2 中可以看到NMGA-140 中有13 198 个探针信号检测到(55%),NMGA-051 中有 13 736 个探针信号检测到(57%)。NMGA-051(马克隆值4.0)比NMGA-140(马克隆值6.2)检测到了更多的探针信号。 根据 ratio>2.0 和 ratio<0.5 的标准,通过分析比较NMGA-140 和NMGA-051 共筛选得到2 655 个差异表达基因, 其中1 765 个基因在NMGA-140 中高表达, 而 890 个基因在 NM-GA-051 中高表达。
图1 NMGA-140 与NMGA-051 基因芯片杂交信号散点图Fig.1 Scatter Graph of NMGA-140 and NMGA-051
表2 芯片杂交结果Table 2 Results of Single Array Analysis
利用COG 数据库对在NMGA-140 和 NMGA-051 的差异表达的2 655 个基因进行了功能分类,根据所参与的代谢过程分为23 类(图2)。这些差异表达的基因中功能预测基因(15.57%)和翻译、核糖体结构与生物合成相关基因(13.54%),翻译后修饰、蛋白质转换、分子伴侣相关基因(9.31%)是3 个主要的分类。 在这些基因中根据P值和Signal Log2Ratio 以及前人的研究结果挑选了24 个可能在纤维发育过程中起到重要作用的基因。
为了进一步通过实时荧光定量PCR 验证芯片数据的可靠性, 随机挑选了4 个差异表达显著的基因(ΔP<0.001;Log2ratio>1.5 即差异表达倍数大于3)进行实时荧光定量PCR 的检测(2 个上调基因,2 个下调基因)(表 4)。
图2 差异表达基因的功能分类Fig.2 Functional groups of the Significantly differentially expressed genes
表3 基因芯片中差异表达倍数高以及与细度发育相关的基因Table 3 Significantly and fiber micronaire-related differentially expressed genes
从图 3 中可以看出,β-tub1 基因在 NMGA-140 和 NMGA-051 的纤维、叶、花和蕾中的表达趋势基本相同,都是在纤维中的表达量最高,在蕾中的表达量最低,由此可见β-tub1是纤维特异表达基因, 推测可能与纤维发育相关 (图3A)。β-tub10基因在马克隆值较小的材料NMGA-051纤维中的表达量是最高的, 且显著高于马克隆值较大的材料NMGA-140(图3B)。从图3 中可以看出, 通过在NMGA-140 和NMGA-051 中不同组织中分析TUA7 基因的表达量, 发现TUA7基因不是纤维特异表达基因 (图 3C)。Ghi.3578.1.S1_s_at是一个差异表达倍数较高的未知功能基因 (Log2 ratio=4.8), 其在马克隆值较大的材料NMGA-140 蕾中表达量最高, 在马克隆值较小的材料NMGA-051 中在纤维中表达量最高 (图3D)。
从图 4 中可以看出,β-tub1基因在 NMGA-140 和NMGA-051 中5 DPA 时的表达量均极低,后上升至到10 DPA。 在马克隆值较小的材料NMGA-051 中,其继续上升,至15 DPA 达到最高点,至20 DPA 时持续下降;而在马克隆值较大的材料NMGA-140 中,15 DPA 时下降到最低值,后急速上升,20 DPA 达到最高值,然后到25 DPA 持续下降。两个材料在纤维发育10、15、20 DPA 时达到差异极显著水平 (图 4A)。β-tub10基因在NMGA-051 中,5 DPA 时表达量开始上升,10 DPA 时达到最高点, 后至20 DPA 持续下降,到 25 DPA 时又有所回升; 在 NMGA-140 中,β-tub10基因表达量开始时上升,而后直至15 DPA持续下降,后持续上升,25 DPA 时达到最大值。 2个材料在纤维发育 10、15、20、25 DPA 时达到极显著差异水平(图 4B)。 由此可见,β-tub10基因与棉纤维发育密切相关。 对TUA7 基因进行不同纤维发育时期表达量分析发现在NMGA-051 中,5 DPA 的表达量最高,10―25 DPA 表达量逐渐下降; 在 NMGA-140 中,5―15 DPA 表达量逐渐上升,到15DPA 时达到最高,而25 DPA 持续下降。2 个材料 10、20 DPA 达到了显著差异水平 (图4C)。 不同发育时期表达量分析发现Ghi.3578.1.S1_s_at基因 在 NMGA-140 和 NMGA-051 中均在 5 DPA 表达量最高, 10―25 DPA 在 NMGA-051 和 NMGA-140 中表达量逐渐下降 (图4D)。
通过对β-tub1、β-tub10、TUA7和未知功能基因Ghi.3578.1.S1_s_at4 个差异表达基因进行不同组织部位和不同发育时期的实时荧光定量PCR发现,β-tub1、β-tub10基因和Ghi.3578.1.S1_s_at可能参与了棉纤维发育过程, 有待进一步进行功能验证。同时,分析结果也发现基因芯片和实时定量PCR 的检测结果一致,说明芯片数据具有生物学意义上的可重复性,结果可靠。
表4 基因芯片中与纤维发育相关差异表达明显的基因Table 4 Significantly and fiber-related differentially expressed genes for qRT- PCR
马克隆值是评价棉花纤维品质好坏的指标之一,直接影响棉纤维的加工和最终产品的质量。细纤维可使更多的纤维纺入纱线,从而使纱线更强,纺织时间更短。因此,棉纤维细度性状的改良已经成为当前棉花纤维品质遗传改良工作的研究热点。本研究在已有的回交近交系(BIL)群体中选取马克隆值最大的材料NMGA-140 (马克隆值6.2)和马克隆值最小的材料NMGA-051 (马克隆值4.0), 利用Affymetrix 基因芯片技术分析比较了NMGA-140 和NMGA-051 的基因表达谱,通过实时 荧 光 定 量 PCR 对Ghi.3578.1.S1_s_at、TUA7、β-tub1、β-tub10进行了不同组织部位和不同发育时期表达量分析, 为以后纤维发育相关基因克隆及功能验证提供了重要参考。
图3 4 个基因在不同组织器官中的实时荧光定量PCR 结果Fig.3 qRT-PCR results of four genes in different tissues
图4 4 个基因在棉纤维不同发育时期的实时荧光定量PCR 结果Fig.4 qRT-PCR results of four genes in fiber development
芯片杂交试验的可靠性验证是利用芯片开展相关研究工作的重要环节之一。 本研究从基因芯片数据的质控评估和差异表达基因的实时荧光定量PCR 检测2 个方面验证了芯片结果的可靠性。从NMGA-140 与NMGA-051 芯片杂交实验的平均杂交背景信号、内参基因等质控评估结果来看,各项芯片实验参数满足Affymetrix 质量控制标准。 从Ghi.3578.1.S1_s_at,TUA7,β-tub1,β-tub104 个差异表达基因纤维发育10 DPA 实时荧光定量 PCR 结果来看,β-tub1和TUA7在 NMGA-140中的表达量显著高于NMGA-051,说明β-tub1和TUA7基因的表达量越高, 纤维马克隆值越大;β-tub10和Ghi.3578.1.S1_s_at在 NMGA-051 中的表达量高于NMGA-140, 说明β-tub10和Ghi.3578.1.S1_s_at的表达量越高, 纤维马克隆值越小。以上与基因芯片杂交试验检测结果一致,说明本研究芯片数据具有生物学意义上的可重复性,结果可靠。
微管(microtubule)是真核细胞中几种主要的细胞质骨架纤丝之一, 它的主要结构成分是微管蛋白 (tubulin), 在纤维发育过程中发挥着重要作用。 在棉纤维细胞中, 迄今己经识别出了9 种α-tubulin和 7 种β-tubulin蛋白[37]。 Li 等[38]克隆了1 个β-tubulin基因GhTUB1, 在纤维发育快速伸长期 8DPA 优势表达; 而另 1 个β-tubulin基因Gh-BTubL在酵母中过量表达可以使酵母纵向伸长 1.7 倍多[38]。 刘迪秋等[39]通过分析 20 DPA 棉纤维构建的SSH 文库发现了 3 个β-tubulins, 并认为在20DPA 以后优势表达的β-tubulins可能特异地调控棉纤维的纤维素沉积[39]。 本研究利用基因芯片分析比较了马克隆值存在显著差异的两个陆海回交近交系, 并获得了两个微管蛋白基因β-tub1和β-tub10基因。 通过对其进行不同组织部位和不同时期表达模式分析发现,β-tub1基因在 NMGA-140 和 NMGA-051 的纤维中优势表达, 且纤维发育10 DPA 时在马克隆值较大的材料中表达量显著高于马克隆值较小的材料。 在纤维发育 10、20 和 25 DPA 时,β-tub1基因在马克隆值较大的材料中表达量显著高于马克隆值较小的材料。 结果表明β-tub1基因可能在纤维发育过程中负向调节棉纤维发育。β-tub10基因在马克隆值较小的材料NMGA-051 纤维中的表达量是最高的, 且显著高于马克隆值较大的材料NMGA-140。β-tub10基因在纤维发育早期 (5―15 DPA)在马克隆值较小的材料中表达量显著高于马克隆值较大的材料,纤维发育后期(20―25 DPA)在马克隆值较大的材料中的表达量显著高于马克隆值较小的材料。 结果表明β-tub10 基因可能在纤维发育快速伸长期正向调节棉纤维发育过程。 这与前人的研究结果相似[40]。Ghi.3578.1.S1_s_at是1 个未知功能基因,在马克隆值较小的材料纤维中表达量都最高,在NMGA-140 和NMGA-051 中均在5DPA 时的表达量最高, 从10―25 DPA 在2 个材料中表达量逐渐下降,推测该基因可能在早期对纤维发育起到一定的作用。 对以上3 个基因有待于后续实验的进一步进行功能验证。
本研究利用基因芯片分析比较了2 个马克隆值存在显著差异的陆海回交近交系, 通过实时荧光定量PCR 技术对筛选到的4 个差异表达基因进行了表达模式分析, 得到了与棉纤维发育密切相关的基因, 为今后棉纤维发育基因克隆和功能验证提供了丰富的基因资源, 也为棉纤维品质分子育种打下了良好的基础。