陆梦琪谢若涵李 想杨明冲何紫薇高 杰赵晓燕沈祥陵陈 燕王继斌,5胡利华段明政,*王令强,*
1亚热带农业生物资源保护与利用国家重点实验室 / 广西甘蔗生物学重点实验室 / 广西大学农学院, 广西南宁 530004;2广西大学计算机和信息学院, 广西南宁 530004;3贵州省农业科学院 / 贵州省旱粮研究所, 贵州贵阳 550006;4三峡大学生物技术研究中心,湖北宜昌 443002;5贵州茅台学院, 贵州仁怀 564507
高粱(Sorghum bicolor(L.) Moench)是禾本科一年生草本植物, 是C4植物的模式生物, 是全球农业生态系统中重要的粮食和饲料作物。高粱用途广泛,经济价值高, 是食品、饲料和加工业的重要原料。全球高粱年种植面积4000多万公顷, 总产约6000万吨[1]。
维管束是指维管植物的维管组织, 由木质部和韧皮部成束状排列形成。维管束为植物体输送水分、无机盐和有机物质, 在“库-源-流”系统中扮演“流”的重要角色[2]。另外, 维管束也为植物提供机械支撑,与茎秆强度密切相关, 影响作物的抗倒伏性[3-5]。倒伏是影响饲草高粱和甜高粱的稳定高产的因素之一[6-7]。在甜高粱中, 倒伏多发生在开花期至成熟期,导致籽粒产量下降并影响茎秆内含物的积累, 也不利于收割[7]。在水稻中的研究认为, 改善茎叶维管束系统特征, 有利于茎叶同化物转运和产量提高[2]。维管束系统在植物生长发育和对环境的胁迫反应具有重要作用, 影响作物产量、品质和抗逆性[8-10]。
由于大规模测定细胞壁化学组成和获取维管束参数存在困难, 作物的倒伏研究主要局限在茎秆的形态学性状和力学指标, 对茎秆细胞壁化学组成和组织解剖学维管束特征研究较少[5,7]。近年来, 在小麦[11-13]、玉米[14-15]和水稻[16-17]中相继开发了一些高通量获取维管束参数的办法, 但是高粱中尚未见类似报道。Kanbar等[10]比较甜高粱KIT1和籽粒高粱Razinieh发现, 大维管束的木质部和韧皮部腔面积及其比值存在差异, 可能和甜高粱茎秆的糖分积累有关。但局限于技术, 该研究只用了2份材料, 也没有考虑茎秆本身大小、维管束数目、类型和分布等因素。高粱茎秆的组织解剖学特征及其遗传学基础尚缺乏研究, 其主要原因在于缺乏相关技术。本研究首次利用Labelme软件结合Python语言, 建立高通量获取高粱维管束数目、大小和位置相关的参数的方法。在此基础上, 以92份高粱为材料, 初步探讨高粱维管束参数和一些农艺学性状的关系, 为深入研究作物维管束的生物学功能其遗传机制建立方法基础。
高粱种质资源材料共92份, 收集自中国(四川、贵州、湖南、吉林、辽宁)、美国和印度等国家或地区, 具有较好的代表性(表1)。材料在2021年9月12日播种, 育苗移栽后种植于广西大学校内试验田。每份材料种植2行, 行距0.6 m, 株距0.3 m, 行长3 m, 3次重复, 水肥管理同大田生产。
表1 本研究种质资源材料Table 1 Germplasm resources of this study
高粱植株成熟后, 考察株高、单株鲜重、穗长、穗重、一级枝梗分枝数和千粒重。考察方法为每个小区每份材料选择长势均匀的10株高粱, 测量从地面到植株穗顶部的自然高度, 记为株高(cm)。穗尖至穗下叶痕处的距离记为穗长(cm)。称量单株鲜重(g)以及穗重(g)。将从主茎上着生的枝梗定为一级枝梗分枝, 并统计数量。高粱穗人工脱粒后用计数板随机分出种子数目, 称重并计算千粒重(g)。
在孕穗期, 截取高粱茎秆上部倒数第2节节间中部徒手切片, 厚度0.2~0.4 mm, 用5%间苯三酚和浓盐酸染色, 染色时间15 s, 然后利用OLYMPUS SZ61体视显微镜拍照, 放大倍数为6.7×到15×。获取图片数量为196张, 图片储存格式为BMP, 分辨率为1790像素×1370像素。
使用软件Labelme对高粱茎秆切片图中的维管束以及截面进行标注。图片经Labelme 标注后形成对应的 json 格式文件。该文件将保存每一个受标注对象的相关属性, 包括对象标签(label)、对象形状(shape_type)以及对象轮廓点(points)。在本次研究中,对象标签有大维管束、小维管束、茎和空腔4类; 对象形状有多边形和圆形2种; 对象轮廓点为人工标注点对应的坐标点集。每个对象均为封闭曲线。
用 Python 导入数据后, 先识别切片图中的比例尺, 统计其长度方向上的像素数。以比例尺的固定物理长度除以像素数, 即可得到图片物理尺寸与像素尺寸的比例, 该比例将用于之后的单位换算。之后, 调用OpenCV对json文件进行处理。使用OpenCV库中的函数获得对象的各项参数, 在像素尺度上用cv2.arcLength()计算对象的周长, 用cv2.contourArea()计算对象面积, 用cv2.minEnclosingCircle()拟合对象的最小包围圆计算形状中心与半径等。由此获得维管束指标初级数据, 进行单位换算得到包括维管束数目、面积、距离等性状的一级指标, 并在此基础上运算得到二级指标。
用Python (版本3.9.12, 下同)与Microsoft Excel进行数据整理与统计分析。用Python载入的matplotlib (版本3.5.1)和seaborn (版本0.11.2)绘制热力图、散点图和箱线图。用R (版本4.1.0)载入的prcomp计算主成分, FactoMineR (版本2.4)提取主成分方差贡献率和变量对主成分的贡献率, ape (版本5.6-2)绘制环状聚类图。
利用Labelme标注图片结合Python编程语言, 建立了高通量导出茎秆组织切片区域和维管束相关的参数的方法, 并命名为“LabelmeP1.0”。具体代码过程见链接: https://github.com/Joannxxxxx/bioinformatics/blob/main/Sorghum/Labelme_data_output_v1.ipynb。共计导出27个指标, 包括一级指标16个及其在此基础上计算得到的二级指标11个(表2)。
表2 利用“LabelmeP1.0”导出的参数和指标Table 2 Stem vascular bundle parameters generated by “LabelmeP1.0”
(续表2)
对92份高粱种质资源的27个维管束性状进行描述统计(表3)。一级指标中, 大维管束数目在89~390个(平均209), 小维管束数目在65~282个(平均173), 大(小)维管束平均面积均值分别为0.023 mm2和0.010 mm2。大(小)维管束离心距均值分别为3.5 mm和4.5 mm。茎直径均值为9.7 mm, 周长29.6 mm, 去腔茎面积68.9 mm2。空腔面积均值为1.8 mm2, 近一半材料存在空腔。除大(小)维管束离心距(CV=18%)和小维管束面积(CV=45.4%)外, 大部分一级指标的变异系数在30%左右, 材料间差异明显。
表3 高粱种质资源农艺性状和维管束参数描述统计Table 3 Statistics of vascular bundle parameters and agronomic traits of sorghum germplasm resources
二级指标中, 大维管束数目占比(占总维管束)在43.8%到65.2%, 绝大部分材料大维管束数目多于小维管束。大维管束大小是小维管束的1.5~5.0倍。高粱大维管束大而多, 因此其总面积在维管束总面积中占比达74.7%。皮(周边厚壁组织)厚度平均0.5 mm,皮面积平均9.2 mm2。大维管束面积占茎比与大维管束面积占内环比2个性状相关性高, 分布相似, 均值分别为7.2%和7.6%。小维管束面积占茎和皮面积的均值分别为2.6%和19.8%。尽管占比较低, 但是材料间小维管束变异大, 疏密不同。大(小)维管束相对离心距分别为71.6%和93.4%, 材料间差异较小。小维管束周长密度5.8, 平均每毫米周长5.8个。大(小)维管束面积密度均值分别为3.3和19.9。每平方毫米内环区域平均分布3.3个大维管束。空腔面积占茎面积的比例较小, 均值为2.7%。大(小)维管束相对离心距以及大维管束数目和面积占比的变异系数均很小(CV=1.6%~10.5%), 说明在高粱中不同材料的维管束相对茎秆中心的位置相对固定, 大小维管束的比例相对恒定。推断茎秆、大小维管束表现出生长的同步和一致性。其余的二级指标中, 除小维管束面积占茎比变异系数较大外(CV=52.7%),稳定在20%~30%, 表现了适当的多样性。
考察高粱的主要农艺性状发现, 农艺性状数值分布范围均较大, 材料间差异显著。穗重变异系数最高(CV=72%), 其次为单株鲜重(CV=38.2%), 再次为株高、穗一级枝梗数和千粒重(CV=22%~28%), 穗长离散程度最小(CV=20%)。在维管束性状的变异系数和农艺性状基本持平, 但在小维管束性状上(平均面积、面积占茎比和面积占皮比)都大于除穗重外的农艺性状。性状基本服从正态分布, 穗重和空腔出现偏态分布。
分析了高粱茎秆组织横切片参数一级指标的相关性(图1)。结果表明, 茎秆横切片的直径、周长、去腔面积以及大、小维管数量和离心距显著正相关(r=0.97~1.00,P<0.001)。说明茎秆越粗, 维管束数目也越多, 茎秆和维管束表现横向同步生长。大、小维管束也表现较高的一致性, 其数目间和面积间的相关系数分别为0.86 (P<0.001)和0.67 (P<0.001)。大(小)维管束面积差别在于大维管束面积和数目趋势一致, 和其他性状关联较大; 但小维管束面积和其他指标关联不大。除空腔面积, 各指标间存在不同程度正相关(P<0.05), 空腔面积只和小维管束数目负相关(P<0.05)。皮面积和皮厚度、茎秆大小、维管束性状相关, 但和维管束数目关系不大。维管束数目和茎秆粗细有关, 但不同材料的维管束密度存在差异, 这也是造成维管束数目差异的原因。
图1 高粱茎秆维管束参数一级指标相关性Fig. 1 Correlation analysis of the primary parameters of stem vascular bundles自由度为90,r0.05=0.205。TALVB: total area of large vascular bundles; CA: cavity area; SA: stem area; LVBD: large vascular bundle distance; SD: stem diameter;NLVB: the number of large vascular bundles; TASVB: total area of small vascular bundles; RA: rind area. df = 90,r0.05= 0.205.
为了更好了解性状间关系, 扣除茎秆和目标区域大小的影响, 本研究计算二级相对指标并开展主成分分析(表4)。前五主成分贡献率为40.4%、21.8%、10.2%、8.4%和7.1%, 累积方差贡献率88%, 可代表维管束性状绝大部份信息。从变量对各主成分的贡献率看, 对PC1作用较大的变量是大(小、总)维管束数目、茎直径、茎周长、去腔茎面积、大维管束离心距和小维管束离心距(表4)。可见, PC1主要反映茎杆粗细和维管束数目信息。对PC2作用较大的变量是大(小)维管束面积占比、小维管束面积占茎(皮)百分比、小维管束相对周长的密度。PC2反映小维管束面积和数量相对比例(占比)。对PC3贡献较大的变量是大(小)维管束平均面积、皮厚度(面积)、大(小)维管束相对离心距以及(大)小维管束“面积密度”。大(小)维管束相对离心距与皮厚度高度相关,与小维管束“面积密度”也有一定的相关性。因此,PC3反映的主要是与维管束和皮的面积, 单位面积的维管束数目以及维管束的相对位置信息。PC4主要反映了空腔面积和空腔面积占茎百分比信息。PC5主要反映了大维管束的数目占比和面积占比(“面积密度”、占茎百分比和占内环百分比)信息。
表4 高粱茎秆维管束参数(27个)的主成分分析Table 4 Principal component analysis (PCA) of vascular bundle parameters (27) in sorghum
最后, 本研究选取了维管束数目(大、小、总维管束数目)、维管束大小(大、小维管束平均面积)、区域大小(茎直径、空腔面积和皮厚度)、大小维管束比例(大、小维管束数目占比和面积占比)、维管束相对数量(小维管束周长密度、大维管束面积密度), 维管束相对面积(小维管束面积占皮面积百分比、大维管束面积占茎秆百分比)和相对位置(大维管束相对离心距)共7类15个性状作为核心指标(图2)。
农艺性状之间相关分析表明, 产量相关性状千粒重、一级枝梗数和穗重互为显著正相关(图2)。产量性状也和单株鲜重显著正相关, 特别是穗重和单株鲜重相关密切(r=0.73,P<0.001)。株高和穗长极显著正相关, 但和产量性状显著负相关。穗长和一级枝梗数显著负相关, 和株(穗)重极显著正相关。
图2 高粱茎秆维管束核心参数和农艺性状的相关性分析热力图Fig. 2 Heat map of the correlation between core parameters of stem vascular bundles and agronomic traits in sorghum stem自由度为90,r0.05=0.205。NLVB: the number of large vascular bundles; TALVB: total area of large vascular bundles; LVBD: large vascular bundle distance; SD: stem diameter; NSVB: the number of small vascular bundles; SC: stem circumference; TASVB: total area of small vascular bundles; RA: rind area;CA: cavity area; SA: stem area; PA: parenchyma area. df = 90,r0.05= 0.205.
维管束核心性状和农艺性状相关性分析表明,株高和大(小)维管束数量、小维管束密度极显著负相关(P<0.01) (图2和图3)。株高和空腔面积极显著正相关(P<0.001), 表明株高增加空腔发生概率。茎秆直径和维管束数目与产量重量类性状(穗重、单株鲜重和千粒重)显著正相关, 与株高显著负相关(r=-0.26)。这说明维管束数目越多或茎杆越粗对产量有利。穗重和单株鲜重均与直径、大(小)维管束数目和总维管束数目显著正相关(图2)。千粒重和空腔面积和一级枝梗显著负相关, 和大(小、总)维管束数目、小维管束“周长密度”显著正相关。这说明维管束大小, 单位周长和单位皮面积的小维管束数目与产量相关性状密切相关。值得一提的是, 小维管束与一级枝梗数和粒重均密切相关, 而大维管束只和粒重相关。这可能和大(小)维管束、一级枝梗的发育及其物质运输功能的差异有关。
图3 高粱茎秆维管束参数和产量相关性状的显著性散点图Fig. 3 Scatter plots of the significant correlations between vascular bundles parameter and agronomic traits in sorghum stem***、**和*分别表示在0.001、0.01和0.05概率水平差异显著。***, **, and * indicate significant correlations at the 0.001, 0.01, and 0.05 probability levels, respectively. LVB: large vascular bundles; SVB:small vascular bundles; TVB: total vascular bundles; SC: stem circumference; TASVB: total area of small vascular bundles; RA: rind area.
以6个农艺性状与15个维管束核心参数的数据正则化处理后聚类分析, 本研究的高粱种质资源可分为三大类(图4)。
图4 高粱种质资源材料聚类分析和代表性材料维管束示例Fig. 4 Clustering analysis of sorghum resources and the vascular bundle of representative materials
第1类材料44份, 表现为株高最矮, 穗重、一级枝梗数和千粒重都较小, 维管束数目较多, 大(小)维管束平均面积都最大, 大维管束数目和面积占比都最小, 但大维管束面积占茎比与小维管束面积占皮比都最高, 大维管束相对离心距和茎直径都较大,皮厚度低, 小维管束“周长密度”和大维管束“面积密度”都最大, 普遍无空腔。概括来说, 第1类材料矮个粗茎薄皮, 种子少且轻, 维管束既多又大且密。这其中25份收集自美国和印度, 10份来自贵州, 9份来自中国北方。第2类材料38份, 除穗重、一级枝梗数和千粒重也都较小外, 其他性状趋势正好和第一类材料相反。表现为高个细茎, 种子少且轻, 维管束少又小且稀疏, 茎秆普遍有空腔。来自贵州21份,四川13份。第3类材料10份, 株高较矮, 单株鲜重大、穗重、一级枝梗数、粒重最大, 维管束数目最多, 茎直径最大, 皮厚度最厚, 小维管束“周长密度”,最大空腔面积最小。可见, 特点是矮个粗茎厚皮、种子多而重, 维管束数目较多、密度较高、面积适中, 普遍无空腔。7份由四川省农业科学院选育, 其余均为酿酒型材料(图5)。
(图5)
图5 3类高粱种质资源材料性状差异比较箱线图Fig. 5 Boxplots for the comparison of the characters of three classes of sorghum resources缩写同表3。Abbreviations are the same as those given in Table 3.
茎秆解剖学特征对于作物的生长发育、物质运输和机械支撑具有重要作用, 进而影响作物产量和品质。本研究的主要目的是建立茎秆横切片维管束和区域相关参数的导出方法。本研究建立的方法稳定可靠。如茎面积、茎半径和茎周长是用不同的思路不同的函数独立计算, 但三者呈极显著相关, 这同时也证实了方法的可靠性。在计算皮的相关参数时, 考虑到皮内缘不规则界限不清, 本研究以最外大维管束和最里小维管束的界线作为皮内侧边界的估计。研究表明皮和产量性状有关, 取得了较好的研究效果。
此外, 还对计算和数据进行了优化。如比较各种面积计算函数的优劣, 发现使用几何方法(通过cv2.contourArea()函数基于格林公式进行计算)和使用物理方法(通过cv2.countNonZero()函数计算像素点之和)得到的结果有所差异。前者精度依赖于轮廓标注的精细程度, 后者更适用于方形轮廓。因此, 可通过提高标注的质量, 并根据对象形状选择合适的函数可以达到较好的效果。另外, 由于高粱的维管束数目众多, 容许在必要时可去掉一定比例极端值,去除图片质量和人工误差等不确定因素引起的可能异常值的干扰, 以得到对维管束面积的准确估计。本方法Labelme标注需要一定的工作量, 在以后的研究中可以考虑建立基于深度学习的预测模型。
为系统研究参数间的关系, 本研究首先尽可能考虑各种参数可能性, 系统、全面的涵盖了数目、大小、位置、相对比例等各种属性。除维管束外, 还计算了空腔、内环、皮厚度、茎秆等各类区域的面积, 并通过计算二级指标扣除茎秆和区域本身大小影响。随后, 本研究通过PCA阐明参数间关系, 去除冗余指标, 最终确定了15个核心指标。
本研究发现维管束指标和农艺性状普遍相关。如穗重和单株鲜重均与直径、大(小, 总)维管束数目、皮厚等指标正相关, 说明了维管束特征对于产量性状的重要性。研究还发现二级指标具有明确的生物学意义。如千粒重和小维管束“周长密度”的相关极显著, 超过和维管束数目(一级指标)的相关性。一级枝梗数也与二级指标小维管束“周长密度”和小维管束面积占皮百分比显著正相关, 但和一级指标维管束数目只有弱相关。聚类分析发现, 一些二级指标(如大小维管束比例)对材料具有很好的区分度。显然, 本研究开发的指标, 对于理解产量的形成具有积极意义。
目前在高粱中缺乏维管束结构特征和产量相关性状的研究。最近, Kanbar等[10]比较了甜高粱KIT1和籽粒高粱Razinieh的差异发现, 大维管束韧皮部腔面积、韧皮部腔面积和木质面腔面积的比值与甜高粱茎秆的糖分积累正相关。在小麦中发现, 主茎穗下节间维管束数均与籽粒产量、蛋白质含量呈正相关[8]。在水稻中发现, 穗颈中的大(小)维管束数量与茎叶非结构性碳水化合物(NSC)转运显著正相关,穗颈和剑叶大(小)维管束数量、横截面积和韧皮部面积与产量显著正相关[2]。整体而言, 本研究结果和以上水稻和小麦的结果类似。另外, 前人在水稻中发现小维管束的数量、总横截面积分别与茎鞘NSC转运、结实率、千粒重和产量显著正相关, 相关系数高于大维管束[9]。而且, 茎鞘NSC和小维管束韧皮部面积显著正相关, 而和大维管束无关。本研究在高粱中也发现, 小维管束对一级枝梗数和粒重均有显著影响, 大维管束只影响粒重, 推测小维管束对产量更为重要。这可能和大(小)维管束发育和功能差异有关, 值得进一步研究。本研究还发现髓的空腔面积和千粒重和一级枝梗数均负相关, 是产量不利因素, 需要引起关注。
需要指出, 核心指标的选取及其相关性与作物和材料的类型有关。本研究发现类I材料尽管茎秆粗、维管束数目相对多, 但籽粒产量不大, 可能这一类高粱适合做青储饲料。而在类II中, 茎秆大小、维管束数目与籽粒重和一级枝梗有显著正相关。因此, 在分析维管束和农艺性状的关系时, 收集更多不同类型高粱材料并分类研究, 将有助于得出更加合理的结论。
基于Labelme标注图片和Python编程语言的方法“LabelmeP1.0”可实现对高粱茎秆区域和维管束相关的26个参数的高通量提取。评价了92份高粱种质资源的茎秆维管束参数多样性及其相互关系, 总结了和维管束大小、位置、比例和密度相关的15个核心指标。维管束性状(数目和密度)和农艺学性状(穗重、粒重和一级枝梗数)密切相关。根据形态学、农艺性状和维管束参数的差异, 本研究将高粱种质资源分为三大类, 有助于了解材料的育种前景和用途。