何林飞,朱 煜*,钱婷婷,汪 妍
(1华东理工大学信息科学与工程学院,上海 200237;2上海市农业科学院,上海 201403)
植物叶片的含水量是指示植物生长状态的重要生理指标。叶片含水量可以直接影响叶肉细胞的气孔导度,气孔导度是叶片光合性能的直接影响因素[1],因此,对叶片含水量的监测可间接评价植物叶片光合性能[2]。传统的叶片含水量测量方法为称重法,该方法需要对叶片进行破坏性取样,因此无法满足连续监测的研究要求。随着信息技术的发展,数字图像处理技术为植物生长发育监测提供了新的技术手段。从20世纪80年代开始,二维图像在植物生长监测中得到了大量应用[3],包括结构分析[4]、气孔运动和光合诊断[5]、病虫害监测[6]和产量评估[7]等。蔡鸿昌等[8]利用图像处理技术提取叶片的颜色特征,通过线性拟合和逐步回归分析,建立了黄瓜叶片光合色素含量的颜色特征估算模型。孙瑞东等[9]采用非线性最小二乘拟合方法,建立Log-Modified回归模型,提出黄瓜叶片含水量无损检测方法。杨春合等[10]提取图像的颜色和纹理特征,并运用主成分分析和回归方法建立水分检测模型。在图像采集过程中,光源类型、拍摄角度、拍摄距离等条件因素受人为影响较大,很难建立相同的拍摄环境,因而前人的研究基础难以直接应用。高通量表型平台的出现,为图像采集提供了统一的采集环境,解决了拍摄环境难以统一的难题,从而为图像处理技术在植物生长监测中的应用和推广提供重要的基础条件支撑。因此,本研究选取黄瓜叶片含水量为研究对象,在高通量表型平台中获取黄瓜植株的二维图像,通过图像分割与多特征融合技术,研究黄瓜叶片含水量无损检测方法,为图像处理技术在黄瓜叶片生理状况监测中的应用提供支持。
在本研究中,高通量表型平台采集的黄瓜植株为整株,需要通过图像分割获得叶片目标区域,而目标叶片经常和其他叶片或者杂物黏连,传统分割方法无法达到目标叶片分割效果。针对上述问题,本研究提出采用基于GrabCut算法[11-12]的精确目标区域提取方法进行目标叶片区域分割。针对含水量回归模型的建立问题,本研究提出采用灰度统计特征与灰度共生矩阵(Gray-level co-occurrence matrix,GLCM)纹理特征[13]相结合的特征表达方法,建立图像特征与叶片含水量的回归模型,以期使回归模型的准确度较高。
本研究在上海孙桥现代农业园区的玻璃温室中进行,选用的黄瓜品种为‘戴多星’。试验采用盆栽土培法,用大小和质量基本相同的塑料盆(盆体上口直径25cm),配制育苗基质,体积比泥炭土∶珍珠岩∶蛭石=3∶1∶1,多菌灵体积分数0.25%,按每盆0.5kg比例加入腐熟鸡粪,装土时适当进行镇压。管理期间保证黄瓜水肥充足,黄瓜长至4叶1心时插支撑竹竿、绑蔓。在黄瓜长至5叶1心时,选取100盆生长一致的黄瓜植株进行水分试验处理。水分处理分为5个梯度,每个梯度20盆。水分处理方法:分别在试验前的第5天、第4天、第3天、第2天、第1天,对不同处理植株进行浇水,浇水后用薄膜覆盖盆面,防止水分过度蒸发。在第6天统一进行测量。试验重复3次。
试验流程如图1所示,获得试验材料后,通过图像分割算法,分割出目标单叶片区域图像,再通过特征提取方法,得到单叶片图像的特征。最后通过最小二乘回归计算所设计的特征和叶片真实含水量之间的关系模型,并检验该模型的可信度。本试验使用相关系数R2和相对误差率(预测误差除以真实值)检验模型可信度。
图1 试验流程Fig.1 The flowchart of experiment
图2 高通量表型平台可见光成像系统示意图Fig.2 High-throughput phenotyping platform visible imaging system
1.2.1 图像获取
每个处理选取生长一致的5株植株,放入高通量表型平台的“可见光成像系统”拍摄植株侧面照,并将叶龄为15d左右的叶片正面朝向镜头,该叶片为图像提取对象。镜头距离植株3.56 m,可保证2m高度内的植株在镜头中全部成像。镜头分辨率2 448×2 050像素,像素大小3.45 μm×3.45 μm,光源强度22 kHz,图像大小6.3 M。本试验共获取图像75张。
1.2.2 含水量真值获取
将拍照后的叶片进行破坏性取样,在精度为0.0001g的电子天平(奥豪斯 AR224CN,美国奥豪斯公司)上称量叶片鲜重,在80°C条件下烘干后,称量叶片干重,叶片含水量由下式计算得到:
(1)
1.2.3 单叶片图像分割
GrabCut算法[11]使用图论的方法对图像进行建模,把图像分割问题转化为图的最小割问题。算法由GMM混合高斯模型对原始图像RGB颜色空间进行前景和背景区域的建模,其中使用K个高斯分量,一般取K=5。图像的Gibbs能量为:
E(α,k,θ,z)=U(α,k,θ,z)+V(α,z)
(2)
其中U是区域项,表示一个像素被归类为目标或者背景的惩罚;V是边界项,体现邻域像素之间不连续的惩罚。下划线表示该变量需要经过迭代优化。区域项U定义为:
(3)
其中,D(αn,kn,θ,zn)表示第n个像素点为目标或背景的权重,D(αn,kn,θ,zn)=-log(zn|αn,kn,θ)-logπ(αn,kn),p(·)是高斯概率分布,π(·)是混合权重系数。αn表示第n个像素点处的标签,0表示背景,1表示前景。kn表示第n个像素点属于的高斯分量。θ={π(αn,kn),μ(αn,kn),∑(αn,kn)}表示GMM的3个参数。zn表示第n个像素点的RGB数值。
边界项V定义为:
(4)
V(α,z)表示邻域像素m和n之间的差异,两邻域像素差别越大,这两个像素处于目标和背景边缘的可能性越大,则其能量V越小。γ为平衡系数,平衡区域项和边界项的比例,β为对比度系数,用于调整不同对比度图像的边界距离。基于GrabCut算法[11]的叶片分割步骤如下:
1)选择一幅植株图像中的叶片前景区域TF和背景区域TB。
2)初始化标签参数αn=0,n∈TB;αn=1,n∈TF,并建立前景和背景的GMM模型。
3)对于可能的前景区域TF中的每一个像素点n,计算kn∶argminkn=D(αn,kn,θ,zn)。
4)已知图像数据z,学习GMM的参数θ=argminθU(α,k,θ,z)。
5)通过最小费用最大流算法对图进行分割估计min{αn:n∈TF}minkE(α,k,θ,z)。
6)重复步骤3—5,直到收敛,从而获得分割的单个叶片图像。
1.2.4 图像特征提取与含水量回归分析
分割后得到目标叶片,通过图像特征提取,得到与叶片含水量相关的统计特征。针对彩色图像提取了三维RGB颜色特征[14],针对灰度图,提取了标准差、平滑度、歪斜度、一致性、熵[18]以及GLCM纹理特征[13]作为叶片的图像特征。采用的GLCM纹理特征包括:
最后通过提取的图像多维融合特征和叶片烘干含水量真值进行回归分析,利用最小二乘回归计算模型参数。回归模型为:
y=a0+a1x1+a2x2+…+anxn
(5)
其中:x是图像的特征,a为最小二乘拟合的系数,y为拟合的含水量,n为特征维度。
图3 目标叶片区域分割Fig.3 Target leaf area segmentation
图3为叶片分割结果对比试验,每行为1棵植株,共展示3棵植株的结果。(a)图为拍摄装置获取的黄瓜叶片原图,其中红框表示该植株用于含水量分析的叶片。(b)图是基于经典水平集分割方法[15]的结果,可以看到由于目标叶片与其他叶片黏连,难以获得理想的目标叶片区域。(c)图为通过GrabCut算法分割后得到的目标叶片区域,可见GrabCut算法能完整分割出目标叶片区域,且有效去除了其他叶片区域的黏连影响。
通过GrabCut算法得到植株的目标叶片区域后,利用1.2.4节的方法进行特征提取,得到标准差、平滑度、歪斜度、一致性、熵、GLCM纹理特征等多维融合统计特征,再与叶片的含水量测量值进行回归分析。
为了研究黄瓜叶片不同发育时期下的叶片含水量,试验数据分三批获取,前两批各25株,第三批24株。为测试所选特征的合理性,将每批数据的80%(三批共计59株)用于拟合模型;剩余20%的样本(三批共计15株)用于检验模型误差,得到三批数据的平均相对误差分别为9.10%、4.63%和4.61%。批次内的残差分布(图4)表明,三批数据均获得较少的误差率,所采用的图像特征具有良好的表征能力。为进一步测试批次间的模型泛化能力,将第三批数据作为训练集,前两批数据作为测试集。使用最小二乘法拟合训练集图像特征与叶片含水量,得到R2为0.8358。图5中训练集数据的预测值和真实值分布接近于45°直线,说明模型选取的特征与含水量之间有较好的拟合关系。批次间的泛化性能测试得出,第一批的平均相对误差为10.88%,第二批的平均相对误差为7.98%。批次间的残差分布(图6)表明,误差在可控范围之内,表明该模型在批次间也有较好的泛化能力。
图4 批次内残差分布Fig.4 In-class residual distribution
图5 含水量真实值与预测值分布Fig.5 Water content of the true value and the predicted value distribution
图6 批次间残差分布Fig.6 Residual distribution between classes
黄瓜叶片含水量不仅可以反映植株生长状态和叶片光合能力,同时也是水分管理的敏感指标。本研究通过水分处理,使叶片中的含水量在67%—94%范围内形成水分梯度,从而实现了不同含水量叶片的图片获取。与孙瑞东等[9]、王娟[16]的试验方法不同,本研究没有采用固定的土壤含水量处理,而是利用了浇水后土壤水分随蒸散而减少的规律,与黄瓜生产中土壤水分变化规律更为接近,同时也避免了因长期水分胁迫对光合器官的破坏而引起的叶片颜色变化。
如何有效地从图像中提取目标区域,剔除背景,一直以来都是研究人员关注的重点。目前图像分割方法主要有基于阈值分割法、基于区域分割法、基于边缘分割法以及基于特定理论分割法等[17-18]。针对植物叶片重叠严重的图像,叶片与叶片之间颜色非常相近,单纯用前三类算法提取往往达不到理想效果。因此本研究采用了GrabCut算法,利用简单的交互就可获得图像中感兴趣的目标图像的准确区域。与基于传统水平集算法的叶片分割结果进行对比,本研究的方法具有图像分割准确性更高的特点。与此同时,该算法也存在着计算量大,需要人机交互的缺点,未来还应该考虑更加智能的分割方式,减少人机交互,优化算法性能。
本研究以黄瓜叶片为研究对象,在高通量表型平台中获取植株图像,同时用烘干法测量植株目标叶片的含水量。使用GrabCut算法对植株图像进行分割,得到目标叶片图像区域。再提取图像的标准差、平滑度、歪斜度、一致性、熵及GLCM纹理特征作为图像综合特征,与含水量进行回归分计算。并对不同批次获取的黄瓜叶片图像与其含水量之间进行误差分析。研究结果显示,该模型有较高的可信度和较好的泛化能力,对于不同发育时期的黄瓜叶片都能较好的预测其含水量。下一步将考虑更有效的图像融合特征表达,以提高预测的准确率以及模型的泛化能力。