邢 航,黄旭楠,杨秀丽,王志琪,齐 龙
(华南农业大学 工程学院,广东 广州 510642)
水稻成熟期表型性状参数中总粒数、空粒数、粒长、粒宽、粒周长、粒面积、千粒质量等对高品质水稻品种的评价具有非常重要的意义。获取水稻成熟期表型性状参数的过程称为水稻考种[1],水稻考种是现代水稻育种研究的基础,是经验育种向精准育种转变的关键。传统的水稻考种主要依赖人工完成,耗时费力,测量效率低,易受到操作人员主观因素的影响,导致测量准确度达不到现代水稻育种研究提出的要求[2-4]。因此需要基于现代信息技术,研发性能稳定且功能丰富的作物成熟期表型性状参数自动提取设备,帮助研究人员快速、准确地获取水稻表型性状信息。
国内外许多科研院所和高新技术公司在相关领域进行了研究并取得了一定的成果[5-11]。美国Seedburo公司生产的Count-A-Pak型数粒仪、法国Chopin公司的Numigral型数粒仪、德国Pfeuffer公司设计的Contador型数粒仪[12],都采用光电测量方式完成了考种过程中的计数工作,但这些数粒仪功能单一,只能进行稻谷计数,无法测量粒型参数,同时光电测量的考种方式虽然避免了主观和偶然性误差,结构简单,操作方便,但滞后、效率较低[13]。随着图像处理技术的发展,研究人员运用图像处理技术获取作物表型参数,德国LemnaTec公司研发的Scanalyzer系列产品通过摄像头对作物种子或幼苗、小型作物、大型作物、田间作物分别进行表型观测[14],华中农业大学水稻表型研究实验室和谷丰光电科技有限公司共同开发了一款利用线阵列摄像机自动提取稻谷总粒数、空粒数、实粒数等参数的水稻考种系统[15-16],浙江托普云农科技股份有限公司的TPKZ-1型考种仪,可对玉米、水稻、小麦等作物种子的粒数、粒长、粒宽、周长、面积等参数进行统计分析。但这些考种设备普遍结构复杂,价格昂贵,日常维护较困难,有些并未实现质量称量自动化,不利于大范围推广应用。
本文系统地开展了水稻谷粒考种参数自动提取方法和关键技术研究,研制了一种水稻谷粒数字化考种装置,实现了谷粒数量、空粒数、粒长、粒宽、粒周长、粒面积及谷粒质量的快速测量,成本低,易于维护。
本文所设计的谷粒考种信息采集装置主要由安装支架、图像采集设备、光源、透明标定膜、质量计量装置以及计算机组成,如图1所示。工作时,计算机分别控制图像采集设备和质量计量装置,同步采集稻谷图像和质量信息,并对采集的数据进行处理以获取稻谷谷粒参数信息。
装置设计时考虑到图像采集设备宜结构紧凑、低功耗、低成本[17],选用楚睿科技RQC-B型CMOS摄像机(分辨率为3 264像素×2 448像素,4∶3)作为采集设备。为突出谷粒外形轮廓特征,选用LED背光照射的方式进行图像采集,背光源的发光面需放置稻谷。为一次性把发光面上所有的谷粒拍摄完整,并最大程度地利用摄像机的有效拍摄范围,背光源的发光面尺寸确定为400 mm×300 mm。背光源放置于质量计量装置的正上方,质量计量装置会计量整个背光源装置及位于发光面的稻谷的总质量,而光源常规外引线供电方式中外引线若受到干扰发生轻微运动,会造成质量读数的剧烈波动,因此本文采用大容量锂电池固定于背光源背部对其进行供电。
设计带有稻谷区域框、参照物区域框、参照物阵列等图案的透明菲林膜,安嵌于背光源的正面进行标定计算。经调查,稻谷长度一般不超过12 mm,绕自身中心点旋转一周扫过的面积约为113 mm2,水稻单穗总粒数一般不超过300粒,因此扫过的总面积约为34 000 mm2。为尽量减少稻谷之间黏连或堆叠现象,用于放置稻谷的大正方形框面积要大于34 000 mm2,但也不能过大,以免增加设备成本,浪费摄像机的有效分辨率,因此标定膜上的大正方形框边长确定为200 mm。为避免标定计算引入额外误差,参照物的尺寸应该接近被测物的,因此用于标定的小正方形的边长选择为10 mm。为降低由于标定图案在图像采集处理过程中的有效像素丢失现象引起的标定误差,同时让标定膜图案区域的长宽比保持在4∶3左右,参照物图案内容设计为一个11行3列的小正方形阵列。图像采集设备安装在1个可调支架(540 mm×500 mm×640 mm)上,以保证图像采集设备处于合适的垂直和水平位置,其视野内包含所有的稻谷和标定图案。
采用电子衡器获取稻谷质量信息,考虑到衡器需要同时承载光源装置和铺洒在发光面上的稻谷群,光源装置质量约为2 833 g,水稻单穗稻谷总质量一般不超出10 g,因此电子衡器的量程要大于2 843 g。同时为保证每颗稻谷的质量都能检测到,衡器的分辨率须小于单颗稻谷的质量(约0.02 g)。根据上述对量程、分辨率的需求,同时兼顾数据实时传输需求,选择量程为0~4 200 g,分辨率为0.01 g,支持RS232通信标准的卓精电子的BSM-4200.2电子秤作为质量获取装置。
本文采用加权平均法将通过采集装置获取的原始图像(图2a)转换为灰度图像,以减小运算压力,提高处理效率[18-19],其中R、G、B通道分量的权重分别取0.299、0.587和0.114,灰度化效果如图2b所示。由于中值滤波的模糊效应比线性滤波器小很多,对图像的有效细节信息保留得较好,特别是边缘轮廓信息[20],考虑到本文对谷粒边缘轮廓信息的需求,且原图像的噪声主要是孤立的噪声点,选择中值滤波方式对灰度图像进行滤波[21],滤波效果如图2c所示。谷粒图像中谷粒、标定膜图案等前景的灰度值与背景的灰度值差异明显,因此采用基于阈值的分割法将前景与背景分离开[22-25]。基于阈值的分割法中最大类间方差法可自适应地确定阈值,设定图像包含2类区域,η为分割这2类区域的灰度阈值,被分离后的区域A和区域B占整个图像面积比例分别为αA和αB,整幅图像、区域A、区域B的平均灰度值分别为β、βA、βB。此时,它们之间的关系如式(1)所示:
当区域A与区域B之间的灰度差异较大时,βA、βB与β之间的差异也较大,这种差异的方差σ2(η)计算如式(2)所示:
αA、αB、βA、βB都是阈值η的函数,经推导,σ2(η)可表示为:
当σ2(η)取得最大值时,2类区域处于最佳分离状态,由此得出最佳阈值T,见式(4)。
采用最大类间方差法来对谷粒图像进行分割的效果如图2d所示。
获取二值化图像后,为提高处理效率、避免标定膜上的图案对谷粒计数带来干扰,本文采用图像掩膜法屏蔽标定膜上的图案,提取谷粒区域[26],其算法流程如图3所示。
稻谷总粒数自动计数算法流程如图3所示。对谷粒总粒数进行自动计数时,部分谷粒之间存在相互黏连现象,相互黏连的谷粒在图像上会表现为一个整体的连通域,如果直接把连通域总数视作谷粒总粒数,就会漏数谷粒。经统计发现,属于同一品种且同一批次的稻谷在背光源上的投影面积会在一个稳定的区间内浮动,所以本文利用这个规律去解决黏连稻谷的准确计数问题。为了能较好地处理不同品种或不同批次的稻谷,在每次测量开始时都会自动地重新评估当前画面内的孤立谷粒的面积参考值,而不是以某个固定数值作为孤立稻谷的面积参考值。
经大量观察发现,稻谷实粒与空粒间有显著的外形差异:稻谷实粒的颖壳在粒端位置的封闭性良好,没有缺口现象,而绝大多数稻谷空粒的颖壳在粒端位置的封闭性较差,存在明显的缺口,这主要与水稻生长气候条件、除草剂药害、土壤养分失衡等多种因素有关[27]。基于稻谷空粒外形特点的空粒自动计数算法[28-29]流程如图3所示,其中包含空粒计数(图4)。
图4 空粒计数图形Fig.4 Graph for empty grain counting
稻谷总粒数(N1)和稻谷空粒数(N2)都已经求出,则可根据公式得到稻谷实粒数(N3)和结实率(Q)。
通过所设计采集系统中的质量计量装置实时获取稻谷总质量(m),则可根据下式,计算出该批稻谷的千粒质量(M)。
需根据方法[30]首先求出用于稻谷实粒长度、宽度、周长测量的像素当量(V1)和用于稻谷实粒面积测量的像素当量(V2)。
2.4.1 像素当量V1的求取 首先,拟合出参照物中33个小正方形分别对应的四边形轮廓并同时输出所有的角点坐标,接着将位于同一行的左右相邻的2个角点连成线段,每行有5条横向线段,共22行,合计110条横向线段(图5a),然后将位于同一列的上下相邻的2个角点连接成线段,每列有21条纵向线段,共有6列,合计126条纵向线段(图5b)。
图5 参照物处理过程Fig.5 Reference treatment process
为减小测量装置可能存在的装配误差,采用平面两点欧氏距离公式(8)来计算上述共236条线段各自的长度(li)。
式中,xiA和yiA分别表示第i条线段某一端点的横、纵坐标,xiB和yiB分别表示第i条线段另一端点的横、纵坐标,长度li的单位是像素数量。把236条线段的长度值都加起来求和,再除以236得出线段的平均长度(l),由于每条线段的实际长度均为10 mm,通过下式即可求出用于长度、宽度、周长测量的像素当量V1。
2.4.2 像素当量V2的求取 为了提高测量精度,首先寻找出参照物中33个小正方形(图5c),求出其像素面积之和,再除以33得出小正方形的平均面积(s),由于每个小正方形的实际面积是100 mm2,因此可通过下式计算求出用于面积测量的像素当量V2。
2.4.3 稻谷长与宽的测量 虽然稻谷实粒拥有不规则的形状,但在稻谷实粒长、宽测量过程中主要关注的是稻谷的上、下两端和左、右两侧的直线距离,因此可转化为求稻谷实粒的最小外接矩形的长和宽[31]。把稻谷实粒摆放到光源装置上进行长宽测量时,允许稻谷间存在黏连现象。在测量过程中利用与“2.3”相同算法判别出杂质、孤立实粒和黏连实粒连通域,并只统计孤立实粒的数量;接着提取出所有孤立实粒的外轮廓所对应的最小外接矩形;把所有外接矩形以像素为单位的长度和宽度分别加起来除以孤立实粒数,得到实粒的以像素为单位的平均长度(K)和平均宽度(D),通过下式计算实粒的实际平均长度(J)和宽度(C)。
2.4.4 稻谷周长与面积的测量 采用链码法求取稻谷实粒的投影周长,把位于水平与垂直方向上的像素点对长度的贡献值记为1,倾斜方向上的像素点对长度的贡献值记为以解决倾斜方向上长度计算误差大的问题。类似长和宽的测量,同样只统计孤立稻谷实粒的周长。首先求出全部孤立稻谷实粒连通域所对应的轮廓,然后利用链码法求出它们的周长,把这些周长值加起来除以孤立稻谷实粒的数量,得到孤立实粒的以像素个数为单位的平均周长(I),通过下式计算出实粒的实际平均周长(H)。
采用像素累加法求取图像中稻谷实粒的实际面积,也只统计孤立稻谷实粒的面积值。首先判别出所有孤立稻谷实粒连通域并分别求出它们以像素个数为单位的面积,然后把这些面积值加起来的和除以孤立稻谷实粒的数量,得到孤立实粒的以像素个数为单位的平均面积(G),通过下式计算出实粒的实际平均面积(E)。
3.1.1 稻谷总数计数试验 稻谷总数计数精度
P1的计算公式为:
式中,U0是稻谷总数实际值,U1是稻谷总数自动计数值。
一般在机器视觉测量系统中,摄像机与待拍物的相对距离及待计数物的总数对计数结果的准确度都会有较明显的影响。因此,以稻谷总数计数精度为试验指标,以摄像机高度和稻谷总数为试验因素进行研究,探究影响装置计数精度的因素的作用规律。
经过预试验得知,为能完整地拍摄所有稻谷以及载物光源上的图案,摄像头距离载物光源的高度最低为257 mm。以5 mm为间隔,设置摄像机距离载物光源高度的5个水平,分别为260、265、270、275、280 mm。试验中水稻品种为‘江航丝苗’,经统计分析发现,其单穗样本的总粒数主要为100~200粒,因此设置稻谷总数量的3个水平,分别为100、150、200粒。试验的开展地点为华南农业大学工程学院实验室。由结果(图6)可知,摄像机高度对计数精度有明显的影响,当摄像机位于较低高度如260、265、270 mm时,计数精度有一定的波动,而随着高度的继续增大,计数精度呈现下降趋势;稻谷总数对计数精度的影响不明显:当稻谷总数为200和100粒时,计数精度变化幅度相对较大,而当稻谷总数在150粒时,计数精度变化幅度相对较小。整体来看,计数平均精度为99.47%。引起计数误差的直接原因有:视觉系统对图像中某处连通域所属种类的判别出现错误,如稻谷四黏连连通域误判为五黏连连通域等[32]。
图6 各因素各水平对稻谷总计数精度的影响Fig.6 Effects of various factors and levels on counting accuracy of total grains
对装置进行总数计数精度测试,摄像机距离载物光源的高度设为260 mm,分别对10株稻穗的稻谷总数进行计数,每穗重复测量3次并记录平均值,测试结果见图7,决定系数(R2)为0.998 30,均方根误差(Root mean square error,RMSE)为1.408 8。
图7 稻谷总数计数值与实际值的关系Fig.7 Relationship between count value and actual value of total grains
3.1.2 稻谷空粒计数试验 稻谷空粒计数精度P2的计算公式为:
式中,U2是稻粒空粒数实际值,U3是稻谷空粒自动计数值。其中,稻谷空粒数实际值可以通过人工计数得出。
同样,以稻谷空粒计数精度为试验指标,以摄像机距离载物光源的高度和稻谷总数为试验因素进行试验研究,探究影响装置计数精度的因素的作用规律。
稻谷总粒数的3个水平均含40颗空粒。由试验结果(图8)可知,摄像机高度对计数精度有明显影响,计数精度在最低高度260 mm时取得最大值,随着高度的不断增大,计数精度呈现下降趋势;稻谷总数对计数精度的影响不明显。稻谷总数越多,计数精度的变化相对明显,下降的幅度相对更大,而当稻谷总数较少,计数精度的变化就相对平缓。整体来看,计数平均精度为87.17%。引起计数误差的原因主要有:小部分空粒不具备明显的开口现象,其外形与实粒非常接近,导致视觉系统不能有效地识别出这小部分空粒。
图8 各因素各水平对稻谷空粒计数精度的影响Fig.8 Effects of various factors and levels on counting accuracy of empty grains
对装置进行空粒计数精度测试,摄像机距离载物光源的高度设为260 mm,分别对10株稻穗的空粒进行计数,每穗重复测量3次并记录平均值,测试结果见图9,R2为0.987 80,RMSE为3.873 0。
图9 稻谷空粒计数值与实际值的关系Fig.9 Relationship between count value and actual value of empty grains
稻谷长、宽测量精度P3的计算公式为:
式中,U4是稻谷长宽实际值,U5是稻谷长宽自动测量值。
以稻谷长宽测量精度为试验指标,以摄像机距离载物光源的高度和稻谷品种为试验因素进行研究,探究影响装置测量精度的因素的作用规律。
在本试验中,3个水稻品种分别为‘江航丝苗’‘玉香油占’‘粤黄广占’,每个品种各取10颗实粒。在试验过程中,装置同时测量位于载物光源上的属于同一品种的10颗实粒的长和宽,并输出这10颗实粒长和宽的平均值。由试验结果(图10a、10b)可知,摄像机高度对计数精度有明显影响,摄像机高度在260 mm位置时,计数精度最高,随着高度增大,计数精度逐渐下降;稻谷品种对长度测量精度的影响不明显,但对宽度测量精度有明显影响:在长度测量中,‘江航丝苗’的测量精度一直属于最高一档,‘玉香油占’和‘粤黄广占’的测量精度较为接近;在宽度测量中,‘粤黄广占’的测量精度属于最高的一档,而其余2个品种的测量精度有明显差异。整体来看,长度和宽度平均测量精度分别为96.55%和96.36%。引起测量误差的原因主要有2个:一是稻谷两端的结构较为尖锐,在图像预处理时会被中值滤波过滤掉部分有效像素[33],最终导致测量结果偏小;二是稻谷自身具有一定的厚度并且表面粗糙,有可能以微小的倾斜角度在载物光源上处于静止状态,而这种状态下的稻谷的垂直投影的宽度不能很好地反映出稻谷的真实宽度,最终导致测量结果偏小。
图10 各因素各水平对稻谷长度、宽度测量精度的影响Fig.10 Effects of various factors and levels on the measurement accuracy of grain length and width
对装置进行稻谷长宽测量精度测试,摄像机距离载物光源的高度设为260 mm,3个水稻品种各取20颗实粒。每10颗实粒为1组进行测量,每组重复测量3次并记录平均值。测试结果见图11,长、宽测量的R2分别为0.996 10、0.782 90,RMSE分别为0.308 7、0.059 4。
图11 稻谷长度、宽度测量值与实际值的关系Fig.11 Relationship between measured value and actual value of grain length and width
目前人工方式无法有效地测量出稻谷的周长和面积值,本文利用能获取周长和面积实际值的规则图形,开展本装置的周长和面积测量精度试验。
评判装置周长、面积测量性能的指标是规则图形周长和面积测量精度P4,其计算公式为:
式中,U6是规则图形周长或面积实际值,U7是规则图形周长或面积自动测量值。
以规则图形周长和面积测量精度为试验指标,以摄像机距离载物光源的高度和规则图形种类为试验因素进行试验,探究影响装置测量精度的因素的作用规律。
在本试验中,3种规则图形分别为正三角形、正方形、正五边形,其边长均为10 mm。在试验过程中,装置每次都同时测量位于载物光源上的9个同种规则图形的周长和面积,并输出这9个规则图形的周长和面积平均值。由试验结果(图12)可知,摄像机高度对周长和面积测量精度的影响并不明显:摄像机高度对周长测量精度的影响规律取决于图形种类,当图形种类为正三角形和正五边形时,测量精度随着高度的增大而平缓上升,而当图形种类为正方形时,测量精度随高度的增大而平缓下降,面积测量时当摄像机高度为260 mm时测量精度最高,随着高度的增大,面积测量精度呈现缓慢下降趋势;图形种类对周长和面积测量精度有显著影响:正五边形的周长测量精度最低而面积测量精度最高,而正三角形的周长测量精度最高但面积测量精度最低。整体来看,周长平均测量精度为98.00%,面积平均测量精度为95.86%。引起周长面积测量误差的主要原因有:多边形的各个角结构较为尖锐,导致图像预处理时会被中值滤波过滤掉部分有效像素[33],从而使得测量结果偏小。
图12 各因素各水平对规则图形周长、面积测量精度的影响Fig.12 Effects of various factors and levels on the perimeter and area measurement accuracy of regular patterns
对装置进行规则图形周长和面积测量精度测试,摄像机距离载物光源的高度设为260 mm,规则图形种类分别为圆形、正三角形、正方形、正五边形、正六边形。每9个相同图形为一组进行测量。精度测试结果见图13,周长和面积的R2分别为0.995 10和0.999 98,RMSE分别为1.339 2和3.953 3。
图13 规则图形周长、面积测量值与实际值的关系Fig.13 Relationship between measured value and actual value of perimeter and area of regular patterns
在测量效率测试中,对每组稻谷的数量、长度、宽度、周长、面积、质量进行同步测量,共测量10组稻谷,并记录测量装置从开始到输出每组全部结果所耗时间。所使用的计算机的主要配置是:Windows 10系统,i7-8550U处理器,8 GB内存,512 GB固态硬盘。测量效率测试结果见表1,每组平均测量时间为9.28 s,每秒平均测量16.52粒。本测量装置相比人工计数(计数速度约为2.5粒/s)和常见的数粒仪(计数速度约为6.67粒/s)而言,在测量效率方面有明显的提高。
表1 测量效率测试试验结果Table 1 Results of measurement efficiency test
本文针对水稻谷粒考种参数自动提取方法和关键技术进行研究,研制了一种水稻谷粒数字化考种装置,实现了稻谷数量、长度、宽度、周长、面积、质量的快速并行测量,采用本文所提方法测量稻谷总数、空粒数、稻谷长度、宽度、周长、面积的决定系数分别为0.998 30、0.987 80、0.996 10、0.782 90、0.995 10和0.999 98,测量的平均精度分别为99.47%、87.17%、96.55%、96.36%、98.00%和95.86%,测量效率为16.52粒/s,表明本文所采用的稻谷粒考种参数自动提取方法可行,可为全自动考种装置的实现奠定基础。