卢泽如,蒋舜尧,熊勤学,邱先进,周子尧,杨 权
(长江大学农学院,湖北 荆州 434025)
目前国内外对稻谷品种检测方法主要包括苯酚染色法、幼苗鉴别法和分子标记法等[1],这些方法检测成本高、鉴定周期长、检测效果差、检测结果一致性不好。随着计算机技术和图像处理技术的迅速发展,特别是人工智能、大数据和云计算的出现为机器视觉技术对稻谷品种进行快速、高效分类识别提供了技术条件。Macalalad 等[2]运用图像识别技术提取稻谷的面积、周长、扁率等形态学差异特征值后,运用最小距离法准确从图像中识别3 种稻谷品种;黄星奕等[3]介绍了一种把图像的颜色特征和形状特征结合起来进行稻谷品种识别的新方法;熊利荣等[4]利用Bayes 判别法建立了籼稻、糯稻、粳稻3 大类的类别模型和9 个稻谷种子的品种模型,模型判别效果显著;吕一波等[5]在对955 个玉米颗粒图像研究的基础上,探讨了用自然光和白炽灯照射下获取的彩色模型来识别、分割玉米图像的可行性,提出用直径和圆形度参数来表征玉米的几何特征;宋韬等[6]以表示玉米子粒轮廓的个体特征参数作为输入信号,用神经网络方法进行玉米形态识别研究,对粒完整及粒破损的玉米子粒识别试验显示,正确率为93%。尽管相关研究对农作物品种和方法进行了探究,但面对全国5 万多个稻谷品种[7],只有建立稻谷品种特征库,才能运用云技术和图像识别技术开展稻谷品种快速区分工作,稻谷品种形态学差异特征值的确立是建立稻谷品种特征库的前提[8]。本研究运用图像识别技术提取31 个水稻品种的41 种形态学特征值,再利用统计分析方法,寻找出能区分稻谷品种差异的形态学特征值,以期为稻谷品种形态学检测打下基础。
供分析的稻谷品种有31 个,每个品种有稻粒20~50 粒,品种间的形状与颜色有一定差异,其名称及图片见表1。
表1 供分析的稻谷品种及图片
1)扫描图像。将稻谷连同调色板放在扫描仪上,设定扫描分辨率为180 dpi,扫描成jpg 格式的图像。
2)图像校正。将图像在Image Pro Plus 软件中打开,根据扫描分辨率和calibration->spatial 功能设置图像空间分辨率;运用calibration->intensity 结合调色板中RGB 值进行色彩校正。
3)图像识别。运用measure->count/size 功能对图像中稻谷进行识别,识别方式选择Automatic Dark Objects,如果稻谷有相连现象,用auot split 功能将它们分开。
4)稻谷特征量提取。在软件中选取所有测定内容,点击measure 键,并选取提取41 种形态学特征值参数[9](表2),其中31 个表征几何特征参数,10 个表征颜色特征参数,没有选取表征位置特征的参数。
表2 特征量及释义
5)稻谷特征量导出。选择软件中的导出功能,将提取的41 种形态学特征值导至Excel 软件中供统计分析。
采用判别分析方法对稻谷形态学特征值进行筛选。31 个品种按0~30 编号,然后在SPSS 软件中打开,在判别分析方法中选取因子逐步引入剔除方法,总样本数为1 290。
采用聚类方法对稻谷形态学特征值统计分析。将每个稻谷品种所有特征值进行平均,然后在SPSS软件中打开,选取系统聚类分析方法,引入因子为前面选定的特征值,输出中要求输出分类图。
设不同的引入最小偏F值和剔除最大偏F值,观察分类结果的准确率,随着引入最小偏F值和剔除最大偏F值的增加(每次增加0.5),其入选的因子减少,回代准确率开始为73.0%,逐步下降。当引入最小偏F值为8 和剔除最大偏F值为6 时,入选因子为9 个,其回代准确率为62.8%;以后再增加F值,入选因子为和回代准确率不变,至引入最小偏F值为23 和剔除最大偏F值为21 时,入选因子为6 个,其回代准确率为43.3%。综合上述分析,以入选因子少、回代准确率损失不大为原则,选取引入最小偏F值为8 和剔除最大偏F值为6 作为判别分析引入因子的原则,确定了9 个因子为表征稻谷品种差异的形态学特征值,分别是Aspect(最长轴与最短轴比率)、Density(max)(最 大强度)、Area(面积)、Density(green)(绿光强度)、Axis(minor)(短轴长度)、Density(mean)(强度均值)、Density(blue)(蓝光强度)、Axis(major)(长轴长度)、Density(std.dev。)(强度标准差)。这9 个因子中表示几何形状的有4 个,分别为Aspect、Area、Axis(minor)和Axis(major);表示颜色的有5 个,分别为Density(max)、Density(green)、Density(mean)、Density(blue)和Density(std.dev.)。说明稻谷品种的差异主要表现在几何形状上,如稻谷有短圆、细长、双尖等特征,在颜色上有淡黄色、深黄色等。
分别用稻谷品种形态学41 个特征值和选取的9个差异特征值,采用SPSS 软件的系统聚类分析方法,分别对31 个稻谷品种进行分类,其分类结果一致(图1),说明这9 个差异特征值能代表41 个特征值,能反映稻谷品种之间的差异。由图1 可知,把31种水稻品种分为5 类,分别是淡黄色短圆型、淡黄色长扁型、深黄色长扁型、深黄色短圆型和深黄色双尖型,由于没有这31 个品种的分类信息,不清楚分类结果与其品种属性是否存在内存联系。
图1 31 个稻谷品种的聚类分布
本研究成功提取了能反映稻谷品种差异的9 个特征值,分别为表示几何形状的Aspect、Area、Axis(minor)、Axis(major)4 个特征值和表示颜色的Density(max)、Density(green)、Density(mean)、Density(blue)、Density(std.dev)5 个特征值,对31 个稻谷品种进行了聚类分析。
由于没有稻谷品种的其他信息,没有对特征值与稻谷生物学性状进行分析,作物表型是作物品种内在特征的表现,这也是需要进一步研究的方向。