储藏小麦外观品质时变特性研究

2020-11-25 12:06杨志晓范艳峰郑乔丹
关键词:概率密度麦粒储藏

杨志晓,范艳峰,郑乔丹

1.河南牧业经济学院 能源与智能工程学院,河南 郑州 450011 2.河南工业大学 粮食信息处理与控制教育部重点实验室,河南 郑州 450001 3.河南省粮食光电探测与控制重点实验室,河南 郑州 450001

小麦的几何、颜色、纹理等外观特征是区分不同品种、不同品质小麦的重要属性[1-3]。其中小麦颜色是最直观的外观特征,主要有黄色、白色、蓝色、紫色、红色等[4]。花青素是影响小麦颜色的重要因素,花青素的种类不同,小麦呈现不同的颜色。小麦在储藏过程中,由于性状的改变、霉变[5-6],以及病虫害的发生,其颜色也会发生变化。小麦籽粒颜色是影响面粉颜色的重要因素之一,而面粉颜色直接决定面制品的品质性状[7]。目前,对小麦颜色的研究,多从基因和遗传学的角度进行[8-12]。张蓝月[12]对小麦粉L*、a*、b*值随储藏条件的变化进行了研究。总的来看,对储藏小麦颜色的变化与其性状的关系研究还相对较少。小麦颜色能够在以机器视觉为代表的小麦品种和品质检测中发挥重要作用。如使用小麦颜色、几何、纹理特征的稀疏表示方法进行小麦品种识别[13];利用小麦的颜色、几何特征训练BP神经网络对小麦的品种进行分类[14];从麦粒的图像训练深度神经网络识别不同品种的小麦[15]。同一品种的小麦,经过一段时间储藏后,如果颜色发生较明显的改变,那么可以认为小麦的性状、品质发生了变化。因此小麦颜色是反映其储藏品质的重要特征。此外,如果能够知道小麦颜色随储藏条件、储藏时间的变化规律,还可以根据其颜色值推断小麦大致的储藏时间。因此,作者选择颜色作为麦粒的典型外观特征,开展储藏小麦颜色时变特性的研究,得到小麦颜色随储藏条件、储藏时间的变化规律,对小麦品质检测具有重要意义。

1 小麦颜色特征提取

称取约500 g小麦粒样本。随机选择一定数量的小麦粒,将其散开,方位、朝向随机地放置于黑色平整平面上。小麦粒之间互不接触。使用相机拍摄放置好的小麦粒图像,保存为jpg格式。将被拍摄的小麦粒与其他样本一起,暴露于空气中,常温储藏。每隔3月重复上述操作,拍摄获取小麦粒图像。对拍摄获得的小麦粒图像,基于Python编程语言和scikit-image图像处理模块,编写麦粒图像特征提取和分析程序。将jpg格式的彩色图像转换为灰度图像,获取灰度图像上每个麦粒的闭合图像区域,计算并获取每个麦粒图像的中心位置、方位、长轴、短轴。在每个麦粒图像的长轴、短轴上共选取25个点,如图1a所示。在彩色图像上,用矩形框将对应位置的麦粒图像进行标定,并标出其长轴、短轴的正半轴,如图1b所示。

图1 小麦图像特征提取示意图Fig.1 Schematic diagram of wheat image feature extraction

在麦粒彩色图像和灰度图像上,对所选择的长、短轴上的25个点,分别提取每个点的红、绿、蓝、灰度4个颜色特征。将第1次拍摄的麦粒图像以类标签0标记,将距第1次拍摄后小麦样本放置3月再次拍摄的麦粒图像以类标签1标记,将距第1次拍摄后小麦样本放置6月拍摄的麦粒图像以类标签2标记,由此共得到3个批次、储藏期间隔为3月的小麦图像。统计小麦颜色数据集的麦粒数量,红(R)、绿(G)、蓝(B)、灰度(Gray)样本数量。类标签为0时,麦粒为165个,R、G、B、Gray数量均为4 125个;类标签为1时,麦粒为119个,R、G、B、Gray数量均为2 975个;类标签为2时,麦粒为134个,R、G、B、Gray数量均为3 350个。

为了消除不同次拍摄照片时距离、光线等因素对颜色特征的影响,将每个储藏期提取到的麦粒图像颜色进行极差标准化处理,计算公式为:

式中:x为某个颜色通道的颜色值;xmax为该颜色通道的最大颜色值;xmin为该颜色通道的最小颜色值;x′为标准化后的颜色值。标准化后,每个颜色通道的颜色值介于[0,1]。将标准化后的小麦颜色数据集保存为csv文本格式的数据文件。

2 储藏小麦颜色的时变特性分析

从各通道颜色的分布、平均值角度,对小麦经过不同储藏期的颜色变化特性进行分析,并考察不同储藏期小麦颜色的可区分性。

2.1 小麦颜色随储藏时间的变化特性

颜色值能反映小麦颜色的整体情况。分别计算不同储藏期各个通道的颜色值,它们随储藏时间的变化曲线如图2所示。

图2 小麦颜色值随储藏时间的变化Fig.2 Variation of wheat color values during storage

从图2可以看出,小麦红、绿、蓝、灰度等颜色的特征值都随储藏时间的延长而变大,且在测试时间段内基本呈线性变化。这说明小麦颜色的各个维度有随储藏期延长而变大的趋势。在各个时间节点,小麦的红色维平均值最大,蓝色维平均值最小,绿色维平均值介于中间。

将测试期内麦粒各颜色进行线性回归拟合,得到的颜色值随储藏时间变化的方程为:

R=0.02t+0.80,

G=0.03t+0.55,

B=0.02t+0.51,

Gray=0.03t+0.58,

式中:t为时间,月;R,G,B,Gray分别为介于[0,1]的颜色值。4个颜色通道的回归线如图3所示。

图3 小麦颜色值随储藏时间的变化的回归线Fig.3 Regression lines of wheat color valueschange during storage

2.2 小麦颜色的分布随储藏时间的变化特性

颜色值只能反映小麦颜色的整体情况,要更详细考察小麦颜色的状况,可从分布的角度进行分析。将[0,1]颜色区间划分为20个等宽、相连的区间,统计每个颜色维的颜色值落在各个区间的频率,作为颜色分布的概率密度估计,可得各个储藏期的小麦颜色分布,结果如图4所示。从图4a可以看出,小麦的绿、蓝、灰度3个特征基本呈正态分布。红色的概率密度峰值出现在颜色值域的最右侧区间,也基本呈现左侧半幅的正态分布。图4b和图4c表明,随着储藏时间的延长,绿、蓝、灰度3个特征的概率密度峰值向右移动,说明颜色值大的样本数量随储藏期的延长而增多。红色概率密度峰值随储藏期的延长而变大。

图4 各储藏期小麦颜色的分布Fig.4 Color distribution of wheat in different storage periods

表1给出了各个颜色维概率密度峰值在3个储藏期的定量值及所处的颜色区间。可以看出,红色峰值颜色值始终位于(0.95, 1.00],且随储藏时间的延长红色峰值迅速变大。这说明随储藏时间的延长,红色值落入该区间的样本数量变多。绿色、蓝色、灰度值的概率密度峰值基本保持不变,但峰值颜色区间随储藏时间的延长而向右侧颜色值大的方向移动。说明概率密度峰值虽然变化不大,但峰值在随储藏时间的延长而发生右移。

表1 不同储藏期麦粒颜色的概率密度峰值及对应颜色值区间Table 1 Peak probability density of wheat color and corresponding color value interval in different storage periods

小麦红色概率密度峰值随储藏时间的变化曲线如图5所示。可以看出,分布在(0.95,1.00]的小麦红色样本数量随储藏时间的延长而迅速变大,在测试期内基本呈线性关系,其拟合曲线为:

Prmax=0.06t+0.20,

式中:Prmax为红色概率密度峰值;t为储藏时间,月。

图5 小麦红色概率密度峰值随储藏时间的变化曲线Fig.5 Curve of peak probability density of red in wheat during storage

2.3 小麦颜色在不同储藏时间的可区分性

小麦颜色随储藏时间的变化情况能否成为依照颜色评价小麦品质的判断依据。这需要对不同储藏期小麦颜色的可区分性进行评价。从小麦颜色数据集的可聚类性和分类性能两个方面评价其可区分性。

将不同储藏期的小麦颜色样本视为无标签样本,即不考虑颜色数据集的类标签,评价小麦样本的聚类性能。K均值聚类是常用的无监督学习方法。它根据样本的相似性将其划分为K个不同的簇,使得同一簇内的样本尽可能相似,不同簇间的样本尽可能不相似。每个样本只能归属于其中的一个簇。

肘部法则是确定将样本划分为最佳蔟数(最佳K值)的方法,其基本思想:在K小于样本实际类别数时,样本的平均畸变程度随K的增加而迅速降低;当K大于样本实际类别数时,样本的平均畸变程度随K的增加变化缓慢。则平均畸变程度从迅速降低到变化缓慢的拐点即是样本可聚集的最佳蔟数。令K为1~10,分别对小麦颜色样本进行K均值聚类,计算每个K下的样本平均畸变程度,所得曲线如图6所示。

图6 小麦颜色样本的平均畸变程度随K均值聚类的K的变化曲线Fig.6 Curve of average distortion degree of wheat color samples with K-means clustering

从图6可以看出,曲线的拐点位于K=3处,这与小麦颜色数据集收集储藏期为0、3、6月的3个时间点的样本相吻合。

分别使用兰德系数、互信息、V-measure评分、轮廓系数评价小麦颜色数据集在不同K的K均值聚类性能,4个指标随K变化的曲线如图7所示。可以看出,兰德系数和互信息的峰值位于K=3处,V-measure评分和轮廓系数的最大值位于K=2处,综合来看,可以确定K=3为较优的可聚类蔟数,与小麦颜色数据集来源于3个不同储藏期相吻合。

图7 小麦颜色数据集K均值聚类性能指标随K变化的曲线Fig.7 K-Means clustering performance index curve of wheat color dataset with K

按照储藏期0、3、6月,将小麦颜色数据集视为3个类别的样本,类标签分别为0、1、2, 训练有监督的分类器,对小麦颜色数据集进行分类,评价数据集的可分类性。

随机抽取样本,将小麦颜色数据集按照8∶2拆分为互斥的训练集和测试集。使用机器学习API scikit-learn的svm模块,以训练集训练多项式核的支持向量机分类器。使用训练的分类器预测测试集的样本类别。使用5折交叉检验方法评价分类器的性能,其分数分别为0.97、 0.97、 0.98、 0.97、 0.96分。 这说明分类器的预测准确率高,各个储藏期小麦颜色特征区分明显。

3 结论

将小麦常温暴露于空气中储藏,以3月为时间间隔,随机选择小麦粒,采集红、绿、蓝、灰度颜色特征。试验结果表明:小麦的红、绿、蓝、灰度颜色平均值随储藏时间的延长有变大趋势,且在测试期内呈线性变化;4个颜色特征基本呈正态分布,概率密度峰值随储藏时间的延长有右移(颜色值变大)趋势;红色的概率密度峰值始终位于颜色值上限区间,且随储藏时间的延长而迅速线性变大;以3月为间隔,在3个时间点取得的小麦颜色样本具有较好的聚类性和可分类性,间接说明在3个储藏时间点,小麦的性状发生了较明显的变化。

由于小麦样本并非取自刚成熟时期,首次颜色特征提取时间距小麦成熟晒干已过去久远。此外由于时间原因,仅提取了6个月储藏期的小麦颜色特征,因此本文结论仅反映小麦某段储藏期的颜色变化规律。要了解小麦全储藏期的颜色变化规律,以及颜色变化与小麦内在性状的关系,需要进一步深入研究。

猜你喜欢
概率密度麦粒储藏
掉在石缝里的麦粒
连续型随机变量函数的概率密度公式
基于GUI类氢离子中电子概率密度的可视化设计
男性卫生洁具冲水时间最优化讨论
胡萝卜冬季储藏注意事项
桃如何储藏
便于储藏的美味
从麦粒到面包
麦粒儿的承诺