基于PCA和Whitening算法的水稻病害图像预处理研究

2017-04-25 05:10路阳衣淑娟张勇安杏杏邵晓光
黑龙江八一农垦大学学报 2017年2期
关键词:白化预处理病害

路阳,衣淑娟,张勇,安杏杏,邵晓光

(1.黑龙江八一农垦大学,大庆 163319;2.东北石油大学)

基于PCA和Whitening算法的水稻病害图像预处理研究

路阳1,衣淑娟1,张勇2,安杏杏2,邵晓光2

(1.黑龙江八一农垦大学,大庆 163319;2.东北石油大学)

水稻病害图像预处理在使用机器视觉技术对水稻病害智能诊断识别中至关重要。预处理效果直接影响水稻病害识别准确率。提出一种新的基于PCA和Whitening融合算法的水稻病害图像预处理方法。实验获取了水稻病害彩色图像和灰度图像的训练样本和测试样本,对获取的样本应用PCA降维,然后对降维后的样本随机取样,应用Whitening算法得到了相应的训练特征和测试特征。实验表明,该融合算法增强了预处理后的水稻病害图像样本对光照及亮度的鲁棒性,可有效提高病害识别准确率。

PCA;Whitening;水稻病害;图像预处理

深度学习是机器学习领域的研究热点,由Hinton等人2006年提出。目的就是要建立模拟人脑分析学习的神经网络,要求能够模仿人脑的机制来解释图像、声音、文本数据等,是基于人工神经网络的模式识别进一步拓展。Yann LeCun、Yoshua Bengio和Geoffrey Hinton三位在深度学习领域最有影响力的科学家2015年5月在Nature杂志上发表的Deep learning文章,对深度学习的基本原理和核心优势进行了综述,指出深度学习正在取得重大进展,解决了人工智能界很多年没有进展的问题,将来深度学习会取得更多成功[1]。1998年11月,Yann LeCun等人设计的LeNet-5卷积神经网络在MNIST手写数据库上取得巨大的成功[2]。2016年3月,谷歌公司开发的人工智能机器人AlphaGo依靠深度学习技术4∶1击败韩国棋手李世石,再次证明了深度学习能力的强大。

深度学习在人工智能训练、建模和应用方面取得了巨大的突破,未来的应用与发展令人瞩目。基于深度学习在模式识别方面取得的巨大成功,在水稻病害智能诊断与识别领域引入深度学习是可行的。谭文学,赵春江等在2014年11月设计了弹性动量深度学习卷积网络识别果蔬果体病理图像,识别率达到98.2%,取得较好的效果[3]。基于深度学习的水稻病害识别诊断技术就是对水稻病害图像进行深层学习,从中获取更有效的病斑特征用于辨别病害,在模式识别、计算机视觉和机器学习、农业工程领域有着重要应用[4-7]。

在基于深度学习的机器学习系统中要达到较高的识别率,原始图像数据的采集、数据的标注、图像特征提取等数据预处理操作至关重要,决定着机器学习系统能否成功。深度学习用于水稻病害识别诊断能否成功关键在于有效的特征提取。而特征提取算法中,数据的归一化、数据的白化等预处理操作影响着算法的好坏。由于采集的彩色水稻病害图像在计算机处理过程以矩阵形式表示,数据庞大,必须降维,否则会导致计算机学习效率低下,甚至内存溢出。在人脸识别、故障诊断等模式识别领域,使用主成分分析(Principal component analysis,PCA)进行数据降维和使用白化(Whitening)算法取得很大的成功[8-11]。

基于以上分析,应用PCA算法对水稻病害图像降维,随机提取出图像的片(patch),之后对图像的片采用白化算法提取病斑特征,为深度学习用于病害诊断算法性能提高打下坚实的基础。给出了PCA分析、Whitening分析等数据预处理操作的基本原理、实验过程及相应结论。

1 PCA分析

PCA区别于一般的图像预处理方法,在提取图像特征的过程中,考虑的是图像整体结构,随机提取出图像的片,而不用考虑图像的像素。在深度学习中,PCA能极大提升无监督特征学习速度,从而能提高图像的识别效果。基本原理是:首先根据要求解的实际问题提取图像特征,然后选择合适的协方差矩阵,通过坐标变换,将样本数据映射到新的坐标系下,在新的特征空间中,表示原样本只需找到原样本的一组最大线性无关组的特征值对应的空间坐标即可,从而实现降维。如果一个彩色水稻病害图像为128×128,提取的RGB三个通道的颜色特征就有128×128×3这么多,针对1024×1024的图像,直接提取的特征就会达到几十万,所以不降维的话,那么后面的训练和分类都会非常困难。

在深度学习中,由于采集的病害图像都是自然图像,该原始图像不能满足我们的训练需要,考虑到计算机内存大小、模型训练速度等因素,必须对这些自然图像进行PCA分析。同时因为自然图像具有稳定性,即图像中某个部分的统计特征和其他部位的特征相似,因此学习到的某个部位的特征也同样适用于其他部位。PCA分析最主要目的是去除图像数据间的相关性。在对水稻病害图像进行PCA分析之前,需要对病害图像进行数据归一化预处理操作。在归一化过程中,对每个特征维,都减掉图像本身的平均值,然后将这些不同维的数据除以每维的最大值,从而归一化到[0,1]范围。PCA算法描述如图1所示:

图1 PCA降维算法流程图Fig.1 PCA dimension reduction algorithm flow chart

算法关键步骤:

2 Whitening分析

数据的白化是在数据归一化之后进行。很多深度学习算法性能提高都要依赖于数据的白化。在对数据进行白化前要先对数据进行特征标准化,Whitening的目的是去掉数据之间的相关联度,是很多算法进行预处理的步骤。当训练图像样本数据时,由于图像中相邻像素值有一定的关联,因此采用Whitening操作把多余的相关冗余信息消除。

算法关键步骤:

令图像数据x经过PCA降维后为矩阵z,x(i)∈Rn代表为随机抽取的16×16的图像块的亮度值,对每幅图像进行零均值化操作:

指图像块x(i)的平均亮度值。

由于z中每个图像块的每一维相互独立,因此将z中的每个图像块的每一维都除以标准差得到每一维的方差即可,公式为:

3 水稻病害图像预处理实验

水稻病害图像预处理实验过程主要包括水稻病害图像数据库的建立、图像尺度归一化、PCA和Whitening等几个过程。具体流程见图2。

图2 水稻病害图像预处理流程图Fig.2 Rice disease image preprocessing flow chart

3.1 水稻病害图像库的建立

在自然光照条件下,使用佳能EOS 5D Mark III数码相机获取北方寒地水稻常见10种病害,包括白叶枯病、稻曲病、稻瘟病、恶苗病、褐斑病、胡麻斑病、立枯病、青枯病、纹枯病及叶鞘腐败病。这些水稻病害图片针对水稻生长前期、中期及晚期分别采集,每种病害采集10幅图像,共采集100幅图像,其中50幅用来训练,50幅用来测试,每幅图像采用jpg格式存储。

3.2 图像尺度归一化

由于用照相机采集的水稻病害图像在自然光照条件下进行,受光照影响较大,为了去除光照亮度对图像的影响,需要对图像进行归一化处理。通过尺度归一化预处理,对原始病害图像光照不均进行补偿,使得待识别的水稻病害图像遵循相似的分布。常用的归一化有样本尺度归一化,逐样本的均值相减,特征的标准化3种。由于逐样本的均值相减主要针对灰度图像,这里主要采用样本尺度归一化和特征标准化预处理。实验中将图片尺度归一化到96×96大小,且将每张图片变成一个列向量,多个图片样本构成一个矩阵。将训练和测试图片分成2部分,且每部分包含了RGB颜色图,灰度图2种。尺度归一化为96×96像素的水稻稻瘟病图像集如图3所示:

图3 尺度归一化为96×96像素的水稻稻瘟病图像集Fig.3 The scale normalized to 96×96 image set of rice blast

3.3 特征提取

为了用提取出来的部分图像来训练深度学习某种模型,随机提取出局部patch(10×10大小)样本,然后对这些patch样本进行Whitening操作。从给定的多张自然图片中随机提取出大小为10×10的patches图片如图4所示。

图4 随机提取出的10×10大小的patches图像Fig.4 The stochastic extracted 10×10 patches of rice blast image

使用sparse-autoencoder方法训练上述样本,学习到的特征如图5所示。

3.4 水稻病害识别对比分析

对水稻病害图像数据库中的10种常见病害,使用传统的数字图像处理方法提取了病斑的边缘特征、纹理特征和颜色特征,使用经典的softmax分类器对病害识别,实验结果见表1。从表中数据可以看出,应用文中提出的PCA-Whitening算法提取到的特征对水稻病害识别具有更高的识别准确率。

图5 学习到的特征Fig.5 The feature of learning

表1 四种不同特征提取算法识别率对比(%)Table 1 Comparison of recognition rate of four different feature extraction algorithms

4 结论

建立了北方寒地水稻10种常见病害的图像数据库,提出一种基于PCA和Whitening融合算法的水稻病害图像预处理方法。通过实验获取了水稻病害彩色图像和灰度图像的训练样本和测试样本,对获取的样本进行随机取样,并应用PCA和白化算法得到了样本相应的训练特征和测试特征。实验结果表明,相比传统的边缘特征、纹理特征和颜色特征,使用提出的预处理算法学习到的特征对水稻病害进行识别确实提高了水稻病害诊断的正确率。

[1] Yann Lecun.Yoshua Bengio and Geoffrey Hinton[J].Nature,2015,521:436-444.

[2] LeCun Y,Bottou L,Bengio Y,et al.Gradient-based learning applied to document recognition[J].Proceedings of the IEEE,1998,86(11):2278-2324.

[3] 谭文学,赵春江,吴华瑞,等.基于弹性动量深度学习的果体病理图像识别[J].农业机械学报,2015,46(1):20-25.

[4] 周燕,张亚玲,王丹,等.黑龙江省稻瘟病菌对主栽水稻品种的致病力分析[J].黑龙江八一农垦大学学报,2015,27(2):23-26.

[5] 马宁,孟志军,王培,等.农作物病虫害预报方法研究综述[J].黑龙江八一农垦大学学报,2016,28(1):15-18.

[6] Sidong Liu,Weidong Cai,Sonia Pujol,et al.Early Diagnosis of ALZHEIMER’s Disease with Deep Learning[J].IEEE 11th International Symposium on Biomedical Imaging(ISBI),2014,20:1015-1018.

[7] 冯雷,高吉兴,何勇,等.波谱成像技术在作物病害信息早期检测中的研究进展[J].农业机械学报,2013,44(9):169-176.

[8] M Kirby,L Sirovich.Application of the Karhunen-Loeve procedure for the characterization of human faces[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,1990,12(1):103-108.

[9] 李彦璇,王蓉.基于Gabor小波特征提取的PCA人脸识别方法[J].电脑知识与技术,2015,11(32):138-141.

[10] 高东,吴重光,张贝克,等.基于PCA和SDG的传感器故障诊断方法研究及应用[J].系统仿真学报,2011,23(3):567-573.

[11] 陈素根,尹贺峰.基于白化PCA图像重构的特征补偿人脸识别新方法[J].计算机应用研究,2015,32(9):2853-2856.

Research of Rice Disease Image Preprocessing Based on PCA and Whitening Algorithm

Lu Yang1,Yi Shujuan1,Zhang Yong2,An Xingxing2,Shao Xiaoguang2
(1.Heilongjiang Bayi Agricultural University,Daqing 163319;2.Northeast Petroleum University)

Rice disease image preprocessing played very important role in the intelligent diagnosis and identification of rice diseases by using machine vision technology.Preprocessing results directly affected the accuracy of rice disease identification.A new image preprocessing method for rice diseases based on PCA and Whitening fusion algorithm was proposed.The color images and gray images of the training samples and test samples of rice disease were obtained,and the PCA dimension reduction algorithm was used to the obtained samples.Then sampling stochastic to the dimension reduction samples.After that,the Whitening algorithm was applied to the stochastic samples.Finally,the corresponding training features data and testing features data were obtained.Experiments showed that the fusion algorithm could enhance the robustness of the sample to the illumination and brightness,and improve the recognition accuracy rate of the disease effectively.

PCA;Whitening;rice disease;image preprocessing

TP391.41

A

1002-2090(2017)02-0097-05

10.3969/j.issn.1002-2090.2017.02.019

2016-06-30

黑龙江省杰出青年科学基金(JC2015016);黑龙江省自然科学基金面上项目(F201428);黑龙江省农垦总局重点科技计划项目(HNK125B-04-03);中国博士后科学基金面上项目(2016M591560);黑龙江省政府博士后资助经费(LBHZ15185);黑龙江省大学生创新创业训练计划项目(201610223040);东北石油大学研究生创新科研项目(YJSCX2016-026NEPU);大庆市指导性科技计划项目(zd-2016-011)。

路阳(1976-),男,副教授,东北石油大学毕业,现主要从事模式识别与机器学习方面的研究工作。

衣淑娟,女,教授,博士研究生导师,E-mail:yishujuan_2005@126.com。

猜你喜欢
白化预处理病害
早春养羊需防六大病害
求解奇异线性系统的右预处理MINRES 方法
小麦常见三种病害咋防治
葡萄病害周年防治历
高COD二噻烷生产废水预处理研究
果树休眠期咋防病害
白化黄喉拟水龟人工培育研究①
最严重白化
基于预处理MUSIC算法的分布式阵列DOA估计
白化茶种质资源分类研究