李军宇,张淑娟,张学豪,薛建新
(山西农业大学 工学院,山西 太谷 030801)
李果实成熟度的高光谱成像判别研究
李军宇,张淑娟,张学豪,薛建新
(山西农业大学 工学院,山西 太谷 030801)
为实现对李果实成熟度的快速、准确判别,采用高光谱成像技术(450~1 000nm)采集不同成熟阶段(未熟期、半熟期、成熟期、过熟期)的李果实共计640个样本的高光谱信息进行判别研究。对不同成熟阶段的李果实样本测定表征成熟度的理化指标(可溶性固形物和硬度值)并进行单因素方差分析,结果表明:不同成熟度样本的两项指标均存在极显著差异,硬度值差异最大。采用连续投影算法(Successive projections algorithm,SPA)和主成分分析(Principal component analysis,PCA)分别提取得到不同成熟度样本光谱数据的10个特征波长(381、382、387、408、443、494、596、813、963、1 008nm)和前5个主成分值(累积贡献率达97.83%)。基于RGB、HSV颜色模型对不同成熟度李果实样本图像进行颜色特征提取,最终得到6项颜色特征指标(R、G、B 及H、S、V分量图像的平均值和标准差)。分别建立基于光谱信息、图像信息及融合信息的偏最小二乘(Partial least squares,PLS)判别模型,结果表明:基于特征波长和RGB特征信息融合值建立的PLS模型判别结果最佳,准确率达91.25%。由此可见,采用高光谱成像技术在光谱和图像信息方面对不同成熟度李果实进行判别是可行的、有效的,该研究为实现李果实成熟度在线检测提供了理论依据。
李果实;成熟度;光谱;图像;偏最小二乘模型
李果实[1]属蔷薇科李属植物,别名麦李、李实。其果实肥硕,汁甜肉脆且味酸性凉,具有清肝涤热、促进消化的功效,经常食用李果实又可起到美容养颜的作用,是人们最喜爱的水果之一。李果实属于典型的呼吸跃变型水果,其采收期主要集中于7、8月份的高温时期,采后果肉极易后熟软化,难以储存,造成经济损失。在实际生产过程中,经常采摘还未成熟的李果实,以延长其贮藏期;但若过早采摘,果实过于生硬影响口感且易受冷害,若过晚采摘,果实过于柔软,容易腐烂难以贮藏[2]。因此,确定合适的采摘成熟度是降低贮藏损失,保证水果品质的关键。
高光谱成像技术可以实现光谱信息与图像信息的融合[3],不仅在信息丰富程度方面有了极大提高,且对光谱数据可以进行更为合理、有效的分析处理,具有波段多、分辨率高等特点。蒋浩[4]等采用高光谱成像技术,建立多光谱参数对3种不同成熟度的草莓进行分类判别,研究表明:基于参数i1、i2、i3的线性判别分析模型优于参数i4,可用于草莓成熟度的自动分类。薛建新[5]等利用高光谱成像系统(400~1 000nm)采集4种不同成熟阶段的金沙杏光谱数据,结果表明:基于特征波长与颜色特征融合值建立的ELM模型判别结果最佳,判别准确率达93.33%。目前,关于高光谱成像技术对李果实成熟度进行分类研究的相关文献较少。
本文以4种不同成熟度的李果实为研究对象,利用高光谱成像技术采集得到不同成熟度李果实样本的光谱信息和图像信息,对光谱数据分别采用连续投影算法(SPA)和主成分分析法(PCA)进行光谱特征信息的提取;对图像信息采用RGB和HSV模型进行图像的颜色特征信息提取。依据光谱信息、图像信息及融合信息,分别建立李果实成熟度的PLS判别模型,通过分析比较确定最佳的李果实成熟度的判别模型。该研究可为李果实成熟度的在线检测装置设计提供理论依据。
1.1 样本采集
根据李果实开花期后发育阶段的不同,可分为4种成熟阶段:未熟期、半熟期、成熟期、过熟期。李果实未熟期果皮颜色呈青绿色,果实基部较硬;半熟期果皮颜色开始泛红,果实基部微硬;成熟期果皮颜色大部分为红色,果实基部较软;过熟期果皮颜色全部为深红色,果实基部很软。随着成熟度的增加,李果实的果皮颜色由绿向红转变,果实基部由硬变软。
本实验以采自山西太谷县侯城乡“脆红李”作为研究对象,分批次采摘处于不同成熟阶段的李果实样本各160个,共计640个实验样本。其中,未熟期样本于2015年6月15日采摘,半熟期样本于6月30日采摘、成熟期样本于7月10日采摘,过熟期样本于7月15日采摘。图1为不同成熟度的李果实样本。利用Kennard-Stone[6]算法,将不同成熟度的样本按照3:1的比例随机分成校正集(480个)和预测集(160个)。
图1 不同成熟度的李果实样本Fig.1 Different maturity of plums
1.2 仪器设备
实验中采用的高光谱成像系统主要由ImSpector V10E(Specim,Finland)成像光谱仪(光谱波段范围为
380~1 000nm),面阵CCD侦测器,2个光强可调的150W光纤卤素灯,OLE23型C-mount成像镜头,OBF570型滤光片,传送平台及计算机等设备组成。实验的采集物距(采集对象至镜头边缘)为30cm,曝光时间为3 000μs,平台运行速度为20mm/s,总运行距离为400mm。
1.3 黑白校正
由于光源强度在不同波段范围内分布不均,且接收器会产生暗电流噪声,导致采集到的图像在弱波段内含有噪声。因此,为了使系统标定环境与图像采集时的环境相同,需要进行黑白校正,转换公式参见文献[7]。
1.4 理化指标检测与分析
农村财务审计工作对于会计人员提出了更高的要求,增加了会计人员的工作内容与工作压力。现阶段,我国农村财务会计年龄普遍较大,其不具备必要的专业知识与职业素养,导致财务审计工作难以开展。在实际工作中财务账目处理错误时有发生,严重违反哭基础规范要求,农村财务账目真实性得不到有效的保障。这显然不利于农村经济的稳定发展。而通过推行农村财务审计工作,在一定程度上会对农村财务会计人员的工作造成压力,迫使他们改变敷衍了事的工作态度,提高工作质量,同时,审计标准的制度规定有利于促进农村财务会计工作人员了解现代会计工作制度要求,完善会计科目等,保障农村财务会计建账、记账、报账记录的真实性,会计资料的真实性。
可溶性固形物[8](Soluble solid content,SSC)和硬度值[9](Firmness)是确定水果成熟期的两个非常重要的理化指标。利用SPSS软件剔除李果实样本的可溶性固形物和硬度值中的异常样本,采用单因素方差分析对其可溶性固形物和硬度值进行显著性检验。李果实样本的理化指标值及方差分析如表1所示。从表1中可以看出:不同成熟度李果实样本的两项理化指标均具有极显著差异,两项理化指标均可表征成熟度,硬度值的F值远大于可溶性固形物,使用硬度值表征成熟度比可溶性固形物具有更显著的差异。因此,这两项理化指标可作为李果实成熟度的分类判别指标。
表1 李果实样本的理化指标分布及方差分析
1.5 判别建模方法
偏最小二乘[10](PLS)是一种应用广泛的建模方法,其采用迭代回归思路,在计算过程中根据其显著性逐步提取光谱数据中的成分,当显著性达到要求时停止,具有预测能力强、判别率高等优点。本研究中对不同成熟度李果实样本进行成熟度判别时,分别给每类样本(未熟期、半熟期、成熟期、过熟期)假设一个值(1,2,3,4)作为判别成熟度的依据,建立李果实样本成熟度的判别模型。
2.1 基于光谱信息的李果实成熟度判别
2.1.1 平均光谱分析
采用ENVI 4.7软件对不同成熟度李果实光谱图像提取感兴趣的区域,对得到的光谱曲线进行去噪、平滑处理并计算其平均值,得到4种不同成熟度的平均光谱曲线,如图2所示。从图2中可以看出:在450~1 000nm的波长范围内,不同成熟度李果实的光谱曲线变化明显。这可能是由于李果实在不同成熟度时内部碳水化合物、糖、氨基酸等成分不同引起的[11],样本在680nm和960nm处出现特征吸收峰。在680nm处的特征吸收峰反映了不同成熟度李果实果皮颜色的变化,可能是由于不同成熟度李果实果皮叶绿素含量的不同所致[12]。果皮叶绿素含量在果实成熟初期含量较高,随着果实的不断发育含量逐渐减少。在960nm处出现特征吸收峰,可能是由于果皮含水量不同引起的[13]。
图2 平均光谱曲线图Fig.2 Average spectrum image
2.1.2 特征波长提取
特征波长提取[14]是高光谱数据提取的一个中心环节,优选提取特征波长并建立模型,不仅可以大幅度提高运算速度,还可以提升模型的预测精度。
2.1.3 特征主成分分析
主成分分析(PCA)是一种多元统计分析方法,可实现数据降维。利用PCA对全波段光谱数据进行主成分分析,结果如表2所示。
表2 前8个主成分的累积贡献率
其中,前5个主成分的累积贡献率已达97.83%,所以选取前5个主成分值作为建模的输入参数。
2.2 基于图像信息的李果实成熟度判别
不同成熟度的李果实果皮色泽转化进程差异较大,由未熟的青色到过熟的深红色,变化比较明显,所以通过提取颜色特征值判别其成熟度是可行的。目前,对于图像特征信息提取采用的模型[15]有两种:一种是RGB模型,是由红、绿、蓝3种基本色彩混合后来描述图像;另一种是HSV模型,是由色调、亮度和饱和度来描述图像。
本文利用MatLab R2010b软件,采用RGB、HSV颜色模型对不同成熟度李果实样本图像进行处理,得到其R、G、B和H、S、V分量上的R、G、B 及H、S、V分量图像的平均值和标准差。其中,RGB模型提取到的不同成熟度李果实样本的6项颜色特征指标如表3所示。
表3 RGB模型提取到的6项颜色特征指标
从表3中可以看出:不同成熟度李果实样本其μR、μG、μB存在明显差距。其中,未熟样本μG明显高于其他样本,μG随着成熟度的增加呈递减趋势,是由于初期果皮中的叶绿素含量较高,随着果实发育其含量逐渐减少;过熟样本μR数值最高,是由于当果实接近成熟时,叶绿素不断降解,花青苷含量不断增加,果实呈现红色,因此μR值最高。未熟期和半熟期的μB、σR、σG、σB较为接近,可能会对李果实成熟度的判别造成一定误差。
2.3 判别结果分析
高光谱可以实现光谱信息和图像信息的融合,从而在本文中可对李果实成熟度进行更为合理、有效的分析。本文以光谱信息(特征波长、主成分)、图像信息(RGB特征信息模型、HSV特征信息模型)及融合信息(特征波长与RGB特征信息模型、主成分与RGB特征信息模型、特征波长与HSV特征信息模型、主成分与HSV特征信息模型)作为模型的输入量,分别建立李果实成熟度的PLS判别模型,对不同成熟度李果实样本进行判别研究。其中,校正集样本480个,预测集样本160个,判别结果如表4所示。
表4 基于PLS判别模型对样本成熟度的预测集判别结果
从表4中可以看出:光谱信息方面,基于特征波长建立的PLS模型的判别结果优于主成分模型,预测集准确率达到了89.37%。图像信息方面,基于RGB特征信息的PLS模型的判别结果优于HSV特征信息模型,准确率达85.63%,由于不同成熟度李果实颜色由青绿向深红转变,变化较为明显。总的来看,基于光谱信息建立的PLS判别模型普遍优于图像信息建立的PLS模型。
比较融合信息模型和单一模型可知:光谱和图像融合信息建立的PLS判别模型正确率相对较高。其中,光谱特征波长与RBG特征信息融合模型判别准确率要高于与HSV特征信息的融合模型,主成分与RGB特征信息融合的判别准确率高于与HSV特征信息融合模型,以特征波长和RGB特征信息值建立的PLS模型判别结果最佳,准确率达91.25%。
1)李果实样本的可溶性固形物和硬度值两项理化指标均可以表征李果实的成熟度,其硬度值的显著性差异最大,可以更好地表征成熟度。
2)针对不同成熟度李果实样本的光谱信息,基于特征波长建立的PLS判别模型准确率最高,达89.37%。图像信息方面,建立的基于RGB特征信息的PLS判别模型准确率最高,达85.63%。
3)将不同成熟度李果实样本的光谱和图像融合信息作为PLS模型的输入量,建立了4种李果实模型,结果表明:融合信息建立的PLS判别模型正确率相对较高,其中基于特征波长和RGB特征信息的融合模型判别结果最佳,准确率达91.25%。
[1] 雷静,关文强.黑总统品种李子全产业链物流保鲜技术[J].保鲜与加工,2016,16(3):107-109.
[2]KucukerE,OzturkB.Effectofpre-harvestmethyljasmonatetreatmentonpost-harvestfruitqualityofJapaneseplums[J].AfricanJournalofTraditionalComplementary&AlternativeMedicines,2014,11(6):105-117.
[3] 赵杰文,刘剑华,陈全胜,等.利用高光谱图像技术检测水果轻微损伤[J].农业机械学报,2008,39(1):106-109.
[4] 蒋浩,张初,刘飞,等.基于高光谱图像多光谱参数的草莓成熟度识别[J].光谱学与光谱分析,2016,36(5):1423-1427.
[5] 薛建新,张淑娟,张晶晶.基于高光谱成像技术的沙金杏成熟度判别[J].农业工程学报,2015,31(11):300-307.
[6] 王斌,薛建新,张淑娟.基于高光谱成像技术的腐烂、病害梨枣检测[J].农业机械学报,2013,44(S1):205-209.
[7] 徐明珠,李梅,白志鹏,等.马铃薯叶片早疫病的高光谱识别研究[J].农机化研究,2016,38(6):205-209.
[8] 张淑娟,张海红,赵艳茹,等.鲜枣可溶性固形物可见/近红外光谱检测建模方法比较[J].农业机械学报,2012,43(3):108-112.
[9] 郭文川,房丽杰,董金磊,等.介电谱无损检测梨内部品质方法研究[J].农业机械学报,2015,46(9):233-239.
[10] 张初,刘飞,孔汶汶,等.利用近红外高光谱图像技术快速鉴别西瓜种子品种[J].农业工程学 报,2013,29(20):270-277.
[11]MendozaF,LuR,ArianaD,etal.Integratedspectralandimageanalysisofhuperspectralscatteringdataforpredictionofapplefruitfirmnessandsolublesolidscontent[J].PostharvestBiologyandTechnology,2011,62(2): 149-160.
[12]RajkumarP,WangN,ElmasryG,etal.Studiesonbananafruitqualityandmaturitystagesusinghypersepctralimaging[J].JournalofFoodEngineering, 2012, 108(1): 194-200.
[13]ElMasryG,WangN,ElsayedA,etal.Hyperspectralimagingfornondestructivedeterminationofsomequalityattributesforstrawberry[J].JournalofFoodEngineering,2007,81(1):98-107.
[14] 程术希,谢传奇,王巧男,等.不同波长提取方法的高光谱成像技术检测番茄叶片早疫病的研究[J].光谱学与光谱分析,2014,34(5):1362-1366.
[15] 刘衍琪,詹福宇.MatLab图像与视频处理实用案例详解[M].北京:电子工业出版社,2015.
Research on the Hyperspectral Imaging Judgment of the Plum Maturity
Li Junyu, Zhang Shujuan, Zhang Xuehao, Xue Jianxin
(College of Engineering,Shanxi Agricultural University,Taigu 030801,China)
In order to achieve the rapid and accurate determination of the plums maturity, the hyperspectral imaging technology with the band of 450~1000nm was adopted to collect altogether 640 hyperspectral information samples of the plum for judgment.The samples were classified into four maturity, unripe, mid-ripe, ripe and over-ripe. Firstly, the soluble solid content (SSC) and firmness were chosen as physical and chemical indexes on the plum samples during various mature stages, and one-way analysis of variance was conducted, the results of which indicated that there were remarkable differences in the two indexes among samples , and the greatest differences was found in firmness .Afterwards, successive projections algorithm (SPA) was adopted, and 10 wavelengths at 381, 382, 387, 408, 443, 494, 596, 813, 963 and 1008nm were selected as the optimal sensitive wavelengths ; principal component analysis (PCA) was used to compress spectral data of plum samples, the analysis suggested that the cumulative contribution of the top 5 principal components with rate of 97.83%. Finally, 6 color feature indexes including the mean and the standard deviation of the R, G, B, H, S and V component images were obtained through extraction based on the RGB and HSV color feature information of the plum images . Spectral information, image information and fusion information were based on the partial least squares (PLS) models to judge the plums maturity. The results demonstrated that the PLS model based on the sensitive wavelength and RGB characteristic information was the best, and accuracy rate of 91.25%. Thus it could be seen that the adoption of hyperspectral imaging technology to judge the plums with various degrees of maturity on the aspects of spectrum and image information was feasible and effective, and this research had provided theoretical foundation for achieving the online detection of the plums maturity.
plums; maturity; spectrum; image; partial least squares model
2016-10-08
国家自然科学基金项目(31271973);山西省自然科学基金项目(2012011030-3)
李军宇(1991-),女,山西襄汾人,硕士研究生,(E-mail)lijy0801@126.com。
张淑娟(1963-),女,山西襄汾人,教授,博士生导师,(E-mail)zsujuan1@163.com。
S123; S662.3
A
1003-188X(2017)12-0141-05