郭峰尹琴李虹
(榆阳区农产品质量安全监测检验中心陕西省榆林市719000)
关于农产品无损检测中的模式识别问题分析
郭峰尹琴李虹
(榆阳区农产品质量安全监测检验中心陕西省榆林市719000)
无损检测技术即非破坏检测,具体而言,指代在不损毁待测物初始状态、干扰化学性质的基础上,为得到和待测物紧密相关的参数信息的一种检查方法。本文笔者结合现有理论成果,围绕无损检测展开了深入剖析,希望可为农产品检测提供帮助。
农产品;无损检测;模式识别;问题分析
时代的发展和经济的提升,加大了农产品的日常需求量,并对农产品品质提出严格的标准,为迎合这一需求,攻克原有农产品检测的不足,亟待提出一种新技术,在这一背景下,无损检测应运而生。对农产品而言,无损检测除能够为农产品质量提供保障,还可减少能源用量,控制生产成本,改善劳动生产率。
无损检测技术属于一门现代、系统的应用学科,具体是指在不损毁待测对象的基础上,借助农产品自身的结构异常,利用内部缺陷面向声光等反应所产生的变化,以此来检验农产品,同时围绕缺陷类型、基本性质、实际数量、实际位置、主要尺寸等进行判断与评价。参照无损检测原理可将检测方法划分成光学、声学和电学特性分析等不同方法;品质检测一般指代果蔬检测和分级;大豆和玉米等谷物检测和分级;参照农产品的基本品种和不同的特性,因农产品种类的差异,一般应选择对应的检测方法与装置。
2.1 数据预处理
在无损检测工作中,无损检测仪器得到的最初数据存在出入。例如,新采集的最初数据信号,不仅涵盖和样品待测成分存在关联的信息外,而且包含不同仪器等多种噪声,由此可知,应面向最初数据实施预处理操作。数据预处理主要指代开展主要处理操作前实施的部分处理,具体包含归一化、规范化与变换等内容。
2.2 数据降维
无损检测获取的数据大多处于相对偏高维度空间,以依托光谱分析技术开展的无损检测工作为例,得到的光谱波段众多,甚至高达上千。数据降维主要包含线性与非线性降维,其中后者可细分成以核函数为依托的方法和以特征值为依托的方法。
2.3 建模
无论是光谱,还是图像数据均存大量的信息,借此表现物质的基本组成和根本性质等内容,但一般不能直接明确上述信息,也不能构建和物质目标特性相对应的模型。由此可知,初始光谱及图像实施数据挖掘与特征提取操作后,应通过建模算法设立关系模型。
自编码网络的本质为流行学习非线性降维方法,此方法能够借助深层神经网络锻炼对高维数据进行转换,使其成为低维嵌套,同时,提供高维数据和低维嵌套对应的双向映射,能够第一时间明确高维数据中优良的流形结构,填补原有流形学习方法自身的不足。
本文依托AN和PLS,提出了一种综合性方法,AN/PLS,此种方法先借助AN面向红外光谱实施流形学习非线性降维操作,然后借助PLS编制回归模型。利用毛竹笋内部的IDFC进行验证,得到了NIR与MIR这两种回归模型,同时将AN/PLS编制的回归模型和以往数据预处理手段、降维方法辅以回归模型围绕IDFC预测的结果展开对比,发现AN/PLS建模方法具有显著的精准性优势。
对农产品无损检测而言,其定性识别建模工作中,待测农产品品质实际识别过程最显著的问题便是参照K类训练样本清楚测试样本的具体类型。现阶段,较为常用的方法为依托BP神经网络组建特定的分类模型,把测试样本数据放至该模型,获取特定的识别结果。该方法较为繁琐,过程相对复杂,难度系数大,这在某种程度上影响了实际应用。稀疏表示区别于上述方法,主要借助测试样本面向训练样本形成的投影系数完成识别分类,该过程较为便捷。近红外光谱与图像是一种特殊信号,由于本身和所呈现的信息大多数情形中均具有稀疏特性,进而把稀疏表示理论融合至近红外光谱与图像分类具有可行性。
若训练样本共计有K类,各类训练样本数用N来表示,对应的维数是m维度,通过列向量将其进行表示。提供适宜的训练样本,将其中一类构建为对应的矩阵,面向训练样本集给定全新、合理的样本矩阵,以此充当K类训练样本集合,基于此可将y的线性改写为另一种形式,即y=Ax,其中x为系数向量。若x是稀疏的,依托稀疏表示与压缩感知理论成果可知,只要攻克最小化范数问题便可求解成最终的结果,获得类别标志。
在农产品无损检测工作中,定量模型构建为主要内容,特别是在对定量建模日益严格的当下。由此可知,对预测速度精准的高效、可行的建模方法展开研究在无损检测中发挥着巨大的作用。相关向量机建立在贝叶斯框架之上,它存在和支持向量机相同的函数形式,和SVM相同依托核函数映射把低维空间内部的非线性问题进行转换,使其变成高维空间层面的线性问题。将其和支持向量机对比发现,这是建立在贝叶斯之上的学习模型。
依托先验参数结构,结合相关决策理论刨掉不相关的点,以此来获取稀疏化模型。因样本数据迭代学习环节内大多数参数的实际后验证分布都接近零,但非零参数自身的学习样本区别于决策域对应的样本,仅仅代表数据内部的原型样本,由此将上述样本称作相关向量,彰显数据中最显著的特性。将其和支持向量机进行对比发现,前者可大幅减轻核函数的实际计算量,同时,填补所选函数一定要符合Mercer条件的不足,主要包含下述三项内容:
5.1 模型描述
提供训练样本集,各个目标值独立分布,而每一个输入值均为独立分布样本,依据特定公式用输入值表示目标值,经由换算获得结构矩阵,主要由基函数构成。参照结构风险原则发现,引入权值的需率先验高斯分布,最终得到一致超先验证,此种做法的优点是保证奇函数与t存在度量不变形。面向各权值赋予对应的超参数属于RVM的基本特征,并可让RVM的解呈现稀疏性。
5.2 贝叶斯推理
明确先验后,参照贝叶斯公式,面向各个未知参数依据后验公式进行验证,因后验概率无法经由分解计算获取,所以,应通过狄拉克函数实施近似计算,把相关向量学习转换为探索超参数后验方式这一问题,简单来说是求取超参数后验中对应的峰值,其本质为α、β极限化公式。
5.3 超参数改进和预测
因无法获取想要的解析表达式,进行反复迭代。在具体的计算环节,因大多数α接近无穷大,所以,可能让后验误认自身的w当做0,出现解的稀疏性。在RVM方法中,其模型权值近似值通过后验分布均值获得,并为权值的极限后验估测。后验分布彰显出权值理想值自身的不确定性,还能够彰显模型预测自身的不确定性。
模式识别在农产品无损检测中占据着核心的位置。本文依托农产品无损检测包含的最初采集数据涉及的非线性降维与高效建模等内容,获得全新、可行的降维与识别方法,同时,把相关方法应用到实践活动中,得到了验证,这促进了模式识别工作的进一步开展。
[1]夏恒.关于利用振动理论对西瓜成熟度进行无损检测的研究[D].江苏理工大学,2016.
[2]罗阳,何建国,贺晓光,等.农产品无损检测中高光谱成像技术的应用研究[J].农机化研究,2015(6):1~7.
[3]吴莉莉,李辉,惠国华,等.传感器技术在农产品无损检测中的应用研究[J].江西农业学报,2016,22(5):101~105.
[4]韩小珍,辛世华,王松磊,等.高光谱在农产品无损检测中的应用展望[J].宁夏工程技术,2015,12(4):379~384.
[5]孙力,林颢,蔡健荣,等.现代成像技术在食品/农产品无损检测中的研究进展[J].食品安全质量检测学报,2014(3):643~650.
TP391.4
A
1004-7344(2016)28-0237-02
2016-9-10
郭峰(1980-),男,助理农艺师,本科,主要从事农产品质量安全监测检验工作。