王智凝等
摘 要:用电子鼻检测猪肉新鲜度时,传感器阵列的冗余信息会带来负面影响。为了提高识别的准确性,根据猪肉散发的气味选择初始的传感器阵列,利用方差分析方法剔除重复性和区分度不明显的传感器;再通过变异系数分析、相关系数绝对值累加和最小分析、主成分分析(principal component analysis,PCA)第2主成分系数分析,筛选出了适合检测猪肉新鲜度的传感器阵列的优化阵列。本研究采用逐步判别法筛选出合适的特征值,并用贝叶斯判别方法对传感器阵列优化前后的数据进行对比分析。结果表明:通过对传感器阵列的优化,识别率由优化前的86.8%提高到优化后的98.9%。研究表明,本实验的传感器阵列优化方法可以大大提高电子鼻对猪肉新鲜度的识别准确性。
关键词:猪肉新鲜度;传感器阵列;阵列优化;电子鼻;相关系数;逐步判别法
Pork Freshness Detection Using Optimized Electronic Nose Sensor Array
WANG Zhining1, ZHENG Limin1,2,*, FANG Xiongwu1, YANG Lu1
(1. College of Information and Electrical Engineering, China Agricultural University, Beijing 100083, China;
2. Beijing Laboratory of Food Quality and Safety, China Agricultural University, Beijing 100083, China)
Abstract: When electronic nose is used for detecting pork freshness, sensor array optimization has a great influence on improving the accuracy by eliminating the negative effects brought about by the redundant information. The initial sensor array was determined by the odor released from pork. Then the sensors with poor repeatability and differentiation were excluded by analysis of variance (ANOVA). By coefficient of variation, minimum cumulation of absolute correlation coefficient and the second principal component of principal component analysis (PCA), an optimized sensor array was selected for the detection of pork freshness. This study adopted stepwise discriminant analysis to optimize features and compare the data before and after optimization by using Bayes discriminant method. Results showed that by sensor optimization and feature optimization, the accuracy was increased from 86.8% to 98.9%. This study indicates that sensor array optimization and feature optimization can greatly improve the detection accuracy of pork freshness.
Key words: pork freshness; sensor array; array optimization; electronic nose; correlation coefficient; stepwise discriminant analysis
中图分类号:TP212.2 文献标志码:A 文章编号:1001-8123(2015)05-0027-04
doi: 10.7506/rlyj1001-8123-201505007
电子鼻是一种利用气敏传感器模拟人类嗅觉而进行的气味智能检测技术设备,与其他化学分析仪器不同,电子鼻能够得到样品中挥发性成分的整体信息,也称“指纹信息”[1]。电子鼻可以客观、准确、快捷地进行猪肉新鲜度的检测,克服了传统猪肉新鲜度检测中费时、费力、破坏样品的缺点。
电子鼻系统由气敏传感器阵列、信号预处理电路、模式识别算法和气味表达模块4个部分组成。由于传感器的广谱响应特性[2],能够对多种气体进行响应,所以采集到的信息存在着显著的相关性。并且若存在某个传感器对环境的响应程度高于样品信息,则会产生冗余信息,对样品判断产生极大的干扰。所以,要在保证单一传感器对相同样本的重复性和对不同样本的区分度的基础上,对传感器整体阵列进行优化。
本实验以电子鼻采集到的原始信息为基础,对其进行方差分析,根据单一传感器对不同样品的显著性分析的概率值(P值)和F统计量(F值)剔除重复性和区分度差的传感器,得到传感器的初筛阵列[3]。再结合变异系数分析、相关系数绝对值累加和最小分析、主成分分析(principal component analysis,PCA)第二主成分系数选择性分析3种方法,得到优先考虑的传感器阵列,最终确定传感器的最终阵列[4]。
传感器阵列采集到的是猪肉的指纹图谱,包含大量信息,如果直接采用原始数据来进行分类会造成模式空间的维数灾难,因此要对原始数据进行特征提取及优化。本实验提取9个特征值来表征响应曲线所包含的信息并用逐步判别法进行特征优化[5]。对阵列优化前后的数据,用Bayes判别法进行对比研究。
1 材料与方法
1.1 材料
选取来自北京市顺鑫农业股份有限公司鹏程食品分公司当天屠宰的新鲜猪肉外脊。
1.2 仪器与设备
实验使用中国农业大学自行研发设计的电子鼻系统,其由气敏传感器阵列、放大调理电路、A/D采集装置、气压控制和温度控制及计算机等部分组成。根据猪肉散发的醛类、醇类、酮类、羧酸类、醛酸类气味[6],选择9 只TGS8系列和7 只TGS2000系列组成气敏传感器阵列。其中TGS8系列传感器工作电压采用12V,加热电压为5 V;TGS2000系列传感器工作电压和加热电压均为5 V。标准空气流速设置为3 L/min,保持采样室温度为40 ℃,保持在(40±2)℃。
1.3 方法
将新鲜猪外脊置于4 ℃冰箱冷藏,每24 h检测1次,每次检测13 个样本,共检测7 d,得到13×7=91 个样本测试结果。每个样本取10.0 g搅碎搅匀后的肉泥,置于恒温40 ℃的样品皿中进行检测。每次检测前,先用标准空气以3 L/min流速通入密封采样室,待得到平稳响应后放入10 g样品,密封,进行数据采集,采样间隔时间设置5 s,采样时间300 s。采样结束后,取出样品,用标准空气还原采样前的环境,以便下一次检测。
2 结果与分析
2.1 传感器优化
2.1.1 传感器初始筛选
由于电子鼻的各个传感器有广谱响应特性,能对一种或多种气体成分进行响应,故其得到的原始数据具有极其显著的相关性[7]。若某个传感器对环境信息敏感,对样品信息不敏感,则会造成大量的冗余信息,所以要对传感器进行筛选。
表 1 传感器原始数据的相对变化值的均值
由表1可知,在采集初期,传感器对猪肉气味进行强烈的吸附过程,响应曲线数值变化明显。当挥发性气体与传感器达到吸附饱和时,响应曲线数值趋于平缓。可以看出各个传感器的相对变化值区分度比较大,所以选择相对变化值作为特征值。
由于传感器S5与S16的相对变化值的均值小于100,说明这两个传感器对猪肉样品气味不敏感,故剔除这两个传感器。
2.1.2 用方差分析进行传感器筛选
将传感器相对变化值进行正态分布检验,方差分析结果的组内均方值越小,表明传感器重复性越好,利用结果的F统计量值和小概率P值,F统计量值越大或者概率P值越小,表明传感器的区分度越好[3]。
本实验把每个传感器当作一个因子,不同传感器对样品响应的相对变化值当作水平,进行方差分析[8]。首先进行正态分布和方差齐性检验,由于原始数据的相对变化值不满足方差齐性,故对原始数据的相对变化值做数据处理。本实验选取原始数据相对变化值的对数,再进行方差齐性检验。可知大部分传感器满足方差齐性要求。再对其进行单因素方差分析,结果见表2。
表 2 传感器原始数据相对变化值的对数的单因素分析
由表2可知,剔除组内均方值大于0.2的S10、S13传感器,其余传感器重复性较好。S1~S11、S13~S14传感器概率临界P<0.01,即对不同样本的区分度及其显著;S9传感器概率临界P<0.05,说明对不同组样本区分度显著;而当P>0.05时,说明传感器对于不同组样本的区分度不显著,故剔除S12、S15、S16传感器。
2.2 传感器阵列第3次筛选
2.2.1 变异系数分析
本实验把每个传感器当作一个变量,计算其变异系数。若变异系数过大,说明该传感器的测试数据离散程度较大,其稳定性不好,将其剔除。变异系数(CV)计算公式[9]:
(1)
对表3变异系数大于0.4的传感器进行剔除,剔除S9、S10、S12、S13、S15传感器。
2.2.2 相关系数绝对值累加和最小分析
相关性分析即计算各传感器测试数据的相关程度,两传感器测试数据的相关程度越大,则从这个两个传感器所获得的信息的一致性就越大,即两传感器可互相取代,那么就可以考虑将其中一个从传感器阵列中去除,从而简化气敏传感器阵列[10]。
传感器之间的相关程度用Pearson相关系数表示[11]
(2)
式中:xi为传感器x对第i个样品的相对变化值;yi为传感器y对第i个样品的相对变化值;为传感器x的样品特征值(相对变化值)的均值;为传感器y的样品特征值(相对变化值)的均值。
由于无法从任意两个传感器的相关度推知整体整列的相关程度,故引用某一个传感器与其他传感器的相关系数绝对值累加和来判断,设为ri:
(3)
表 4 相关系数绝对值累加和
由表4可知,除了对样本不敏感的S5、S16传感器外,可以优先考虑相关系数绝对值累加和小于12的S9、S12、S8、S13、S15、S7、S14传感器。
2.2.3 PCA第2主成分系数选择性分析
主成分分析是多维数据进行降维的主要方法之一。PCA通过线性组合可以将原始数据重新变换为一组新的数据,即主成分。新数据的特点在于前几个分量中包含了整个样本空间的绝大部分信息,故可以用少数的主成分来描述整个样本空间,达到降维的目的[4]。
如果前3个主成分的累计贡献率大于80%,则可针对前3个主成分中的系数进行分析,一般第1主成分的系数表明传感器信号在样本空间的贡献,第2主成分系数则表明传感器信号的离散程度,即选择性。
本实验中,前3个主成分的累计贡献率为84.988%,对前3个主成分求特征向量矩阵,如表5所示。
表 5 PCA前3个主成分特征向量矩阵
由表5可知,S13、S5、S8、S15、S7、S14传感器的PCA第2主成分系数较大,说明其对不同样品的选择性较好,故优先考虑这些传感器。
综合上述3 种对传感器阵列的优化方法,选取S1、S2、S3、S4、S6、S7、S8、S11、S14传感器作为优化阵列。
2.2.4 特征优化与检验结果
为了避免直接采用原始数据造成的模式空间的维数灾难[12],本实验对每个传感器得到的猪肉指纹图谱提取了9 个特征值:相对平均值、相对积分值、平均微分值、相对变化值、二次拟合二次项系数、一次项系数、对数拟合一次项系数、常数项系数和半宽值。由于所选取的这9 个特征值不一定对分类识别都有正面效果,有的甚至会造成一些消极影响,所以用逐步判别法对所选的
9个特征值进行特征优化,并用Bayes判别法对传感器阵列优化前后的数据进行对比研究。
2.2.4.1 逐步判别法
实验用逐步判别法进行特征优化,它采用“有进有出”的算法,即逐步引入变量,每引入一个“最重要”的变量进入判别式的同时也考虑较早引入判别式的某些变量,如果其判别能力随新引入变量而变为不显著了,应及时将新引入变量从判别式中剔除,直到判别式中没有不重要的变量需要剔除,而剩下的变量也没有重要的变量可引入判别式时,筛选结束。这个筛选过程实质上就是作假设检验,通过检验找出显著性变量,剔除不显著变量[13-14]。
2.2.4.2 检验结果与分析
使用贝叶斯判别法对传感器阵列优化前后进行对比分析,结果见表6(优化前)和表7(优化后)。
表 6 传感器阵列优化和特征优化前的结果
由表6可知,已对初始分组案例中的86.8% 进行了正确分类。给出了传感器阵列优化前对已知组别每组13个样例的预测情况。以第5已知组别为例,第5已知组别表示冷藏在4 ℃条件下第5天的数据。已知13 个数据,有10 个正确预测为第5天,正确率为76.9%,有2 个错误预测到了第4天,错误率为15.4%,有1个错误预测到了第6天,错误率为7.7%。综合数据可知,一共91 个数据,正确的分类的有79 个,得出正确率为86.8%。
由表7可知,已对初始分组案例中的98.9% 进行了正确分类。给出了传感器阵列优化后对已知组别每组13 个样例的预测情况。只有第0已知组别中的一个样本错误预测成了第1天。共91 个数据,正确分类的有90 个,得出正确率为98.9%。
表 7 传感器阵列优化和特征优化后的结果
3 结 论
本实验通过应用电子鼻对不同新鲜度的猪肉进行实验分析,通过对传感器阵列的二次筛选,得到了一种适合检测猪肉新鲜度的传感器阵列。证明方差分析、变异系数分析、相关系数绝对值累加和最小分析和PCA第2主成分系数选择性分析方法能够对传感器阵列进行有针对性的优化。并采用了逐步判别法进行特征优化,用贝叶斯判别法对这一结果进行了验证,证明传感器阵列优化以及特征优化可以显著提高电子鼻猪肉新鲜度的识别,为电子鼻进行针对性地检测提供了一种思路。
参考文献:
[1] 芦筱菲, 郑丽敏, 张晓梅, 等. 电子鼻技术在干酪识别上的应用[J]. 中国乳业, 2008(6): 52-55.
[2] 杨建华, 侯宏, 王磊, 等. 基于集成气体传感器阵列的电子鼻系统动态响应特性分析[J]. 西北工业大学学报, 2003(4): 435-438.
[3] 赵镭, 史波林, 汪厚银, 等. 电子鼻传感器筛选的组合优化法研究[J]. 食品科学, 2009, 30(20): 367-370.
[4] 周海涛, 殷勇, 于慧春. 劲酒电子鼻鉴别分析中传感器阵列优化方法研究[J]. 传感技术学报, 2009, 22(2): 175-178.
[5] 庞旭欣. 基于电子鼻系统牛奶指纹图谱的应用研究[D]. 北京: 中国农业大学, 2012.
[6] 孙钟雷. 电子鼻技术在猪肉新鲜度识别中的应用[J]. 肉类研究, 2008, 22(2): 50-53.
[7] 贾洪锋, 卢一, 何江红, 等. 电子鼻在牦牛肉和牛肉猪肉识别中的应用[J]. 农业工程学报, 2011(5): 358-363.
[8] 洪雪珍, 王俊. 牛肉品质检测中电子鼻参数的优化[J]. 农业机械学报, 2013(9): 125-131; 137.
[9] 刘鹏, 屠康, 潘磊庆, 等. 基于多传感器融合的鸡蛋裂纹系统性识别[J]. 农业机械学报, 2010(10): 185-189; 203.
[10] 张覃轶. 电子鼻: 传感器阵列、系统及应用研究[D]. 武汉: 华中科技大学, 2005.
[11] 张树明, 杨阳, 倪元颖. 近红外光谱和电子鼻技术用于葡萄酒发酵过程中酒精度的定量分析[J]. 光谱学与光谱分析, 2012(11): 2997-3001.
[12] DUDA R O, HART P E, STORK D G. Pattern classification[M]. New York: Wiley, 2001.
[13] PATHANGE L P, MALLIKARJUNAN P, MARINI R P, et al. Non-destructive evaluation of apple maturity using an electronic nose system[J]. Journal of Food Engineering, 2006, 77(4): 1018-1023.
[14] HONG X, WANG J, QIU S. Authenticating cherry tomato juices: discussion of different data standardization and fusion approaches based on electronic nose and tongue[J]. Food Research International, 2014, 60: 173-179.