基于主成分分析的质量安全评价模型构建

2014-04-29 08:23:18焦鼎孔运刘蔚青
中外食品工业 2014年3期
关键词:主成分分析特征向量

焦鼎 孔运 刘蔚青

摘要:本文针对分析深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势的问题,首先确定评价食品安全的检测指标,建立评价指标体系,本文利用已有数据得出三年主要食品领域如蔬菜、肉制品以及水产品领域,微生物、重金属、添加剂含量以及其他影响食品安全因素检查的合格率;再利用主成分分析方法建立的数据矩阵进行求解,得出影响食品质量安全的主成分因子,以及相应的方差贡献率(又称信息贡献率)作为主成分指标变量的权重,进而定义食品安全综合指数FSCI(Food Safety Comprehensive Index ,FSCI),通过食品安全综合指数的比较,对三年来深圳市的食品安全水平进行综合评价并得出结论:在蔬菜、肉类以及水产品三个主要食品领域中,食品质量安全水平2012最优,2011在三年来相对较差,2010年居中。

关键词:主成分分析 信息贡献率 特征向量 综合评价指数

中图分类号:R155.5 文献标识码:A 文章编号:1672-5336(2014)06-0064-03

针对评价深圳市这三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势的问题,我们首先确立指标体系,并对相关数据进行标准化处理,建立如下基于主成分分析的综合评价模型,并利用Matlab编程进行求解。

假设进行主成分分析的指标变量有个[1],分别为,共有个评价对象,第个待评对象的第个指标值为,得到观测数据矩阵:。

将各指标值转换成标准化的指标值,有:

其中:

其中即和为第个指标的样本均值和样本标准差。对应地,称为标准化的指标变量。

根据公式概率统计以及线性代数的相关知识[2]可以知道:即为标准化的指标变量和的相关系数矩阵,相关系数矩阵中的元素

其中是第个指标与第个指标的相关系数,显然易见相关系数矩阵为是对称矩阵。

由上述相关系数矩阵的性质知道:相关系数矩阵为是实对称矩阵,因此相关系数矩阵进行特征分解得到[3]:,其中,是由相关系数矩阵的特征值组成的对角阵,是由的标准正交化的特征向量按列并排组成的正交矩阵,称为主成分载荷矩阵,它是用主成分指标变量表示中心标准化的原指标变量时的系数矩阵,即用矩阵可表示为:。由于主成分载荷矩阵是正交矩阵,所以满足,故又有,即可知:,可见的转置矩阵是用原变量表示主成分变量时的系数矩阵。

另外还可以知道矩阵为主成分得分阵,每行的数据就是对应各次观测对应的主成分变量的取值。因而主成分的样本协方差矩阵为

,由此可见主成分指标變量的样本方差就是特征值,且不同主成分之间的样本协方差都等于零。

为计算特征值的信息贡献率和累计贡献率,定义为主成分指标变量的信息贡献率;同时,有为主成分指标变量的累计贡献率。当接近于1(一般取)时,则选取前个指标变量作为主成分指标变量,代替原来的个指标变量,从而可以对个主成分指标变量进行综合评价[4]。

具体到本问题中时,我们定义了食品安全综合指数FSCI;

其中:为第个主成分指标变量的信息贡献率,根据食品安全综合指数FSCI,我们就可以实现对2010、2011以及2012年三年来深圳市主要食品领域食品质量安全的变化趋势。

为综合评价深圳市这2010、2011以及2012三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势,我们确定了由微生物检测合格率、重金属检测合格率、添加剂含量检测合格率以及其他因素检测合格率四项所组成的评价指标体系,2010、2011、2012年食品质量安全水平组成的评价对象。为综合考虑三年的食品质量安全水平,我们主要以蔬菜、肉制品以及水产品三个食品领域作为指标变量数据获取的样本空间[5],得到如下的表1,表1中各项数据为三个主要食品领域中不同年份四项检测指标的合格率情况。

注:此处仅考虑蔬菜、肉制品以及水产品三个主要食品领域的各项指标。

因此,指标变量主要食品领域微生物检测指标的合格率、主要食品领域重金属检测指标的合格率、主要食品领域添加剂检测指标的合格率、主要食品领域其他检测指标的合格率,得到相应的数据矩阵[6]为

对相关系数矩阵进行特征值和相应的特征向量求解,并计算各个特征值的贡献率和累计贡献率,如下表2:

由表2得到的主成分分析结果,可以利用主成分的贡献率作为综合评价指标的权重系数。由表中数据可以得知前两个主成分指标变量的累计贡献率就达到了100%,主成分分析效果较好。

主成分载荷矩阵,是由的标准正交化的特征向量按列并排组成的正交矩阵,即;进而可以得到表3——标准化的4个主成分指标变量对应的特征向量[7]。

由此可得2个主成分变量分别为:

据主成分系数可以看出第一主成分主要反映了前两个指标微生物、食品添加剂检测合格率的信息。第二主成分主要反映了重金属和其他因素两个检测指标对食品质量安全的影响信息,很好地将原始数据中相关性很高的指标变量转化成彼此相互独立或不相关的变量,很好地实现了降维;另外,由于数据获取主要来源于蔬菜、肉制品以及水产品三个主要食品领域,而这些食品领域食品不合格的主要原因在于微生物、食品添加剂含量检测不合格,与第一主成分主要包含前两个指标微生物、食品添加剂检测合格率的信息相符合[8]。

利用主成分载荷阵以及中心标准化的数据矩阵可以得到主成分得分阵,,如表4——评价对象的主成分得分阵

针对深圳市这2010、2011以及2012三年各主要食品领域微生物、重金属、添加剂含量等安全情况的变化趋势,我们定义了食品安全综合指数FSCI这个综合评价指数:

分别以4个主成分的贡献率为权重系数,构建主成分综合评价函数,即:

从而可以根据食品安全综合指数FSCI对2010、2011以及2012三年来各主要食品领域微生物、重金属、添加剂含量以及其他因素等食品质量安全情况的变化趋势进行综合评价。

根据表4——评价对象的主成分得分阵,将评价对象2010、2011、2012三年深圳市食品质量安全水平的4个主成分值代入上式,可以分别得到三年的食品安全综合指数FSCI,如表5——三年的食品安全综合指数FSCI。

由上表数据分析可以得知,若以蔬菜、肉制品以及水产品三个食品领域的食品质量来评价2010、2011以及2012年三年深圳市食品安全水平,2012年食品安全质量水平最高,由于四项检测指标合格率都优于2010和2011年,而2011年食品安全质量水平低于2010的主要原因在于占据很大贡献的第一主成分变量主要包含微生物和添加剂含量的主要信息,在这两项指标上11年的合格率都劣于10年,因此在蔬菜、肉制品以及水产品三个主要食品领域,10年的食品安全质量水平较11年高。

参考文献

[1]司守奎,孙玺菁,数学建模算法与应用,北京:国防工业出版社,2013.

[2]陆元鸿,数理统计方法,上海:华东理工大学出版社,2005.

[3]张小蒂,李晓钟.应用统计学导论,浙江:浙江大学出版社,1998.

[4]周乃元,潘家荣,食品安全综合评估数学模型研究,中国食品卫生杂志,第21卷第3期:198-202,2009年.

[5]刘振航.数学建模,北京:中国人民大学出版社,2004.

[6]梅长林,周家良.实用统计方法,北京:科学出版社,2009.

[7]肖智,钟波,应用统计学实验,重庆:重庆大学出版社,2007.

[8]姜启源,谢金星.数学模型,北京:高等教育出版社,2011.

猜你喜欢
主成分分析特征向量
二年制职教本科线性代数课程的几何化教学设计——以特征值和特征向量为例
克罗内克积的特征向量
一类三阶矩阵特征向量的特殊求法
数学大世界(2019年7期)2019-05-28 01:56:58
一类特殊矩阵特征向量的求法
EXCEL表格计算判断矩阵近似特征向量在AHP法检验上的应用
中华建设(2017年1期)2017-06-07 02:56:14
基于NAR模型的上海市房产税规模预测
主成分分析法在大学英语写作评价中的应用
大学教育(2016年11期)2016-11-16 20:33:18
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
考试周刊(2016年84期)2016-11-11 23:57:34
长沙建设国家中心城市的瓶颈及其解决路径