基于主成份分析法的牛奶成分检验

2014-04-29 08:26丁伟
山东工业技术 2014年5期
关键词:牛奶

丁伟

【摘 要】本文对商品牛奶进行调查统计的基础上,运用主成份分析的方法,对样本的成分进行分类分析。分析结果表明:牛奶的成分指标主要由蛋白质、脂肪、能量、碳水化合物、钠离子、钙离子、维生素组成;蛋白质为一类指标、能量和脂肪为同一类、钠离子和钙离子、维生素各是一类。此结论基本上是正确合理的,对牛奶的质量控制及其质量检验部门的初步检测等都具有一定的指导作用,可以减少检测步骤、具体化检验指标、节约检测成本和优化检验的方式,为选用步骤少效率高低成本的检测对象来反应牛奶质量提供了理论依据。

【关键词】牛奶;主成份分析;成分指标

【Abstract】In this paper, the commodity milk were investigated on the basis of statistics, by using the principal component analysis method, the component of the sample classification analysis. The analysis results show that: milk composition index is mainly composed of protein, fat, energy, sodium, calcium, vitamin is composed; Protein is a kind of index, energy and fat for the same kind, sodium and calcium ion, vitamin each is a kind of. The conclusion is basically correct and reasonable, the milk quality control and quality inspection department in the preliminary detection and so on all has certain directive function, can reduce the testing steps, shape test index, save testing cost and optimize the inspection way, to choose step less efficiency high and low cost detection object to reaction milk quality to provide a theoretical basis.

【Key words】Milk principal; Component analysis; Component index

在现在的市场中,牛奶的质量问题频频爆出危机,从三氯氰胺、蒙牛等一系列的公司牛奶质量问题对的出现,所以对市场上的牛奶安全就引起了消费者的关注。所以对于市场中的主要销售的牛奶的的含量,做主成分分析,从而可以寻找到,控制牛奶质量的检验方法,以提高现在牛奶市场的质量。

1 数据来源

本文所有的数据都收集自商品牛奶外包装,厂方自己标明的指标无法完全代表其产品中成份的含量,但是就研究而言有一定价值。对于一些牛奶未标明的成份,为了使得分析更为精确,用此类指标的平均数值进行代替,同时也能使得其对整个分析造成的影响最小,牛奶特征性指标原始数据见附表1。表中只列出了常规的特征性指标,而一些较少的指标,对于分析研究没有很大影响,便没有在表中列出,且当厂方标明的特征性指标处于某一范围时,为了数据分析的准确,取其范围中的平均值。

2 主成份分析法(Principal Component Analysis, PCA)

主成份分析法也称主分量分析或矩阵数据分析,通过变量变换的方法把相关的变量变为若干不相关的综合指标变量。[2]

若某研究对象有两项指标ζ1和ζ2,从总体ζ(ζ1,ζ2)中抽取了N个样品,它们散布在椭圆平面内(见图1),指标ζ1与ζ2有相关性.η1和η2分别是椭圆的长轴和短轴,η1⊥η2,故η1与η2互不相关.其中η1是点ζ(ζ1,ζ2)在长轴上的投影坐标,η2是该点在短轴上的投影坐标.从图1可以看出点的N个观测值的波动大部分可以归结为η1轴上投影点的波动,而η2轴上投影点的波动较小.若η1作为一个综台指标,则η1可较好地反映出N个观测值的变化情况,η2的作用次要.综合指标η1称为主成份,找出主成份的工作称为主成份分析[3]。

可见,主成份分析即选择恰当的投影方向,将高维空间的点投影到低维空间上,且使低维空间上的投影尽可能多地保存原空间的信息,就是要使低维空间上投影的方差尽可能地大[4]。

3 主成份分析法的应用

3.1 原始数据的处理和标准化

由于原始数据矩阵庞大,如对全部指标进行分析,将而导致主次要成因相混淆;若仅选其中部分指标,又可能会影响分析结果的代表性和完整性。此外,为了克服不同变量数值差异过大而造成的主成份分析误差,按照主成份分析法要求,应对原始数据矩阵进行标准化,进而得到进行主成份分析的12个变量的相关系数矩阵,见表1。

3.2 牛奶特征性指标主成份分析的计算结果

主成份分析的计算结果中,新变量所代表的方差(即对应的特征值)贡献率和由原变量变换为新变量的线性变换系数(即对应的特征向量)就成为我们进行综合分析的重点,在主成份分析中一般要求少数新变量的累积方差贡献率应大于70%[5]。下列表2、表3和表4分别给出了原始数据的公因子方差、各个主成份的解释的总方差和主成份的计算结果,图2则是各个主成份的特征值。

图2表明,前三个主成份积累方差贡献率达到79%,根据主成份分析法的一般原理,可取前三个具有明显代表性的主成份,原有的6个变量可用二个主成份表示,如表4所示。

本文可以依据以上计算结果绘出成份图,表明新旧变量之间的关系,同时,也可以为原始的牛奶特征性指标分类,得到成份图,如图3。

3.3 结果分析

由主成份分析的计算结果可以看出,原变量的方差在新变量中的集中度很高,根据牛奶特征性指标的实际状况和主成份分析的要求,本文取前2个主成份来反映原来的6个变量,其方差的累计贡献率已达到79.483%,二个主成份的贡献率分别为42.202%和37.281%,二个主成份在79.483%的程度上反应了某一样本的牛奶质量情况与离子条件,可以认为,这二个主成份基本上能够反映出原变量的变化所代表的牛奶质量标准.

在第一主成份中,只有蛋白质一种,可见蛋白质在牛奶中占有很大的一份比重。人们通常都是因为蛋白质而和牛奶,人体内只能合成一部分,其余则须由食物蛋白质供给。体内不能合成或合成速度太慢的氨基酸都必须由食物蛋白质供给,故又称为“必需氨基酸”。有8种必需氨基酸须食物供给,即赖氨酸、色氨酸、苯丙氨酸、蛋氨酸、苏氨酸、亮氨酸、异亮氨酸及缬氨酸。在牛奶检验中,蛋白质的检测是一项重要的指标,主要是以牛奶内的氮元素含量表示。因此第一主成分命名为:蛋白质。

在第二主成份中,脂肪和能量两个指标组成第二成分,并且两个指标变化方向一致,呈正相关,说明二者的来源相似,处理相近.在生理学中能量可以转化为脂肪,同时脂肪的分解又可以提高能量。但是在一些老年人和高血脂病人来说,脂肪会危害人的身体健康,因此在检测过程中,检测出脂肪的含量并且标注出来有重大影响。第二主成分且将之命名为:脂肪成份。

在剩余的主成份中,碳水化合物地成分比较高,达到了12%左右,也可以表示为一个主要成分。

4 结论

主成份分析法结果表明,牛奶的成份可以分为三类:蛋白质成份,脂肪成份和碳水化合物成份.同时在现在的检测过程中,主要是以氮元素的含量表示蛋白质的含量,现在地牛奶质量的问题就在于添加一些含氮量较高的物质来以次充好。所以对于蛋白质的检测不能仅仅局限于氮元素的检测,要更加的严格,并且确认其含量的正确性。脂肪的检验也是要注意,从而可以区分不同的牛奶品种。

【参考文献】

[1]中国国家标准化委员会.GB/T5009.6 粗脂肪标准检验方法[S].北京:中国标准出版社.2007.

[2]汪应洛.系统工程[M].北京:机械工业出版社,2009:54-60.

[3]方开泰.实用多元统计分析[M].上海:华东师范大出版社,1989:291-302.

[4]王学仁,王松桂.实用多元统计分析[M].上海:上海科技出版社,1990:270-272.

[5]方开泰.实用多元统计分析[M].上海:华东师范大学出版社,1989:291-302.

[责任编辑:汤静]

猜你喜欢
牛奶
能用牛奶盒煮面吗?
送牛奶
炫彩牛奶画
牛奶还能喝吗
“五颜六色”的牛奶
树上也能挤出“牛奶”吗?
凝固的牛奶
牛奶应该怎么喝?
变绿的牛奶
神奇的牛奶树