基于多元回归分析的颜色与物质质量分数辨识

2018-09-10 08:59彭良刚
现代盐化工 2018年6期
关键词:多元线性回归分析

彭良刚

摘   要:本文基于物质质量分数检测的方法—比色法进行研究,首先,使用SPSS软件对颜色读数与物质溶液质量分数的关系作定性研究,并进行了相关性分析,对颜色的优劣作出评价。其次,使用多元线性回归分析建立二氧化硫颜色读数与质量分数的回归模型,并给出残差分析,优化回归模型。

关键词:比色法;分析;多元线性回归;SPSS;MATLAB

在检测物质质量分数方面,我们常用的检测方法是比色法[1-6],检测的方法是将待测物质制成溶液,然后将溶液滴在一张白纸上面,待反应充分后形成一张有颜色的试纸,最后再把标准比色卡与颜色试纸进行比较,即可确定待测物质的质量分数范围。但是,由于人的视觉对颜色敏感性等存在辨识误差,对辨识的结果影响较大。随着计算机视觉的发展和应用,人们开始采用照相技术拍摄试纸照片中的颜色,对颜色与物质质量分数之间的关系进行研究。本研究利用2017年大学生数学建模C题[7]给出的物质质量分数与各种颜色的读数关系,拟解决以下两个问题:(1)根据5种不同物质在不同质量分数下的颜色读数,利用给出的数据能否得出颜色读数与物质质量分数之间的关系,并通过这种关系,评价5种数据的优劣。(2)根据表中给出的二氧化硫数据,建立二氧化硫的颜色读数与物质质量分数的数学模型,并对模型进行误差分析。

1    问题分析

1.1  颜色读数与物质质量分数之间的关系分析

首先,通过对数据的分析以及利用SPSS作出每种物质颜色的读数与质量分数的关系图。我们发现,各种颜色读数与质量分数之间存在相关关系,有助于探索颜色与质量分数之间的相关关系。其次,可以利用多元線性回归分析[8-11]来建立颜色与质量分数的关系,对质量分数与颜色作定量分析。最后,利用回归分析的指标评价这5组数据的优劣。

1.2  二氧化硫的颜色读数与物质质量分数的数学模型误差分析

二氧化硫的颜色读数与物质质量分数的实验给出的数据表明,在每个质量分数之下进行多次测试试验,试验次数越多,越接近于真实值。因此,可以采用各组数据取平均值,再作多元线性回归分析;对回归分析的结果采用逐步回归的思想剔除异常数据,并对结果进行比较。

2    模型建立与求解

2.1  颜色读数与物质质量分数之间关系模型建立与求解

对5种溶液之一的组胺利用SPSS作出颜色读数与物质质量分数的关系图,如图1所示。

从图1中可以看出,根据组胺的颜色读数与其质量分数的关系,表明颜色读数与质量分数之间存在相关关系,其余4种物质同样具有这样的相关关系。

2.2  颜色读数与质量分数关系的相关分析

两个变量之间的相关关系如下:≥0.7,高度相关;0.4≤<0.7,中度相关;0.2≤<0.4,,低度相关。对各组数据进行相关分析,需要计算质量分数与各种颜色的相关系数。当≥0.7时,表示质量分数与颜色读数之间高度相关。利用SPSS软件分别对5种溶液的质量分数与颜色读数的相关关系进行相关分析,如表1所示。

表1结果表明:(1)组胺质量分数与5种颜色的读数的相关系数≥0.7都具有高度相关关系。(2)溴酸钾溶液,中度相关的颜色为色调H,高度相关的是绿色分量G、蓝色分量B、饱和度S。(3)对于工业碱来说,与质量分数中度相关的是颜色是B、G、R、S,高度相关的颜色读数是H。(4)对于硫酸铝钾溶液,与质量分数中度相关的是B、G、R、H、S。(5)对于尿中尿素来说,与质量分数高度相关的是B和S,中度相关的是H。

说明物质质量分数与颜色之间存在相关关系,尤其是与R、G、B这3种颜色分量有明显的关系。

2.3  问题2的模型建立与求解

计算二氧化硫的各组测试质量浓度的不同颜色读数平均值,计算结果如表2所示。利用SPSS作出各颜色分量与二氧化硫质量浓度的关系图,如图2所示。

根据二氧化硫质量分数与各颜色分量的关系,我们发现质量分数与颜色分量R、G、B具有明显的线性关系,可建立多元回归模型:

C=k0+k1R+k2G+k3B,其中k0,k1,k2,k3为回归系数,R、G、B为颜色分量,利用SPSS作回归分析分析结果,如表3~5所示。

根据表3~5,模型求解结果为:

C=628.755+6.638R-5.678G-5.234B

r2=0.849,F=39.237,P值<0.05,说明回归线性拟合显著,但是回归的均方差与残差数较大,模型还不理想,现用Matlab对模型进行残差分析,对于的残差如图3所示。

从图3可以看出,第13、14条数据的残差置信区间不包含0点,表明这两项数据可以视为异常数据,删除数据后再对模型进行优化,进行回归分析,做残差分析,删除异常的数据第5、6、7、8、10、11条后,得到残差分析如图4所示。

得到的优化回归模型如下:

C=706.672 3+8.382 5R-6.6G-6.482 6B,r2=0.994 3

结果表明,对模型进行残差分析通过后,模型拟合程度从0.849逐渐提高到0.994 3,模型拟合度高。

3    模型评价

问题1利用SPSS数据处理分析质量分数与不同颜色分量读数的关系,从而直观得出质量分数与颜色的关系,通过相关性分析比较颜色的优劣。

问题2通过建立多元线性回归模型,拟合数据,作残差分析,不断剔除异常数据,进一步对回归模型优化,得出最终的回归模型。

基于回归分析的物质质量分数与颜色的关系,我们可以通过构建模型,利用颜色来辨识物质质量分数,下一步则需要提高计算机摄像的清晰度,提高颜色识别的精准度。

[参考文献]

[1]汪富全.以比色法测定粘胶中二氧化钛的含量[J].人造纤维,2016(1):24-25,23.

[2]郎德龙.比色法测定微量尿素最佳条件的探究[J].广州化工,2016(1):129-130,154.

[3]魏晓霞.利用比色法测定葡萄酒的酒精度[J].广州化工,2016(21):114-116.

[4]高汝林,刘   楠,刘   迪.基于比色法测量二氧化硫质量分数的递进回归模型[J].河南科学,2018(6):837-841.

[5]刘之林.比色法在辨识溶液质量分数中的分析与研究[J].明日,2018(32):13-15.

[6]章银珠,杨   广,李冬梅,等.比色法测定酱油中氨基酸态氮的探讨[J].中国调味品,2018(6):146-149.

[7]佚名.全国大学生数学建模大赛[EB/OL].(2017-09-14)[2018-12-11].http://www.mcm.edu.cn/html_cn/node/460baf68ab0ed0e1e557a0c79b1c4648.html.

[8]蔡素丽.多元线性回归模型应用实证分析[J].廊坊师范学院学报(自然科学版),2017(4):5-8.

[9]董紫薇.基于多元回归的中国电影市场票房预测模型[J].明日风尚,2017(22):93.

[10]汝彦冬.基于多元线性回归模型煤矿瓦斯体积分数预测[J].哈尔滨商业大学学报(自然科学版),2017(6):735-737.

[11]魏天琪.基于多元线性回归模型的中长期电力负荷预测[J].电子世界,2017(23):29-30.

猜你喜欢
多元线性回归分析
分析:是谁要过节
回头潮
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
Units 13—14解题分析