刘永嘉
摘 要:目的:分析ARIMA预测和指数平滑法在辽宁省食品安全抽检合格率预测中的可行性,并比较两种模型的预测效果。方法:对辽宁省食品安全抽检结果资料进行模型构建,并验证预测结果,以预测结果的绝对误差和相对误差作为评價指标。结果:ARIMA模型公式为y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1),预测平均相对误差为1.79%,平均绝对误差为0.017;指数平滑法模型公式为y(t+1)=0.2Y(t)+0.8y(t),预测平均相对误差为1.38%,平均绝对误差为0.013。结论:两种模型均可被用于食品抽检合格率预测,其中指数平滑法预测效果更好。
关键词:食品抽检;合格率;模型预测
Abstract: Objective: The feasibility of ARIMA prediction and exponential smoothing method in Liaoning Province food safety sampling rate prediction was analyzed, and the prediction results of the two models were compared in this paper. Methods: The data of food safety sampling inspection in Liaoning Province were modeled, the prediction results were validated, and the absolute and relative errors of the prediction results were taken as evaluation indexes. Results: The ARIMA model formula is y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1), the average relative error was 1.79% and the average absolute error was 0.017. The exponential smoothing model formula was y(t+1)=0.2Y(t)+0.8y(t), the average relative error and the average absolute error were 1.38% and 0.013 respectively. Conclusion: The two models can be used to predict the qualified rate of food sampling, and the exponential smoothing method is more effective.
Keywords: food sampling inspection; qualified rate; model prediction
目前我国食品行业仍存在诸多风险,如微生物污染、重金属超标、农药兽药残留不合规等[1]。本研究拟利用食品抽检情况资料建立预测模型,探讨数学模型在实际预测中应用的可行性,为食品安全风险治理提供模型方法。
1 材料与方法
1.1 资料来源
建模所用资料来源于2019—2020年辽宁省市场监督管理局发布的食品安全抽检信息。验证所用数据资料来源于2021年辽宁省市场监督管理局发布的食品安全抽检信息第1~5期。
1.2 预测方法
1.2.1 ARIMA预测
ARIMA模型构建过程[2]:①平稳性检验,先用时序图初步判断,再进行ADF检验最终确定数据的平稳性;②游程检验,只有当时间序列是非随机序列时,才可继续构建模型;③模型识别与拟合,根据序列特征和信息准则AIC和BIC值越低越好原则[3],分析比较不同参数时模型优化情况;④残差白噪声检验,通过Q统计量检验进行。
1.2.2 指数平滑法预测
指数平滑法是利用上期实际值和上期预测值,辅以平滑系数,计算得出预测值。根据时间序列图特征初步确定拟使用的指数平滑法类型。根据时间序列数据的数量确定拟使用的初始值SO。根据RMSE值越小越好的原则[3],配合不同参数组合设置下模型的预测效能,最终确定平滑系数α值和平滑类型。
1.3 分析方法
数据整理使用WPS Office 2019,ARIMA模型和指数平滑法模型构建、模型检验、拟合与预测使用在线分析平台SPSSAU。预测效能评价指标:预测结果的相对误差和绝对误差的绝对值。
2 结果与分析
2.1 辽宁省食品安全抽检合格率的时序特征
对辽宁省2019—2020年食品安全监督抽检情况资料进行整理,观察抽检合格率时间序列图(图1),抽检合格率总体呈现水平向下波动。
2.2 ARIMA预测
2.2.1 平稳性检验
由图1可知序列总体斜向下,说明进行ADF检验,其中差分阶数为1,检验结果见表1。由表1可知,该序列ADF检验的t统计量为-5.478,P值为0.000,1%、5%、10%临界值分别为-3.517、-2.899、-2.587。P=0.000<0.01,因此推断此时序列平稳。
2.2.2 游程检验
游程分析结果见表2。由表2可知,P<0.05,说明该时间序列的发展不随机,有规律可循,可以进一步分析。
2.2.3 模型识别与拟合
根据信息准则AIC和BIC值越低越好原则,结合时序图特征,分析比较不同参数时模型优化情况,得出模型参数,如表3所示。则最优模型为:ARMA(2,1,1),模型公式为:
y(t)=-0.000+0.295y(t-1)+0.046y(t-2)-1.000ε(t-1)(1)
式(1)中:y(t)表示差分运算中的当前值,t表示时序数,ε表示误差。
2.2.4 残差白噪声检验
利用Q统计量进行白噪声检验,结果见表4。由表4可知,Q6、Q12、Q18的P值均>0.1,说明在0.1的显著性水平下,模型的残差是白噪声,满足要求。
2.2.5 模型预测
预测结果见表5,整体预测值的相对误差较低,预测结果较理想。
2.3 指数平滑法预测
2.3.1 指数平滑法模型构建结果
模型公式为y(t+1)=0.2Y(t)+0.8y(t),y表示预测值,t表示时序数,Y表示实际值。模型拟合的RMSE值为0.011。
2.3.2 模型预测
预测结果见表6,整体预测值的相对误差很低,预测精度较高。
2.4 两种模型预测效能比较
表7为两种模型对2021年第1~5期辽宁省食品安全抽检合格率预测效能比较,可知指数平滑法预测效果更好。
3 结论与讨论
近年来,食品安全风险治理一直是公众关心的问题,食品安全风险监测预警技术手段是食品安全风险治理的关键[4]。時间序列预测手段适用于单独的一串时间序列数据,简便高效。本研究通过构建ARIMA模型和指数平滑法预测模型,分析比较了两种模型对食品安全抽检合格率的预测效能,结果表明:2种预测结果的相对误差均在5%以内,其中ARIMA模型除第3期以外的相对误差均在1%以内,指数平滑法除第2期和第3期以外的相对误差均在1%以内,可见两种模型预测精度都很理想[5],均可被用于食品安全抽检合格率预测的评估预警中。通过比较可知指数平滑法预测效果更优。
观察2种模型预测结果发现,前几期预测值总体均低于后续预测值,由此推断,ARIMA模型和指数平滑法短期预测更准确。本研究建模只考虑抽检期数,不考虑其他因素(如食品安全相关政策的改变、食品安全突发事件的影响、食品检验检测能力的提高及食品抽检时间间隔的变化等),建模效果的优劣很大程度上取决于食品抽检资料的质量。因此提高食品安全抽检的科学性,加强食品检验检测行业能力水平,提升抽检数据网络通告的时效性,对于模型更新优化、提高预测精度就显得至关重要。本研究是食品安全风险预警技术手段的重要补充,为及时预测食品风险、科学规划食品抽检提供理论支撑和技术指导。
参考文献
[1]佚名.中共中央国务院关于深化改革加强食品安全工作的意见[J].中国农村科技,2019(12):26.
[2]于林凤,吴静,周锁兰,等.ARIMA季节模型在我国丙肝发病预测中的应用[J].郑州大学学报(医学版),2014,49(3):344-348.
[3]王永斌,柴峰,李向文,等.ARIMA模型与残差自回归模型在手足口病发病预测中的应用[J].中华疾病控制杂志,2016,20(3):303-306.
[4]刘克斌.国内外食品安全风险监测发展状况[J].河南预防医学杂志,2020,31(5):328-331.
[5]严婧,杨北方.指数平滑法与ARIMA模型在湖北省丙型病毒性肝炎发病预测中的应用[J].中国疫苗和免疫,2017,23(3):292-297.