张晓瑜 张桂芳 徐进杰 张甜甜
摘 要:本文分析了食品安全风险预警机制中存在的食品安全数据库分散、结构不一致、评估模式实时性欠缺等关键问题。在介绍相关研究的基础上,提出大数据背景下食品安全风险预警机制的构建思路,通过现有专家评估结果对BP(Back Propagation Network)神经网络进行训练和评价等,期望在现有条件下形成具备可操作性、面向大数据的食品安全风险预警机制。
关键词:食品安全;预警机制;大数据;机器学习
Abstract:This paper analyzes the key problems in the early warning mechanism of food safety risks, such as scattered food safety database, inconsistent structure, and lack of real-time evaluation mode and soon. Based on the introduction of relevant research, this paper put forward the construction idea of food safety risk early warning mechanism under the background of big data, trains and evaluates the BP (Back Propagation Network) neural network through the results of existing experts, etc. It expects to be able to form an early warning mechanism of food safety risk for big data that is operational under existing conditions.
Key words:Food safety; Early warning mechanism; Big data; Machine learning
中图分类号:TS201.6
食品安全风险预警是一种预防性的食品安全保障措施,针对可能出现的食品安全问题做出预先警告,对可能出现的对人体健康产生危害的相关因素进行监测、追踪、分析,形成有效的监控机制,进而对食品安全问题进行有效控制[1]。建立健全食品安全风险预警机制,及时发布与食品安全相关的预警信息,加强政府对重大食品安全危机事件的预防和应急处置,可大大降低食品安全事故的发生率,有效减少其可能造成的损失。
党的十九大报告提出,推动互联网、大数据、人工智能和实体经济的深度融合。据不完全统计,已有12个省(直辖市)设立了省级的大数据管理机构。《2019中国大數据产业发展白皮书》中提出,政府大数据从数据资产管理走向大监管大服务,从趋势上看,未来政府的大数据应用将逐步向大监管大服务方向迈进,以实现更精准高效的监管和更便捷深入的服务。随着5G、人工智能和大数据等信息技术在食品生产、流通与销售领域的普遍应用,利用新方法、新技术来开展食品安全预警体系建设显得十分必要。
本文从大数据背景的角度分析当前食品安全监测预警体系存在的问题,提出相应的完善措施,并针对如何建立人工神经网络食品安全风险预警决策中心进行探讨。
1 建立食品安全统一编码数据库
1.1 食品安全数据库存在的问题
近年来,我国食品信息化已形成多个食品分类体系,如全国食品污染物监测网络的食品分类、中国居民营养与健康状况调查中的食品分类、农产品分类与代码、总膳食研究中的食品分类等,各种分类系统相互交叉、编码不一致造成严重的“信息孤岛”问题。这种现状引发的最大的问题是无法对各系统之间的数据进行挖掘、整合、分析和综合利用。因此,食品安全分类编码不一致是当前数据融合共享难以实现的重大难题,而打通部门间数据库的壁垒,保证数据有效汇总,建立一套完善的符合食品及相关因素全覆盖的编码系统势在必行。
1.2 统一食品安全编码的设计及应用
对食品进行编码是对食品数据认识和逻辑统一,对食品属性的统一编码有利于机器进行数据处理和分析。刘杨等[2]提出基于食品健康链的大数据智能编码系统设计,这套系统依据现有食品信息系统,编写数据字典,以大数据为导向,对食品数据进行解码和统一编码,构建全面可溯源的编码,以实现整合食品相关数据形成大数据库的目标。采用的这种面向大数据的编码方式是数据标准化和数据决策分析的必要步骤。
食品安全数据编码标准推广初期,可考虑采用柔性智能编码对接等技术对我国已建立的多类系统进行对接、汇总形成统一的食品安全编码数据库。通过试运行对编码系统进行多方位验证,降低试错成本。
2 建立食品安全风险预警决策中心
2.1 食品安全预警现状
食品安全风险的评价中指标数量多,各种指标关联着不同的有害因素,差异性大。目前,现行的评价方式往往只能评价部分指标,导致评价存在一定的主观性。鉴于食品安全评价体系的复杂性,仅对指标是否合格进行统计分析是不够的。合格区的数据常因指标合格被忽略,而食品安全预警信息可以从合格的数据中评估出来。目前,现行的食品安全风险评估模式主要采用食品安全委员会进行专家评审的方式,结果准确但评估的数据量和评估速度局限。有部分风险预警系统虽然能够利用已有规则预测未来应该监督抽检的重点,但仅对局部数据进行简单挖掘,难以形成全面的食品安全风险预警机制[3]。
2.2 机器学习技术在食品安全预警中应用情况
随着人工智能技术的发展,机器学习等技术可从大量数据中自动分析提取规律,并利用这些规律对未知数据进行计算和预测。随着我国食品安全风险监测数据量的增加,BP(Back Propagation Network)神经网络、贝叶斯网络和决策树等机器学习算法已被用于风险评估领域计算。其中,贝叶斯网络一般模式为利用先验信息和总体分布信息加上样本信息计算出后验分布信息,计算过程可以加入专家经验和判断信息。贝叶斯网络已被应用于食品供应链污染暴露预测,可通过计算概率的方式得到风险值。决策树分析法是一种以风险分析为依据,用树状逻辑方式解决问题的工具。决策树目前被应用于农产品的安全评估及食品安全情况分析等领域,方法的可行性得到验证。但由于其简化分点复杂逻辑的特性,使得其产生错误的可能也变大,同时会产生数据噪音。BP神经网络对生物学中神经元互联形成的复杂网络进行模拟,研究者使用BP神经网络成功进行食品质量预警、食品摄入量预警及食品监督抽检合格率预测。BP神经网络有复杂的模式分类能力及多维函数映射能力,具备容错、自学习和自适应特点[4]。
食品安全风险数据具有高度复杂的特性,贝叶斯网络由于依赖于概率计算,属性复杂的组合会使算法复杂度增加,预测难度加大。决策树分析法建立于深度搜索之上,不能很好的分析缺项数据。BP神经网络基于感知器的设计,使其对不确定问题具备高度解决能力,随着数据量的增加和训练,其预测会越来越精准。BP神经网络可克服目前其他机器学习技术在食品安全预警应用中存在的不足,适合应用于食品安全风险预警领域。
3 基于BP神经网络食品安全风险预警机制的建立
大数据新形势下的食品安全风险预警决策中心应具备对检测数据进行实时分析和预警的能力。食品安全风险预警机制模型可分为数据级、特征级、决策级,见图1。数据级现阶段可由食品安全主管部门协同相关部门开放食品相关数据库权限,由柔性智能编码系统在不改变现有数据库结构和正常使用的前提下,将数据自动化实时输出到特征级,特征级按照食品安全智能编码组成关系型数据库,并进行数据清洗。决策级建立初期由风险评估专家对数据库数据进行评估,利用评估结果对BP神经网络进行训练,训练数据达标后,利用BP神经网络对数据进行决策,组织专家对决策结果再次评估,待评估合格后可上线运行。运行过程中,由专家确认BP神经网络决策结果,如出现偏差,由纠正后的数据继续训练神经网络,确保决策系统迭代更新,满足不断变化发展食品安全新形势[5]。
4 结语
本文通过分析大数据背景下构建食品安全风险预警机制存在的主要问题,如数据库不统一、专家分析模式实时性欠缺、处理数据量小等,结合国内外近期关于构建食品安全风险预警机制的相关研究,提出基于智能编码技术柔性对接技术及BP神经网络等先进数据处理手段的预警机制。本模型仅需要食品相关部门开放现有数据库便可自动汇总形成统一数据库,建立地方大数据库,且预警系统可操作性强,该机制对接现有专家评估模式的同时,使用专家评估结果对BP神经网络进行训练,随着BP神经网络的成长,专家评估结果可对BP神经网络进行不间断评估、评价和迭代更新。最终该机制将满足或者超越现有风险预警的期望,对食品安全预警、评估、监管工作起到较大的辅助作用。
参考文献:
[1]安 莹.我国地方食品安全预警体系构建要点研究——以苏北地区为例[J].食品安全导刊,2015(24):19-20.
[2]刘 杨,马 东,肖革新.基于食品健康链的大数据智能编码系统设计[J].中国卫生信息管理杂志,2018,15(5):575-578.
[3]陳夏威,王博远,岑应健,等.基于机器学习的食品安全风险预警研究现状与展望[J].医学信息学杂志,2019,40(3):56-61.
[4]Wang Y J,Yang B, Luo Y,et al.The application of big data mining in risk warning for food safety[J].Asian Agricultural Research,2015,7(8):83-86.
[5]李宗亮.基于大数据挖掘的食品安全风险预警系统研究[D].长沙:湖南大学,2016.