□ 卢大安 杭州市食品药品检验研究院
随着我国社会主义市场经济的繁荣发展,互联网也渗入到社会的方方面面,并成为人们生活及工作的重要工具。计算机及互联网的长时间运用,帮助各个领域搜集存储了大量数据,这些数据都蕴含着极高的利用价值,为了充分发挥这些数据的最大使用价值,使这些来自于各个行业的数据在经过整合处理后,再应用于推动行业进步,大数据技术应运而生。近些年来,食品安全问题屡次发生,每次事件的曝光都意味着大批消费者已经深受其害,食品安全直接关系到民生安全,食品安全风险预警也逐渐成为社会关注的焦点。若要减少食品安全事件,必须建立完善的食品安全风险预警制度。大数据技术在各个领域获得的成就,也使食品安全预警领域关注到这一技术[1]。
大数据,从字面意思来看就是多种数据,百科将其定义为需要新处理模式才能具有更强的决策力、洞察力和流程优化能力的海量、高增长率和多样化的信息资产。通俗来讲,即在采取一系列处理措施之后,可以实现优化工作流程、提高决策能力及洞察能力的大量相关数据,其特征有5个,分别为大量、高速、多样、低价值密度以及真实性。大数据最初被使用于Nutch这一开源项目中,彼时大数据的定义较为简单,被称为为实现网络搜索更新而进行的分析或者批量处理的大量数据。发展到现在,大数据已经被广泛应用于各个行业领域,市场竞争的趋势也逐渐向信息数据竞争发展。大数据经过长期积累与发展,已经成为一种蕴含多种潜在价值的重要资产。
经过近几年来各种计算机硬件设备的发展,其所储存的各种数据信息已经形成一个巨大的数据库,如何将这些沉积的数据灵活运用起来,使其转变为有效的数据资源,成为了人们研究的重要课题。大数据挖掘技术就产生于此种背景下,它能够将堆积的数据转变为可用的知识资源。大数据挖掘就是运用计算机技术自动挖掘数据库中的潜在有效信息,并归纳总结其发展趋势的一种方法[2]。
贝叶斯图代表的是一种不确定因素的挖掘模式,它的每个节点都是一个变量,贝叶斯图就是按照这些变量之间的联系来测算出下一变量可能出现的概率,它所反映的是所有数据之间的概率规律,所以其一般用来发现数据之间的概率相关关系。它的原理是根据行为结果以及它们之间的原因结果关系,来推测这种结果未来可能发生的概率。它在食品安全风险预警领域主要运用于食品产品设计,例如已知行为结果是人们爱吃甜食,那么贝叶斯图中的各个节点便是人们爱吃的各种甜食,通过建模推测,可以得出食品的颜色会改变人们对事物的喜欢程度。结合贝叶斯图的特征,设定有关的风险节点,并对其进行多次模型测试,发现其在不同情况下发生的变化、具体变化过程及最终结果,从中得到各个节点上变量发生改变的概率,推测出食品安全风险发生概率值。
决策树侧重于使用逻辑推测方法选择出最优方案来解决疑难问题,将它应用到食品安全风险预警领域中,有助于食品安全的研究创新。决策树采取降维方法事先进行数据分析处理,从中发现能够影响农产品质量的相关特征值,之后再建立决策树模型进行组合优化分析,来判定农产品的质量情况。在决策树建模分析过程中,选择土壤情况、该区域水质情况等要素构成决策树的基本因素,采取相关数据测试的方式得出对应的准确率,以此作为评测农产品质量安全风险预警的工具。
人工神经网络的建模方式借鉴了生物学概念中的神经网络模型结构,并进行多次的测试及调整,发现数据中存在的错误并对其进行精准学习,此种数据挖掘方式具有高学习精度特征。现今存在的网络模型有数十种,使用最为频繁的是反响传播神经网络,它的评测原理是让数据在各个层级中的不同神经元中进行正向传播,然后调整权值,以及反向传播,对数据集进行研习了解,从而调试好相关模型。在今后的食品安全风险预警领域中,可以根据该原理寻找不合格食品的主要结构成分,或者直接根据结构要素挑出不安全产品。
目前食品市场中的产品种类纷繁复杂,其生产加工过程也千差万别,在利用大数据技术进行食品安全风险预警的过程中应该采用多种模型,以提升预警的准确率,食品安全问题直接关系到人们的身体安全,所以必须运用大数据技术进行分析预警。除此之外,还要注意提升食品制造产业人员的社会责任意识,从根源杜绝食品安全事故。