□ 王 婧 彭 斌 重庆医科大学公共卫生与管理学院 江 生 重庆市食品药品检验所
姚晓倩 董姣姣 重庆医科大学公共卫生与管理学院
在21世纪全球信息化大背景下,中国乃至全世界的食品安全面临多层面的影响,机遇与挑战并存。一方面,人民从对食品“量”的被动需求转化为对食品“质”的主动要求;另一方面,近几年来居民生活水平不断提高,但食品安全事件却频频发生,成为社会焦点,并且上升为全球性危机。三鹿奶粉事件、假鸡蛋事件、染色馒头事件等等食品安全重大问题不剩枚举,还有国际上流传广泛的食源性疾病危机,都说明食品在生产、储存、运输及销售等环节中存在不少漏洞,应把食品安全问题作为当前研究的重点。
面对如此严峻的食品安全形势,建立的法律法规很难达到理想中的效果,人民对政府及有关部门的怀疑态度愈发严重,所以政府应从事件发生后的紧急处理阶段调整到在事件发生前的预防控制上来,主动出击。
在全球大数据与信息化的背景下,监测与收集食品安全数据越来越容易,实时的食品监测数据数量多,具有多源性、异构性等特征,探索更多适合于数据性质的预警方法与体系尤为重要。风险预警在各个行业与领域都有广泛应用,在实践过程中得到了多次的发展和完善。对于预警方法和模型,需要结合不同数据的特点不断创新、打开不同的视角,作为重要支持技术以实现食品安全。
在食品安全范畴中预警指对食品质量安全风险的预防预测,通过对食品检测数据的风险分析评估,预测食品安全风险的趋势变化[1]。食品安全预警是食品监管的重要部分,正确运用其方法可以提高食品安全水平,降低食品安全危害事件的发生概率。
食品安全预警体系综合了监测与收集数据、处理与分析数据以及发出警告3方面的内容,并在逐步的使用中不断更新,以达到最优状态。下面简单介绍几个各国各地区的食品安全风险预警模型。
欧盟有食品与饲料快速预警系统(rapid alert system for food and feed,RASFF),主要用于欧盟各成员国之间的风险信息交流,若存在风险则及时发布通告并采取相应措施;美国有食源性疾病主动监测网络(food born disease active surveillance network, Food Net),简称食品网(Food Net),通过此系统可以确定食源性疾病的危害程度,并将疾病与特定食物相联系;中国有国家食品安全风险评估中心( China National Center for Food Safety Risk Assessment,CFSA),保障居民的食品安全以及公众健康。
对于食品安全预警模型,已经有了许多成熟的研究。国内学者探索了许多种方法,运用支持向量机对畜产品[2]等建立了安全预警模型;基于BP神经网络开发了食品安全评估系统[3];运用关联规则对肉类食品冷链物流质量[4]等建立了安全预警模型;基于贝叶斯网络构建了网络订餐食品安全预警系统[5]。
国外学者也做出了许多研究。Allain V等提出了应用于家禽屠宰场肉类检验的预警系统,评估了13个不同食品安全事件出现之前的早期信号,提出新兴风险识别支持系统(ERIS)的设计,以支持风险管理者识别新出现的风险[6];Xi W等基于粗糙集理论和层次分析法,建立了农产品“2-3结构”模式的质量和风险评价模块化系统[7];Wang Xueli等建立了贝叶斯分层模型,使用食源性疾病的访问患者的数量预测患者的每日真实数量[8];Barons M J等设计了一种动态贝叶斯网络方法,为食品安全提供决策支持,与糖业的潜在不稳定性相关联[9]。
层次分析法(Analytic Hierarchy Process,AHP)是20世纪70年代初,美国运筹学家萨蒂提出的一种定量与定性相结合的决策分析方法。它将一个复杂的多目标问题,分解成目标层、准则层和方案层,构建层次结构模型,抓住问题的本质,提供合乎要求的决策方案。图1为其示意图。
层次分析法的主要步骤为构建层次结构模型,构造判断矩阵,层次单排序及其一致性检验,层次总排序及其一致性检验。首先通过深入了解和分析问题,确定系统的总目标,然后将总目标分解成若干因素,一层一层组成一个层级体系,形成嵌套模式。
图1 层次分析法示意图
支持向量机(Support Vector Machine,SVM)是1995年Corinna Cortes和Vapnik等人最先提出的,它的优势是小样本、非线性及高维模式的识别。它根据有限的样本进行训练,其样本称为支持向量,寻找一个最优的超平面,使两个样本之间的分类间隔最大化,用这个超平面可以成功区分不同的类别。图2是典型的支持向量机分类示意图。
图2 支持向量机分类示意图
可以明显看出图中有两个不同的类别,在二维空间中,最优超平面即是一条直线A,直线A离两个类别的距离都是最大的。其数学形式如式(1)。
其中,g(x)为分类函数,b为分类阈值,ω为权重向量,x为样本特征向量。可以看出,g(x)不唯一,所以最优g(x)可通过几何指标求得。
若为线性不可分,则在方程中添加一个正则化参数,即惩罚系数;若为非线性,则通过核函数映射将低维空间的样本向量转换为高维空间的样本向量,然后再进行分析[10]。
BP神经网络于1986年由Rumelhart和McClelland等科学家首先提出,又称为误差反向传播神经网络(back-error propagation neutral network,BPNN),是一种应用广泛的人工神经网络(artificial neutral network,ANN)[11]。它采用逆向误差算法来训练多层次网络,其网络信息向前传播,而误差是逆向传播,不断调整权重和阈值,从而得到一个误差平方和最小的网络。
典型结构包括输入层、隐藏层和输出层,隐藏层可以包含多个层次,结构示意图如图3所示。
图3 BP神经网络示意图
其中一个神经元的输出如式(2)所示。
式(2)中:xi代表神经元的第i个输入,ωi为xi的权重,取值有正、负两种,分别反映了xi是兴奋的或是抑制的,T为兴奋阈值,n为输入个数,y为输出,当输入之和大于T,则y为1,小于T,则y为0。
贝叶斯网络在1985年首次提出[12],把有向无环图和概率结合起来,利用先验概率计算条件概率,利用概率知识进行分类,表达复杂的因果关系。贝叶斯网络一般分为两种类型,一种是静态网络,一种是动态网络,在静态网络中加入时序因素后就形成了动态网络,提高了预测精度。
贝叶斯定理公式见式(3)。
式(3)中:Pr(A)为A的边缘概率,不论B是否发生,Pr(A)都不会改变,即Pr(A)是先于B发生的,所以又称为先验概率;而Pr(A|B)则是事件A的条件概率,即在先发生了B事件的条件下再发生A事件的概率,所以也称后验概率。
一般来说,贝叶斯网络可以表示为B=(Bs,Bp)。Bs=(X,E)是一个有向无环图,X是随机变量的集合,E代表有依赖关系的有向边的集合。BP是条件概率分布的总和。式(4)的假设决定了网络的结构。
式(4)中:πxi是父节点集合,xi的条件概率分布为P(Xi|πi)。
图4是贝叶斯网络结构示意图,网络中的每个节点就是一个变量,变量间的线段表示因果关系,利用前一个节点的概率计算下一个节点的概率,最后对得到结果的概率进行分类。
图4 贝叶斯网络示意图
决策树是用于分类的机器学习树形结构。通过已知概率,计算不同方案的期望,选择期望最大的方案,从而达到分类的目的,是运用概率的图解法。因为训练过程中的决策分析图很像一棵树,所以称为决策树[13]。在决策树中,每一个节点代表一个事件,即上一个属性的不同取值,进而在叶节点形成了每一种可能的类别,从根节点到不同的叶节点的路径为生成的规则集合,可运用此规则预测新样本的类别。
关联规则于1993年提出[14],其目的是要找到既满足最小支持度又满足最小置信度的强关联规则,从数据中发现潜在的相关规则与信息。Apriori算法是应用最广泛的算法之一,之后又很多学者在其基础上进行改进,弥补了经典Apriori算法的不足。
Apriori算法的思路为首先扫描数据库,找到所有的1-频繁项集,之后经过处理、修剪找到所有的2-频繁项集,以此类推,找到所需的k-频繁项集,最后由频繁项集生成符合条件的强关联规则。
2018年12月,研究团队对于食品安全监督管理、风险预警方面存在的问题,与重庆市食品药品监督管理局的工作人员进行访谈与调研,结合对文献的研究,总结了现阶段食品安全预警方面存在的问题与困难。
如自动售货机、保健食品、农村一条龙家宴等属于监管盲区,法律法规没有清楚界定其属于哪个监管部门,并且类型杂、多,无法精准监管,导致无法获取相关食品安全数据,不可能达到预警状态。
第二是在各部门联合执法的情况下,还是存在很多监管漏洞,管理投入成本高,耗费人力物力,与之对应的可用于安全预警的人力物力就要相应减少,侧面反映出机构改革还不到位。
很多繁复的工作需要人工进行,加大了政府工作人员无谓的工作量,不能有效的把时间和精力运用到食品安全预警最需要的地方。
目前用于食品安全预警的机器学习技术众多,应用也十分广泛,但真正做到事前“预警”的很少。究其原因是各个平台、政府部分之间的数据不共通,很多数据是职能部门内部保密的,这对于全链条的食品安全风险预警是一大障碍。
在WEB2.0时代背景下,获得海量数据越来越容易,如何挖掘出数据中的有用信息才是重中之重。对于食品安全的预警模型研究,已经进入一个新的篇章,从单纯的算法研究转变为结合政府各部门的日常监管需求,以需求为导向进行应用研究,从而进一步走向食品安全社会共治的道路。将协同治理与新技术相结合,使得食品安全预警不仅为现在服务,还为将来服务。将预警研究延伸到市场、农业、生态环境、食源性疾病、社会与气候等方面中去,做到全链条的社会共治食品安全预警。