基于食品、药品安全的信息化平台建设研究*

2022-05-10 07:28陈海涛
计算机与数字工程 2022年4期
关键词:分类器浏览器样本

陈海涛

(中国食品药品检定研究院信息中心 北京 102629)

1 引言

当前,在食品、药品安全监管体制机制、法律法规、政策标准、监测评估、检验检测、人才队伍、技术装备等方面,还存在一些亟待解决的问题[1~3];比如食品、药品行业产业化、规模化、集约化程度不高,基础薄弱,产地环境污染问题较为严重;企业主体责任落实不够,质量安全控制投入不足,管理能力不强,行业诚信道德体系建设滞后[4~5];危害食品、药品安全的违法犯罪行为屡禁不止,食品、药品安全风险隐患依然较多,食品、药品安全事故时有发生,食品、药品安全监管面临的形势依然复杂严峻[6~8]。

目前,食品、药品安全的信息化平台建设将逐步建成覆盖全市各级食品药品监管部门的统一高效、互联互通、协同共享的食品药品安全服务、监督管理的行政服务平台[9~10]。根据食品、药品安全监管信息化建设趋势,按照各级政府的要求并结合目前实际情况,充分利用现代信息技术,科学进行顶层设计,推进食品药品监管信息化工作开展,建成食品药品安全综合监管统一平台[11~12],两级联动的监控指挥中心,完善三大支撑体系,建成日常监管、稽查执法、应急处理、信息监测、信用管理、溯源管理、行政服务为核心的七大应用系统,实现“一平台、两中心、三大支撑体系、七大应用系统”的整体目标,以全面提升我市食品药品安全监管水平、公共服务水平和决策水平[13~14]。

2 信息化平台体系架构设计

在信息化平台架构设计中,将其划分为基础层、数据层、数据处理层、数据应用层。具体架构示意图如图1所示。通过该信息化平台实现食品、药品安全时空预警信息化体系的业务架构设计,实现以“食品、药品健康链”为主线的全生命周期信息监测预警,下文将详细描述。

图1 信息化平台体系架构设计框图

在基础层中,其包含有网络系统、智能设备、检测装置、存储设备等,主要是用于维持信息化平台体系架构运行的硬件装置等,除此还包含计算机、应用程序服务器、数据库服务器、通讯协议、机房等基础设施。

在数据层中,其包含各种不同设备传递的数据,用于存储各个基础层使用过程中用户传递、录入的数据、智能设备测量的食品、药品数据,这些底层的检测设备通过数据接口传递到数据层,为智能设备提供数据接口。在数据层中,其还包括数据信息系统,在该系统中,其还包括监控系统,如图2所示。该数据信息系统包含监控系统,监控系统连接有数据采集单元、数据共享单元,其中数据采集系统采集数据有食品相关数据、药品相关数据,在采集过程中,通过食品污染物监测网络、药品污染物监测网络或其他食品、药品污染物监测网络。监测后的数据在数据信息系统中进行共享。这些数据包含但不限于食品安全抽检数据、药品安全抽检数据、进出口食品、药品数据、其他监控数据、食品、药品状态数据,通过数据共享实现不同单元之间的数据共享。

图2 数据信息系统构架图

在数据处理层中,其包含了底层设备或系统所需要的所有功能上的算法和计算过程,并与上层的数据应用层进行数据交互。抽象的说,数据处理层就是处理、计算、管理与数据业务相关的部分,在本文设计中,采用了机械学习算法对食品、药品数据进行处理,比如:决策树算法模型、Apriori算法、AP聚类分析算法、BP神经网络模型、支持矢量机算法、Adaboost迭代算法等机器学习方法构建预测预警模型[15],其数据算法模型如图3所示。

图3 数据处理模型示意图

其中AP聚类分析方法是一种机器学习并且无监督的聚类算法,借助于AP聚类分析方法能够将不同区域的多类评价指标按医学发病程度或者食品、药物污染情况,按一定的属性分类,这样以比较不同区域的总体食品、药品情况。BP神经网络模型算法是按误差逆传播算法训练的多层前馈网络,该方法利用梯度搜索技术,将网络的实际输出值和期望输出值的误差均方差为最小。支持矢量机模型主要用来解决不同数据之间的模式识别问题、函数回归问题。利用上述算法模型能够建立以食品污染、药品残留、食品残留、重金属污染、微生物致病菌等类别作为输出层的食品、药品安全预警模型[16]。通过各种不同数据的训练样本为考察对象,建立起不同形式的预测模型。通过这种方式能够解决不同任务,处理不同的数据,并且每种数据算法模型中也有着诸多不同的算法,每种算法都适应不同的用户需求。

上层为数据应用层,在有的地方也被称为表示层,在该层,用户可以通过客户端来浏览访问层,使得用户通过浏览器来访问信息化平台界面,继而获取相关数据信息资源,通过用户界面显示数据处理结果。

3 关键技术设计

3.1 Adaboost迭代算法的建模

本文采用Adaboost迭代算法对信息化平台接收的不同数据进行分类和计算,其计算过程如图4所示。

图4 Adaboost迭代算法流程图

1)获取训练样本,训练弱分类器;对N个食品、药品的训练样本数据进行训练、学习,输出第一个弱分类器;在开始算法之前,将每个食品、药品样本的权重初始化定义为1/m,这样有利于使每个食品、药品样本都是为等概率的分布,便于下一步工作的计算和处理。

用公式表示为

2)再次训练弱分类器,将分错的食品、药品样本和其他的食品、药品新数据汇集在一起,再次构成新型的N个食品、药品训练样本,通过对新型的食品、药品样本的学习,输出第二个弱分类器。

用公式表示为

3)继续训练弱分类器,将步骤1)和步骤2)都分错了的样本加上剩余的食品、药品新样本数据重新构成新的第N个训练样本,通过对新型的食品、药品样本的学习,输出第三个弱分类器。

4)迭代计算,根据上述训练,开始迭代,计算出不同弱分类器分类的误差,所计算出的误差等于各个不同分错食品、药品样本的权重和,假设一个弱分类器正确分类了一个权重大的食品、药品样本,则使用该分类器计算的误差将会较小,否则误差较大。在使用过程中,通常算法迭代的次数不超过弱分类器的个数,如果有多个弱分类出现,则按照用户的需求进行选择。

步骤2)、3)、4)用公式表示Gm(x)在训练集上的误差率公式为

5)归一化处理:获取最优分类器之后,然后进一步地计算所选取的分类器的权重,接着再更新各个不同样本的权重,进行再归一化处理。

归一化处理后,计算Gm(x)的系数,am代表Gm(x)在训练后的最终分类器中的关键程度,用公式表示为

在上述公式中,em≤1/2时,am≥0,通过公式可看出,am与em成反比例关系。即误差率越小,分类器在最终分类器中越起到比较大的作用。

6)迭代判断:判断迭代次数是否等于阈值,如果与阈值相等,则完成迭代计算,最后的分类器则由迭代过程中所选择的弱分类器经过线性加权得到的。如果迭代次数不等于阈值,则重新进行迭代计算。

3.2 Adaboost迭代算法在信息化平台中的应用

基于上述模型的建立,将上述建立的数据模型应用到上述建立的信息化平台的评估上,则进行以下剖析,假设数据样本如表1所示。

表1 样本数据表

在求解时,对初始化训练数据进行初始化权值分布,使每个权值Wi1=1/N=0,1,其中N=10,i=1,2,3……10,然后分别将m=1,2,3…等值进行迭代。在进行迭代计算时,对于m=1,在权值分布为D1的训练数据上。使用分类器公式G1(x)表示为

在上述公式中,假设令阈值为2.5时,则误差值为0.3,即当x<2.5时,G1(x)的值为1,当阈值为5.5时,则误差值为0.4。当阈值G1(x)为8.5时,误差率为0.3。

然后利用上述公式得出:G1(x)在训练集中上的误差率e1=P(G1(xi)≠yi)=3*0.1=0.3。然后根据误差率e1计算G1的系数:

a1表示为G1(x)在最终的分类函数中占用的权重为0.4236。然后进行下一轮的迭代。然后利用上述方法进行迭代计算,直到计算到误差最小为止。

4 软件设计

本文设计的信息化平台的软件部分可以划分为系统数据库、数据访问层、系统组件库、数据接口、万维网(World WideWeb,WWW)服务器、无线应用协议(Wireless Application Protocol,WAP)服务器[17]六个部分,其结构示意图如图5所示,下面对其主要技术进行描述。

图5 软件平台结构设计

1)Java EE

Java EE,其被称为Java平台企业版(Java Platform Enterprise Edition),能够支撑企业级计算系统。在本文应用中,结合食药监局大部分业务应用的现状以及跨平台、跨系统等不同特性的要求、系统操作、系统维护便捷化、简易化的需求。该软件系统满足食品、药品处理数据、适应各种数据应用、存储和发展变化的需要,在本软件平台设计中,选择Java EE体系架构作为处理数据的操作系统。

2)DB和OS

本文的软件平台系统兼容、使用各种不同大型关系型数据库(DB)以及各类不同主流服务器操作系统(OS)。更进一步地说,本文软件系统至少能够支持各种大型的主流关系型数据库,比如:ORACLE、SQL SERVER、MySQL等;除了这些操作系统之外,还能够支持Windows、Linux等各种操作系统。

3)Webservice

在本文的软件平台中,还采用了Web Service技术,Web Service技术可以将运行在各个不同设备上的应用程序彼此之间互相进行数据交换或数据集成,并不需要额外的、专门的第三方软件或硬件。WebService交互实现过程是将WebService遵循SOAP协议,并且通过XML封装数据进行处理,然后经由Http协议实现食品、药品数据的传输。本文的软件平台根据Web Service规范来实施不同的应用程序,这样能够使用具有不同语言、不同平台或内部协议的软件平台,有效地满足异构平台数据的集成以及各种不同应用软件的交互需求。

4)B/S结构

B/S是Brower/Server的缩写,其中文为浏览器/服务器,该结构是Web广泛使用后的一种网络结构模式。Web浏览器被称为客户端最为重要的应用软件。这种架构采用采取浏览器请求、服务器响应的工作模式。通过使用该用户,能够使用户通过浏览器访问Internet上经由Web服务器产生的图像、文本、数据、图片、动画、视频点播和声音等信息。采用该消息,使得用户可以在不同的地方操作该平台,无需安装特别的专门软件,维护、使用都很方便。在应用程序中,其工作过程极为便利,通过客户端发送食品、药品数据请求,使得用户在客户端中的浏览器页面能够提交表单操作,并向服务器发送食品、药品数据请求,然后等待服务器响应。用户在服务器端处理发送来的食品、药品数据请求数据,在服务器端端接收并处理食品、药品数据请求数据请求。然后利用应用服务器端(通常使用服务器端技术,如JSP等)对食品、药品数据请求进行数据处理并产生数据响应。而后在服务器端发送食品、药品数据响应,此时,服务器端能够把用户请求的诸如网页文件、图片、声音等数据信息返回给浏览器,浏览器然后再执行接收到的HTML文件,供用户使用。

5 结语

本文基于食品、药品数据利用、稽查、管理便利为目的,以“食品、药品健康链”为主线的全生命周期信息监测预警为手段,构建出新型的信息化平台架构。并将该系统划分为基础层、数据层、数据处理层、数据应用层。在数据处理层中,采用诸如决策树算法模型、Apriori算法、AP聚类分析算法、BP神经网络模型、支持矢量机算法或Adaboost迭代算法等机器学习方法来构建预测预警模型,并设计出安全信息化平台构架。从而实现食品、药品安全时空预警信息化体系的业务架构设计。

猜你喜欢
分类器浏览器样本
分类器集成综述
少样本条件下基于K-最近邻及多分类器协同的样本扩增分类
学贯中西(6):阐述ML分类器的工作流程
微软发布新Edge浏览器预览版下载换装Chrome内核
基于AdaBoost算法的在线连续极限学习机集成算法
直击高考中的用样本估计总体
随机微分方程的样本Lyapunov二次型估计
基于支持向量机的测厚仪CS值电压漂移故障判定及处理
七年级数学下册期末检测题(B)
浏览器