李顺求 王渊洁,3 王 秉,3
(1. 中南大学资源与安全工程学院 长沙 410083;2. 中南大学安全理论创新与促进研究中心 长沙 410083;3.中南大学安全科学与应急管理研究中心 长沙 410083)
一般而言,生物安全事件涉及突发新发传染病(如新型肺炎疫情)、生物入侵、农业转基因生物、农用化学品、新型生物技术、实验室生物泄露、生物恐怖袭击和生物武器威胁事件等[1]。随着生物科技的迅速发展和全球化进程的加快,各种生物安全事件层出不穷,生物安全问题已成为全世界与全人类所面临的重大威胁之一[2]。正因如此,从维护国家长治久安的高度,我国将生物安全纳入国家安全体系,以期提高国家生物安全治理能力[3]。从安全科学(包括安全情报学)视角来看,生物安全是自然科学与社会科学的交叉内容,生物安全治理离不开生物安全情报的支撑[4]。加之人类已步入大数据时代,生物安全数据正在海量递增。生物安全大数据作为获取生物安全情报的宝贵资源,对国家生物安全治理具有深远影响[5]。刘光宇等[6]认为,我国应围绕生物安全治理的情报需求,在情报工作中引入大数据、人工智能、云计算等前沿新兴技术的集成应用,加强生物安全数据库等关键领域和生物监测等核心技术的研发。在生物安全大数据中,海量的生物安全数据庞博繁杂,有价值的生物安全情报常常被埋没在无用的生物安全数据中。因此,大数据驱动的生物安全情报应重点关注“如何将生物安全数据转化为生物安全信息,进而最终转化为生物安全情报”。遗憾的是,在实际生物安全治理中,生物安全情报的综合集成是一项繁杂重复的任务,安全情报人员很难高效地将生物安全数据分辨、提取并转化为生物安全情报,承担繁重具体事务的部门也缺乏得心应手的信息化工具,往往会出现人力不足与大量事务依赖人力的问题,相关决策者也缺少一个能够综合各种专家意见并获取生物安全情报的平台。因此,大数据背景下的生物安全情报系统建设研究意义重大。
目前,在情报系统研究方面,尚未有专门针对生物安全情报系统的研究,研究主要集中在公安情报系统与竞争情报系统研究方面。例如,种辉新等[7]提出城市竞争情报系统建设的基本要求,倡导应将云计算的技术与理念引入城市竞争情报系统的设计和运营;林挺[8]基于数据挖掘技术设计公安情报系统;史新[9]面向汽车制造企业战略管理设计企业竞争情报系统模型。同时,目前尚未有关于大数据驱动的情报系统方面的研究。因此,在当今大数据时代,亟需在情报系统设计与研究的一定基础上开展大数据驱动的生物安全情报系统建设研究。鉴于此,本文从理论层面出发,借鉴已有的相关情报系统(如公安情报系统)研究成果,面向生物安全治理,构建大数据驱动的生物安全情报系统模型框架,以期为搭建生物安全情报系统提供一定的理论依据与方法指导,进而推进大数据环境下情报主导的生物安全治理工作,提升国家生物安全治理的能力与水平。同时,本文研究对其他领域的大数据驱动的情报系统建设也有一定借鉴意义。
1.1生物安全大数据生物安全大数据是指与生物安全相关的所有数据,具有大数据的一般特征[10]。工作人员可通过相关工具和技术收集、分析和整合生物安全大数据,对生物安全状态进行科学描述。如图1所示,生物安全大数据来源一般包括:各类生物实验室、生物安全检测技术、动植物疫情、国家生物资源、生物武器与恐怖袭击、人类遗传基因、农业生物安全事件、生物性公共卫生安全事件、生物安全法律法规和生物安全研究成果等。生物安全大数据主要涉及生态类生物安全数据、资源类生物安全数据、科技类生物安全数据、军事类生物安全数据、信息类生物安全数据、经济类生物安全数据、社会类生物安全数据与其他生物安全数据等[4]。
图1 生物安全大数据及其来源
1.2生物安全情报系统生物安全情报是指在大量生物安全信息(包括生物安全大数据)中经分析和提炼出的直接面向和服务于生物安全治理的一切生物安全信息,对生物安全治理具有重要价值和影响作用[4]。生物安全情报系统可将分散的生物安全大数据进行充分整合,生产出成熟的生物安全情报并投入应用,以此满足安全情报部门在大量生物安全信息(包括生物安全大数据)中进行精细化比对分析的需求,有助于决策者对生物安全局势进行研判。可见,其本质是大数据驱动的一套安全情报分析系统。一般而言,生物安全情报系统需要满足7个设计原则,分别为战略性、安全保密、知识融合、稳定可靠、贡献量化、对象匹配和可升级改进,具体内涵如表1所示。
表1 生物安全情报系统的设计原则及内涵
2.1大数据驱动的生物安全情报系统的特点生物安全情报系统的设计与研究应当紧跟科学技术发展的步伐,随着大数据技术的不断发展,大数据应作为生物安全情报系统的底层驱动力。本文结合前人研究[14-17],总结出大数据驱动的生物安全情报系统的特点(尤其是数据层)如表2所示。
表2 大数据驱动的生物安全情报系统的特点
由表2可知,大数据驱动的生物安全情报系统具备以下特点:第一,系统的数据更加丰富和多样化;第二,系统对数据的处理模式更加先进和全面;第三,系统的规模更加庞大,应用的领域更加广泛,融合程度更高。
2.2大数据驱动的生物安全情报系统模型生物安全情报系统作为整个生物安全体系的重要组成,其构建思路是以生物安全大数据为基础,以生物安全情报生命周期为运行路线,以系统展现层、应用层与数据层3个层面为框架构建而成。该系统主要目标是运用大数据挖掘技术与方法,使生物安全情报的获取与应用更加智能化与精准化,使生物安全情报的业务流程更加顺畅,进而使得生物安全决策及应急指挥更为有效。基于上述认识,构建大数据驱动的生物安全情报系统如图2所示。
图2 大数据驱动的生物安全情报系统
3.1系统展现层展现层主要面向前台用户使用,在生物安全情报系统中作为“桥梁”连接各类用户与系统中各类生物安全资源和应用功能。用户通过“生物安全情报系统门户”进入系统进行访问操作。展现层可保障该人机交互界面(系统门户)具有友好、美观、方便快捷、便于操作和易于学习等特点,为用户提供最高效的服务。如表3所示,展现层所面向的用户种类包括生物安全情报搜集人员、生物安全情报分析人员、生物安全情报生产人员及生物安全情报应用人员,展现层可对不同的用户提供对应的服务界面,完成相应的流程。
表3 展现层所面向的用户种类及相应流程
3.2系统应用层应用层主要面向逻辑关系,是围绕生物安全情报系统的应用功能来进行构建的,主要以数据层为基础,服务于展现层,是二者之间的一个过渡层级。应用层分为前台交互模块和后台分析模块两部分(见图2),并分别完成各自不同的任务需求。前台交互模块应用主要包括“生物安全数据获取模块”“人工评估专家审核模块”与“生物安全情报签发模块”;后台交互模块应用主要包括“生物安全数据处理模块”“生物安全信息整合模块”与“系统平台内部管理模块”,两个系统既相对独立又密不可分,同时兼顾系统的高效实用性与安全科学性。应用模块的具体功能如图3所示。
图3 生物安全情报系统应用模块的具体功能
在图3中,生物安全情报系统功能应用模块主要由6个部分组成,每个模块具体内涵及功能如下所述:
a.生物安全数据获取模块。该模块主要用于对各领域生物安全数据进行上传(可通过其他平台导入或人工录入),并对其进行分类统计。同时,可利用模块内置搜索引擎对生物安全历史数据进行检索,以便随时查询各类所需的生物安全数据。
b.生物安全数据处理模块。该模块是将从各生物机构系统平台、生物研究单位及其他途径搜集的原始安全数据通过抽取和导入等方式完成数据清洗与转化,使之成为符合生物安全情报分析需要的标准化数据[8]。此外,在得到标准化数据的同时,也可为建立数据仓库提供重要基础。
c.生物安全信息整合模块。该模块根据不同的应用需求选择相应的算法,通过量化手段进行数据挖掘和安全模拟实验,将各类生物安全信息的语义描述与数值演化模型等作为特征,融合安全知识获得生物安全信息片段[18],并对预处理完毕的标准化安全数据进行分析研判,给出量化结果的诊断与描述,形成定量生物安全信息。
d.人工评估专家审核模块。该模块主要是生物安全专家对定量生物安全信息进行评估审核,最终通过审核的内容(即生成的生物安全情报产品)可进行下一步签发工作,等待生物安全情报责任人对生物安全情报进行认领。若审核没有通过,则该分析结果将会被退回上一步的生物安全信息整合模块,进行重新修改验证,反复多次,直至通过评估审核。
e.生物安全情报签发模块。安全情报责任人通过该模块完成对生物安全情报的审核确认工作,确认审核无误后,将该生物安全情报产品认领。此后,生物安全情报产品将被给呈递给相关安全决策者,安全决策者可根据生物安全情报产品中的建议做出决断,进而指导生物安全治理的具体工作。
f.系统平台内部管理系统。此模块主要由生物安全情报系统的技术人员进行管理维护。该模块对系统用户进行资料维护与权限管理等操作,具备接收情报效果反馈等功能,同时可对系统生成的数据信息进行统计查询,实现对系统运行情况的实时掌握,确保系统安全规范地运行和使用[8]。
3.3系统数据层数据层面向数据支撑,生物安全数据在生物安全情报系统中主要用于为生物安全决策制定过程提供所有类型数据的支持。在生物安全数据积累过程中,由于生物世界与人类社会之间具有复合性与交织性的特点[19],因此,从“场域安全”理论(场域安全是指与安全关联,具有特定活动性质且没有危险或威胁的关系状态[20])看,生物安全数据同样需要根据不同场域类型存储在相对应模块中,便于进行下一步的数据处理工作。因此,在生物安全情报系统构建中,后台技术人员需根据实际情况设计不同生物安全数据存储模型。基于生物安全的场域类型划分[19],构建“生物安全数据存储模型”如图4所示。
图4 生物安全数据存储模型
此外,数据层主要是由生物安全数据库群、生物安全信息库群和生物安全情报库群组成,依据“数据—信息—情报”三角转化模式[21],可得到三者之间的关系:“情报=信息+人工加工[22-23],信息=数据+技术加工[4]”。因此,数据层中包括以下两个转化过程:
a.生物安全数据到生物安全信息的转化。生物安全大数据库群主要来源于庞大的生物安全数据资源,如生物安全监测数据、动植物疫情数据、国家生物资源数据、生物武器与恐袭数据、人类遗传基因数据、农业生物安全数据、生物性公共卫生安全数据、生物实验室运行数据、生物安全法律法规和生物安全研究成果等。系统对上述各生物安全业务系统的数据资源进行搜集整合,之后再对其进行清洗变换,最终将其导入各生物安全信息库群,完成由生物安全数据到生物安全信息的转化。生物安全信息库群主要包括量化生物信息库、研判工具信息库及专家意见信息库等。量化生物信息库是各安全部门对生物安全数据的量化信息整合,可提供生物安全信息的内容共享;研判工具信息库是生物信息研判所需的数学工具或物理模型,由安全技术信息整合而成;专家意见信息库主要是社会各领域的专家学者对生物安全问题提出的各种建议、意见及经验性判断等,对生物安全信息定量分析具有参考价值(见图2)。生物安全信息库群最终目的是为生物安全情报提供整合资源。
b.生物安全信息到生物安全情报的转化。生物安全信息通过各领域生物安全专家评估审核并生成审核报告,最终转化为成熟的生物安全情报,被储存在对应的情报库中,可随时提取使用。生物安全情报库群包括生态类生物安全情报库、资源类生物安全情报库、科技类生物安全情报库、军事类生物安全情报库、信息类生物安全情报库、经济类生物安全情报库、社会类生物安全情报库等。生态类生物安全情报库包括外来物种情报、生物多样性情报及动植物疫情情报等;资源类生物安全情报库包括国家生物资源情报与人类遗传资源情报等;科技类生物安全情报库包括生物技术情报、生物实验室情报与生物监测网情报等;军事类生物安全情报库包括生物恐袭情报与生物武器情报等;信息类生物安全情报库包括国家公民健康情报、人群异常疾病情报与联网生物医疗设备情报等;经济类生物安全数据库包括转基因农作物情报与疫苗研发情报等;社会类生物安全情报库包括生物性公共卫生情报与生物性食品安全情报等(见图2)。生物安全情报库群的最终作用是为决策者提供生物安全的决策支持。
在大数据时代,运用大数据驱动来获取生物安全情报是现代生物安全治理的重要内容,生物安全情报系统是否完善决定了决策者能否获得可靠、科学、及时且完备的生物安全情报。因此,本文从理论层面出发,结合现有生物安全情报理论基础与大数据技术研究成果,提出大数据驱动的生物安全情报系统模型的理论框架,是大数据在生物安全情报领域应用的一项重大尝试,旨在填补当前安全情报部门在利用大数据驱动进行生物安全情报搜集、分析、生产与应用等方面中的不足与短板,为生物安全情报系统设计提供一个整体理论框架,同时也为今后大数据下情报主导的生物安全治理工作模式向更高层次迈进奠定一定的理论基础。