韩 辉,伍 波,侯 颖,宋悦谦
(中国海关科学技术研究中心,北京 100026)
21 世纪以来,大数据相关技术、产品、应用和标准不断发展,以数据驱动、智慧决策、智能作业为特征的智慧创新模式已经广泛渗透并深刻影响着社会发展的各个领域[1-2]。大数据技术的发展与应用有助于推动经济发展、提升政府治理能力、保障和改善民生,因此受到各国政府高度重视并上升到国家发展战略[3]。海关是依法履行进出境生物安全监管的行政执法机关,是国门生物安全风险防控的第一道屏障。在全球生物安全形势日趋严峻的大背景下,海关全面加强对大数据技术的研究与实践应用,构建基于大数据技术的国门生物安全风险监测预警网络,有助于快速感知和识别重大新发突发传染病疫情、动植物疫病和外来物种入侵等风险,做到早发现、早预警、早处置,既是维护国门生物安全的重要举措,也是推进智慧海关建设的必由路径。
随着互联网、物联网和信息化等技术的高速发展,生物安全相关数据量呈暴发式增长,包括疫情疫病发病和死亡数据、人员贸易往来数据和医疗卫生数据等结构化数据,也包括外来入侵生物特征图片、视频、音频和地理位置信息等非结构化数据。生物安全大数据潜藏的价值巨大,在海量的数据中挖掘对相关性分析、趋势预测分析等有重要价值的数据并结合机器学习和人工智能等方法进行深度分析,可以挖掘背后的规律,为相关部门科学决策提供参考。实践证明,大数据在国门生物安全风险防控和治理工作中有广阔的应用前景。
在公共卫生领域,传染病症候群和病原学监测数据、互联网舆情数据、病媒生物和宿主动物数据以及人口流动数据等多来源渠道数据已被广泛应用于传染病监测预警工作,有助于新发突发传染病的快速识别,提高监测预警的敏感性和及时性[4]。在我国新型冠状病毒感染疫情防控中,人口流动、病原学监测和互联网搜索引擎等多源异构大数据的应用,为传染源和传播链追溯、疫情动态追踪和研判预警、医疗卫生资源调配等方面提供了强有力的支撑,为统筹疫情防控和经济社会稳定发展发挥了关键作用[5]。传染病跨境传播是全球各国面临的重要公共卫生问题。有研究人员利用大数据对传染病跨境传播的风险进行了预测。Rocklöv 等[6]利用往来有基孔肯雅热疫情流行地区的国际航班客运量、本地传播媒介白纹伊蚊监测数据和Twitter 用户数据等评估了疫情输入风险和输入后引起本土传播的风险,为传染病输入防控提供了依据。
随着国际贸易往来的不断发展,外来生物入侵问题愈加突出。外来物种的跨境传播、扩散,不仅会导致生态环境破坏,同时也会造成巨大的经济损失。随着外来入侵物种相关数据的大量积累,大数据技术也被逐步应用于外来入侵生物防控和治理工作中。研究人员利用有害生物的地理分布信息、形态特征信息、DNA 条形码以及气候地理信息等数据,结合生态位模型、GIS 空间分析技术和聚类分析方法等模型与算法对外来入侵生物在本国的扩散风险、适生区和适生程度、入侵后定殖的可能性以及潜在的经济损失进行了预测,为外来有害生物入侵的早期预警和快速反应提供了技术支撑[7]。
多年以来,海关已积累了一定的检验检疫、监管和统计等各类业务数据,以及与其他部委、国外官方组织机构交换和采购的数据,形成了大数据基础资源池,加强了数据挖掘和分析,初步让大数据应用融入国门生物安全风险防控工作中,但仍存在诸多问题和局限性,主要表现在以下三方面。
国门生物安全风险监测预警工作需要多系统、多部门共同参与,包括民航、旅游、公安和工信等部门。各部门均有比较完善的业务系统,相关数据资源均可作为生物安全风险监测预警的重要数据源。然而,海关在进行生物安全风险预警时主要依赖于海关业务数据,例如在卫生检疫领域,主要依赖于世界卫生组织等权威机构通报的传染病疫情监测数据和口岸传染病输入病例检疫发现数据。海关与各部门之间缺乏长效的信息共享机制,面临“数据壁垒”的挑战,关联数据扩展、数据互联互通和整合分析尚无法实现。为提高生物安全风险预警的及时性、敏感性和特异性,还需要综合分析疫情疫病流行国家和地区媒介生物、环境、人口免疫水平、人口流动和国际贸易等数据,而在海关实际工作中相关数据涉及较少,极大地限制了国门生物安全风险监测预警能力。
生物安全风险预警技术将直接影响到预警结果的及时性和准确性。大数据具有数据量大、数据繁杂的特点。在利用大数据开展分析时,要求能够有对数据进行深度挖掘、分析预测的技术,以及对需求进行梳理并建立模型解决问题的能力,从而为海关提供有效的决策参考。近年来迅猛发展的人工智能方法,如机器学习、云计算和数据挖掘等新型智慧技术已逐渐成熟,可对海量的数据实现实时动态、高速便捷和人工智能化的处理分析,在国门生物安全风险预警方面有巨大的应用价值。然而,海关在生物安全风险预警工作中使用的技术仍较为落后,主要通过建立风险评估预警数学模型判定风险级别,或者依靠专家的经验判断,机器学习、人工智能和云计算等新技术的应用较少,导致已有数据资源的使用效率不高,有效信息的挖掘能力不足。
生物安全风险监测预警工作具有极强的专业性和技术性,高水平、专业化、复合型人才队伍是全面加强海关大数据研究与应用的根本保障。目前,海关专业人才的质和量均明显不足,从事人工智能、机器学习和云计算等与大数据紧密相关领域的人才存在缺口,精通海关业务与大数据技术的复合型人才更是十分匮乏,严重制约了大数据的应用,无法满足新形势下国门生物安全风险防控工作的需求。构建海关大数据应用支撑体系,不仅需要人才和技术作为支撑,还需要法律法规和规章制度作为保障。目前,海关在生物安全大数据资源采集、质量控制、安全存储和开放共享等方面的政策法规尚不健全,与其他政府部门之间数据流通和共享的机制壁垒尚未打通。因此,亟需构建和完善海关数据基础制度,促进数据合规、高效的流通与使用。
当前,生物安全相关数据资源日益丰富,并且数据采集、挖掘和分析等技术也在不断发展。然而,海关大数据的应用仍处于起步阶段,为弥补当前海关在大数据资源收集、挖掘和应用等方面存在的不足,满足国门生物安全风险早期预警和快速处置的需求,保障人民群众健康和经济稳定发展,需加强以下几方面工作。
大数据的利用必须打破部门、领域和地域等的壁垒,克服“信息孤岛”现象,实现不同来源数据真正意义上的交换和共享。海关需拓宽数据的来源渠道,通过加强与民航局、移民局、文旅局、外交部、工信部、公安部等部委以及国际组织机构的合作,利用区块链[8]、智能合约[9]、联邦学习[10]等技术,在保障数据安全和隐私的前提下,推动建立高效运行的数据共享机制和数据交换平台,促进数据流转,打通不同部门和系统之间的壁垒。通过高效整合多种传统数据和新型数据资源,实现对国门生物安全风险的多维度预警。
实现国门生物安全风险智慧化预警的关键环节是高效的预警模型和算法。高效的模型和算法可使得生物安全相关数据的处理、分析、预警等环节更加自动化和智能化。海关在国门生物安全风险预测预警工作中可结合时间模型、空间模型和时空模型等模型,充分融入机器学习和深度学习等人工智能算法技术,充分提取多源数据中的有效信息,改善数据低效、碎片化应用的局面,弥补传统监测数据中的观测偏差和漏报,避免传统模型参数不准确等问题,提升预警的准确性,实现预警智慧化。
海关需进一步强化在国门生物安全风险防控中广泛应用大数据技术的思维,以数据分析结果作为决策支撑。要加大对大数据方面人才培养、经费投入和推广应用等的支持与保障,分级分类建立一支涵盖大数据处理和分析、生物安全风险应急处置、实验室检测和流行病学调查等专业人员的队伍,充分发挥专业特色和优势。尤其需加大对应用型、复合型、创新型人才的培养力度。同时,需尽快完善海关大数据应用相关规章制度,破除数据共享和应用等各个层面的体制机制障碍,将大数据应用纳入法治轨道,夯实大数据应用基础。