韩行国,田 野,柯 鑫
(1.湖北省公安厅科技信息处,湖北 武汉 430000;2.湖北省楚天云有限公司,湖北 武汉 430076)
新型冠状病毒感染疫情已经回归到常态化的管理中,但是这场针对疫情防控的“战争”并没有结束。为了内防反弹、外控输入,同时也能够发挥信息时代大数据技术的作用,需要构建关于涉疫人员的专题数据库,助力疫情防控[1]。
在疫情防控的过程中,会出现很多种类繁杂的数据。除了确诊人员的重要信息,更要密切关注密接和时空关联人员的各种信息,以及日常健康上报、复工复产的数据等。此外针对医护资源相关医护数据、医疗设备等数据也需要统一规整起来。从各地调配的防疫物资不仅要检验质量也要根据之前的人员数据进行分配,根据需求变化进预测及采购等。而各种民生物资的价格调控、供应数据也都需要采集入库,以预备疫情出现时,确保百姓的基本生活可以有所保障。
湖北省人口规模大、流动人口比例也大,为了实现对疫情的有效防控,有序开展复工复产,数字政府的建设工作尤为重要。大数据技术的作用正是在这些海量的数据中剥丝抽茧,发掘有用的信息,是疫情数据的分析利用的重要工具。
首先,通过对重要的“5 类人员”(确诊、临床、疑似、发热、密接人员)数据、健康上报数据、基层摸排数据等疫情防控数据进行深层次挖掘,找到重要线索,提供预警;其次,结合医护资源、物资分配、市场供应的数据,能够为政府部门提供决策支持。
下面针对涉疫人员的专题数据库框架设计与建设等方面,介绍基于大数据的涉疫人员专题库的关键构建技术。
重大疫情防控工作需要国家的统筹安排及省部级单位的配合和实施。疫情防控过程中涉及的机构复杂、领域广阔,产生的信息量巨大、信息内容丰富,仅依靠档案行政管理部门完成数据管理非常困难,需要建立防疫专题数据库协助行政部门进行信息管理。因此,基于数据库技术研究一套省域涉疫人员专题库,通过该数据库构建湖北省疫情防控管理平台,有助于加强省级政务平台的信息化建设[2]。
省域涉疫人员专题库是湖北省大数据能力平台的重要组成部分,目标是通过专题库建设一套基于涉疫人员信息分类的风险管控体系。
图1 为专题库的建设思路,专题库是疫情防控体系中的核心。省域涉疫人员专题库通过物理汇集当前的疫情防控数据、医护资源数据、物资分配数据、市场供应数据,结合省大数据能力平台人口、法人、医疗保障、市场监管等数据,构建疫情防控专题数据库,实现全省疫情数据归集共享,为省直相关部门和各市州防疫部门的疫情态势研判和防控部署提供数据支撑,为社会公众提供个人疫情数据查询服务[3]。
图1 专题库建设思路
省域涉疫人员专题库系统架构包括数据资源层、数据处理层、数据存储层和业务系统层。
1.2.1 数据资源层
数据资源层是专题库的数据来源,通过专用接口连接其他政务服务系统的数据。数据资源层可以汇聚多个来源的数据,能够实现数据全面动态整合、及时获取信息更新,数据资源包括政府官方网站数据、公安部门数据和企业上报的数据等信息。
1.2.2 数据处理层
数据处理层可以完成对数据的清洗、处理和转换,使得数据满足国务院发布的《疫情防控管理平台工程标准》和省疫情指挥部业务流程和信息共享的需要。通过数据处理建立关系数据库和非关系数据库。
1.2.3 数据存储层
数据存储层基于Hadoop 分布式文件系统构建,能够存储海量疫情数据。在数据存储层再实施相应的安全保障措施,保证数据隐私安全,并能够向上层业务系统提供安全、可靠的数据访问服务。
1.2.4 业务系统层
业务系统层通过统一的库表和接口对政府部门和社会群众提供数据查询服务,完成重点人群管理、风险对象智能识别等工作,支撑湖北省健康码平台稳定运行。
省域涉疫人员专题库对系统的性能和并发性有着很高的要求,不仅要满足日常的查询需求,还需要应对在专题库使用高峰时刻巨大的并发量。如果优化设计不当,可能会造成系统崩溃宕机等问题,造成不好的社会影响。因此,采取了以下优化方法提高专题库的系统响应速度和性能:①负载均衡技术。在楚天云服务平台上部署省域涉疫人员专题库,能够将请求分摊到多个操作单元上执行,可极大增加系统的吞吐量,同时避免了单点故障的问题。②缓存消息队列。为防止高峰期的访问量过高导致专题库崩溃,采用将信息先缓存到消息队列,再持久化到专题库中的方式,缓解数据上传和存储压力,保证数据完整性。③分表存储和查询。对专题库的数据表进行切分,减少单机数据库的负担,由多台数据库服务器一起分担查询请求,缩短查询时间。④关键字索引。通过关键字索引加快数据的检索速度,加速表与表之间的连接。通过使用索引,在查询的过程中使用优化隐藏器,在数据库内部完成数据处理和计算,提高系统的性能。⑤优化查询语句。对语句进行预编译,避免锁死和检索堆积的问题。一次编译、多次运行,省去了解析优化等过程。
专题数据库主要是通过建立疫情防控、医护资源、物资分配、市场供应4 大子库,为省疫情指挥部及各职能部门提供基础性、战略性的信息服务和决策支持。
省卫健委、经信、公安、交通运输、通信管理、电信运营商等责任主管部门根据实际情况制定数据标准并提供至大数据能力平台,原则上以格式化、可机读为标准,各级责任主管部门负责数据的准确性。卫健委确诊病例信息表(部分)如表1 所示。
对于这些物理汇集的各类疫情数据,基于省大数据能力平台,形成疫情防控、医护资源、物资分配、市场供应专题数据库,按照政务资源共享机制,为省直主管部门及各级防疫部门、社会公众提供数据支撑服务。
疫情防控专题数据库主要包括“5 类人员”数据、移动轨迹数据、舆情求助数据、涉疫高危数据、疫情变化数据、复工健康数据等,其中舆情求助数据是通过鄂汇办搜集的全省新型肺炎求助登记数据与居民健康上报数据,涉疫高危数据是抗疫志愿者、下沉基层公务员、近期在岗超市药店及外卖人员数据。主要来源于卫健委、公安、交通、运营商、防控指挥部等多部门。
医护资源相关数据主要来源于省卫健委,对采集入库的省卫建委业务信息进行质量稽核,使来源人员业务信息与人口基础信息对应,在此基础上进行多源校核、检查,实现医护资源数据的全链分析,构建“一数一源”。将发现的信息质量问题反馈给信息提供单位,由部门依据管理机制通过业务手段对信息进行更正后再通过数据采集、维护流程提交。
医护资源数据主要包括隔离收治数据、诊疗救助数据、医护(含各省援鄂)人员数据、医疗机构资源信息、医疗器材信息等。
针对各类疫情防控物资所建立的分配数据库,主要数据来源于省卫健委、发改、市场监督管理局等部门。对采集入库的省卫健委、发改、市场监督管理局等部门业务信息进行质量稽核,将发现的信息质量问题反馈给信息提供单位,由部门依据管理机制通过业务手段对信息进行更正后再通过数据采集、维护流程提交。
物资分配数据依托于疫情物资平台,主要包括各类疫情防控物资,特别是医疗防护物资(如口罩、防护服、护目镜、消毒液等)的储备信息、需求信息、调拨信息、现有产能、来源渠道等数据。
市场供应数据主要是当前各类民生物资(大米、食用油、猪肉、蔬菜等)的市场供应信息、物价水平、市场监管信息等,主要来源于商务厅及市场监管部门。对信息进行质量稽核,将发现的信息质量问题反馈给信息提供单位,由部门依据管理机制通过业务手段对信息进行更正后再通过数据采集、维护流程提交。
省直部门及各级防疫部门可以通过库表共享、接口调用的方式,直接申请厅局源数据,开展数据查询、数据校验和数据订阅服务,用以支撑疫情防控工作。
2.5.1.1 数据查询服务
各级防疫相关部门可申请厅局源数据开展数据查询,如利用公安户籍信息、卫健委“5 类人员”信息、基层排查信息等,快速查询人员基本信息,便于筛查工作开展;利用湖北省援鄂医护情况、湖北省医护人员情况,查询其他省份来支援湖北省疫情防控的人员信息,并及时同步给国家;利用医用防护物资需求清单、医用防护物资缺口清单、医疗物资汇总表,查询当前湖北省所有医院的医用防护物资库存,及时发现缺口,调配其他资源进行补充;利用蔬菜生产保供情况、生猪生产保供情况、家禽生产保供情况、水产生产保供情况和饲料生产保供情况,查询当前湖北省蔬菜、生猪等供应缺口,及时采取应急措施解决。
2.5.1.2 数据校验服务
各级防疫相关部门可利用厅局源数据对现有数据进行校验,如利用公安户籍数据、车辆登记数据等对基层摸排数据进行校验,提升数据精准度;利用省卫建委的医院数据等对基层摸排部分医疗资源统计表数据进行校验,提升数据精准度;利用省卫建委的医用防护物资数据等物资需求测算数据、疫情防控重点物资需求测算进行校验,提升数据精准度;利用商务厅及市场监管部门的各类民生物资数据等全省生活物资价格监测、各市州主要生活物资价格调控数据进行校验,提升数据精准度。
2.5.1.3 数据订阅服务
支持各级防疫部门订阅相关疫情数据,如国办密接人群信息、物资供应信息等数据,为疫情防控中的重点人员追踪、物资分配等提供数据支撑;湖北省救治场所床位情况等数据,可为疫情防控中的病人床位安排等提供数据支撑;医用防护物资分配清单(省本级及市州)等数据,可为疫情防控中的病人床位安排等提供数据支撑;全省生活物资库存(储备)销售情况、各市州生活物资库存(储备)销售情况等数据,可为疫情防控中的生活物资库存管理等提供数据支撑。
2.5.2 关联结果数据
基于疫情专题库可进行数据横向关联,关联结果数据发布后各部门按需申请,便于开展数据重点人员精准锁定、疫情形势研判、公众个人疫情查询。
2.5.2.1 密接人群关联
将卫健委的“5 类人员”名单与公安户籍数据进行横向关联,形成省内密接人群数据。各市州防疫部门可配合交通出行信息、运营商移动轨迹数据等,对重点人员进行精准追踪,对重点区域进行严格防控。
2.5.2.2 疫情风险研判
根据卫健委提供的“4 类人员”数据、隔离收治、诊疗救助等数据,完成疫情相关指标的统计分析,便于各级疫情防控部门对当前疫情形势、发展态势进行研判,调整防控决策。
2.5.2.3 公众疫情查询社会公众在鄂汇办上成功注册并完成实名认证后,可以通过鄂汇办集成的疫情查询页面,在线查询个人相关疫情数据,为社会公众提供便捷的查询服务。
基于省域涉疫人员专题库实现了湖北省健康码平台的运行和维护,湖北省健康码平台已运行了2 年多时间,做到了“从未宕机、永不崩溃”。选取某一日的健康码平台的运行维护情况进行系统测试。
系统运行正常,主要业务系统运行日志良好。湖北健康码小程序、省转码平台、疫情防控数据分析平台、疫情防控大数据平台、武汉战疫等主要业务系统日志运行良好。其中基于省域涉疫人员专题库实现湖北健康码总发码量达到6 400 万张,“武汉战疫”总发码量达到3 100 万张。在24 h 内,全省亮码次数达1 200余万次,亮码峰值时段为07:30—09:30;全省扫码次数超190 万次,最高峰值时段为07:40—10:10。
主要业务系统接口访问情况正常。湖北健康码小程序支付宝端亮码接口总请求数为1 231 余万次,平均每秒请求数为142.49 次,峰值每秒请求数为383.93 次;湖北健康码小程序支付宝端扫码接口总请求数为19余万次,每秒请求数为22.06 次,峰值每秒请求数为70.22 次。武汉战疫亮码接口总请求数为2 200 余万次,武汉战疫扫码接口总请求数为170 余万次。系统在运行高峰时段也能够在毫秒级实现响应,保障省内居民正常工作出行。
省域涉疫人员专题库服务器运行情况正常。湖北健康码政务云、公有云及专有云所有服务器均运行正常,武汉战疫所有服务器均运行正常。湖北健康码政务云部分共计使用66 台云服务器,CPU(Central Processing Unit)最大使用率为92.66%、平均使用率为2.29%,内存最大使用率为91.86%、平均使用率为26.18%;湖北健康码公有云及专有云部分共计使用90台云服务器,CPU 最大使用率为3.25%、平均使用率为1.22%,内存最大使用率为26.51%、平均使用率为23.67%。武汉战疫共计使用140 台云服务器,CPU 最大使用率为22%、平均使用率为7.5%,内存最大使用率82%、平均使用率57%。
湖北健康码政务云、公有云及专有云相关网络设备数据流量及性能监测正常,武汉战疫数据流量及性能监测正常。
2022 年1 月至今,楚天云网络层入侵检测/防护系统共为健康码系统云上业务进行入侵检测、防护376次。其中Web 入侵防护6 次,CC 安全防护8 次,扫描防护363 次。期间,楚天云主机防病毒软件未检测到健康码系统互联网应用或主机存在恶意病毒传播及感染的情况。
省域涉疫人员专题库作为湖北省大数据能力平台的重要组成部分,通过建立疫情防控、医护资源、物资分配、市场供应4 大子库,实现了对疫情数据的全方位汇集、分析和管理功能,能为湖北省疫情指挥部及各职能部门提供基础性、战略性的信息服务和决策支持。基于省域涉疫人员专题库开发的湖北省健康码平台,承受住了高并发量的访问考验,其健壮性和可靠性得到了实践验证,在疫情防控工作中发挥了重要作用。