孟郁洁 戚晓鹏 王松旺
(中国疾病预防控制中心 北京 102206)
急性发热性疾病(Acute Febrile Illness,AFI)可由多种病毒、细菌和寄生虫感染引起,是全球范围内造成发病和死亡的重要原因。寨卡、登革热和基孔肯雅热是导致急性发热性疾病最常见的病毒感染。急性发热性疾病常常会因缺乏适当的诊断检测而漏诊或误诊[1-3],因此探测急性发热性疾病的病因信息用于指导临床实践并制定适当的公共卫生干预策略势在必行[4]。中美两国公共卫生专家在云南和广东两省合作开展急性发热性疾病哨点监测项目,进行针对寨卡病毒和其他发热性疾病病原体感染的人群监测。
传统疾病监测工作采用人工方式发放登记表格、录入和统计登记数据,完成病例发现、样本收集与检测、信息录入和数据汇交的过程耗时长且工作量大,不利于病因数据的及时收集和统计。随着信息技术的飞速发展,利用互联网能够提高疾病监测工作效率,保证数据收集质量,已成为当前主流的数据收集方法[5-6]。为实现急性发热性疾病哨点监测工作的网络化,保证病例监测工作实时、准确和高效,有必要建立急性发热性疾病监测系统,解决信息在线收集的技术问题。但此次哨点监测项目仅需要一次性采集数据,如果由专业公司研发监测系统,利用率低且建设成本大。而利用现有的一些成熟免费软件如EpiData,则不能解决在线数据整合和用户权限控制的问题,对数据传输安全埋下潜在风险。流行病学动态数据采集平台(Epidemiological Dynamic Data Collection platform,EDDC)是由中国疾病预防控制中心自主研发的在线问卷定制平台,用于流行病学等调查业务的Web表单定制和数据字典管理等。支持大量用户授权管理、在线/离线数据采集、安全传输、流病组件融合以及问卷灵活定制与复杂质控,可应用于疾病现况调查、病例追踪调查、队列研究和疾病暴发等项目[7-9]。本研究利用中国疾病预防控制中心已有的EDDC平台和网络资源建立急性发热性疾病监测系统,实现急性发热性疾病病例的实时上报和在线监控,达到实时监测和保证数据质量的目的,同时提高急性发热性疾病监测工作效率。
经过前期现场调研确定各级疾控机构和哨点医院开展急性发热性疾病监测的工作流程和业务对接方式。涉及用户包括国家级管理员、省级疾控机构、市级疾控机构、县区级疾控机构和哨点医院5个级别。县区级疾控机构和哨点医院需要录入和管理病例报告表单相关数据;省市级疾控机构主要关注本辖区监测数据收集情况与需求,负责审核本辖区数据;国家级用户关注点在于对项目整体进度和方向的把握。根据业务流程将县级疾控机构和哨点医院的数据录入员分为3种角色:流行病学、临床和实验室检测信息录入。由于哨点医院的位置、规模以及实验室检测能力的差异,部分实验室检测在市级疾控机构或其他机构完成,故同级别不同用户的问卷录入和可见内容不一致,对监测系统提出更灵活的用户授权需求,满足不同机构和用户对数据质量和业务流程与协调的需要。
本次现场调查采用病例对照的研究方法,研究对象为符合发热性疾病病例定义的住院和门诊患者以及健康人群对照,不同组别有不同的数据采集内容及问卷逻辑跳转路径。调查表涉及必填项、跳转、自动计算和逻辑校验等需求,在线信息收集系统需要采取严格的质量控制以满足调查表复杂的逻辑需求,实现高水平的数据质量和逻辑核查功能。
为快速获取数据分析结果,便于各级用户把握监测项目进度和方向,本系统需要在收集大量数据资料的基础上通过统计图表或地图的方式实时展示数据在不同地区分布情况。采用饼图、柱状图、折线图和地图等方式直观地呈现数据分析结果,实时向用户反馈监测项目进展和数据分布,促进数据的充分利用。
急性发热性疾病监测内容涉及大量的实验室检测数据,种类繁多,覆盖最常见的可导致发热性疾病的病毒、细菌和寄生虫数据信息,多为设备自动导出,数据量大。如果由工作人员手动录入实验室检测数据,工作量大且出错率高。因此监测系统应提供数据导入功能,支持实验室检测数据批量导入。
当患者来哨点医院就医,工作人员进行病例筛查,对符合常见发热性疾病病例定义的2~65岁(含)的患者征得知情同意,录入人口学、流行病学和临床信息。对采集病例标本进行实验室检测,将结果与流行病学数据进行关联。由市级疾控机构对病例信息进行审核,通过审核后进入汇总阶段,产生统计报表,若审核未通过则数据退回县级疾控机构或哨点医院,修改无误后再进行审核,直至通过后进行数据汇总并产生统计报表。具体业务流程,见图1。国家级项目管理员定期对监测项目进行现场考察,监督项目进展和数据质量。
图1 急性发热性疾病监测业务流程
采用浏览器/服务器(Browser/Server,B/S)设计模式,编程语言为Java,服务器端包括MySQL数据库、Web应用服务器Tomcat和EDDC平台。客户端通过Web浏览器和离线客户端访问。系统实现环境,见图2。
图2 实现环境
图3 系统功能模块
3.3.1 系统登录 通过Web浏览器访问系统网址即可打开登录界面,用户通过用户名和密码登录该系统。
3.3.2 数据采集 是系统核心功能。利用EDDC平台进行在线问卷设计,包括问卷布局、样式和质控。通过控件的应用、控件属性的设置、逻辑校验代码的编写和人工2级审核的设置等满足在线报告表的样式和质控需求。如根据哨点医院名称自动生成研究对象编码的前4位字母,后3位流水号则手动录入;根据系统用户权限不同显示嵌套问卷的不同部分;根据性别和年龄段等不同选项跳转至不同题目,被跳过的题目自动隐藏或灰显。系统对姓名和地址等敏感信息采取加密方式,由管理员设置加密字段的可见用户范围,原则上只有数据录入者可以查看加密字段的原始数据。支持数据在线和离线采集,数据采集员在网络联通的情况下可通过用户名和密码登录系统进行数据录入;也可提前在电脑、安卓智能手机或平板电脑上安装离线客户端软件,在离线状态下进行数据的录入和汇交。问卷填写完成后单击“保存”按钮进行数据提交,必须满足所有校验条件,如果问卷有漏填或错填则不能被保存。如数据录入不完整可点击“暂存”按钮临时保存数据,录入完成后再点击“保存”按钮完成数据提交。提交成功后可在浏览界面查看录入情况。浏览界面分为查询条件区和数据列表区,数据查询支持输入特殊字符以达到模糊匹配的效果,其中“*”表示匹配任意长度的任意字符,“?”表示匹配一个任意字符。数据的查看、查询、修改、删除、打印和审核等操作均在浏览界面完成。市级用户负责本辖区病例报告的审核,数据内容合格点击“审核”,该条数据进入“已审核”状态。数据采集完成后可导出数据压缩包,解压后为CSV格式文件,可利用专业统计软件进行分析。导出内容包括每条数据的录入信息、用户及操作信息和字典码表。支持将数据导出为XML格式进行数据交换,其他系统可通过调用服务的方式来获取采集的数据,保证数据通用性和系统可集成性。导入功能仅提供给实验室检测信息录入员使用,从而减少录入员工作量。由于实验室检测信息为设备批量自动化产出数据,系统提供数据导入功能,导入终端的CSV文件或其ZIP格式压缩包,通过调查表唯一性字段的编号(即研究对象编码等)与病例数据进行匹配关联。
3.3.3 用户管理 根据急性发热性疾病监测工作业务流程和特点,分为“国家-省-地市-县区-医院”5级用户分级管理。EDDC平台内置传染病网络直报系统的地区和机构编码,支持自定义地区分级架构,具有用户权限集中管理和分级授权管理功能。根据用户的地区级别,监测系统将其分为国家级、省市级、县区级和医院用户。国家级用户负责管理整个监测项目,实时监控和监督项目进度和数据质量。省市级用户负责本辖区范围内数据的收集和审核。县区级和医院用户负责收集和上报数据。根据用户类型分为数据管理员、分析员、审核员和录入员。根据数据录入内容不同,数据录入员分为流行病学、临床和实验室检测信息录入员。管理员负责创建用户和审核注册用户,设置不同用户组,为各类用户分配不同权限。为保证用户的独立性和数据安全,系统为每个用户分配独立用户名和密码,用户所在机构和地区与病例报告表中的哨点医院名称及所在地区关联,每个用户仅能看到本单位或本辖区范围内的数据。如市级用户可实时查看本市范围内所有哨点医院数据,而每家医院只能查看、修改和下载本医院收集的数据。为满足不同用户的权限需求,系统提供灵活的权限分配功能。如果实验室检测工作由市级疾控机构完成则将实验室检测信息录入权限授权给市级疾控机构。
3.3.4 数据可视化 数据管理员和分析员需要实时监控数据的上报进度和概况,系统提供统计图表定制和查看功能,支持对报告表中任意字段建立统计图表,可在系统首页和统计分析菜单查看这些图表。首页以仪表盘图表形式展现所有数据采集情况。数据管理员可通过仪表盘图表的展示情况对数据上报进度和概况进行监控,把握项目进度,随时调整项目进展方向。统计分析菜单展示用户权限范围内的数据采集情况,有助于各级用户及时了解本辖区范围内数据的采集进度。各级用户也可根据自身需求定制统计图表,实时查看重点关注信息的收集情况。统计图表类型分为折线图、柱状图、饼图、统计表和地图等,通过约束条件过滤后形成可视化汇总数据。本系统中定制部分报表,提供按地区/机构、医院、月、周、年龄、性别、国籍、病种的报告情况,以及病例-对照的分布情况。
病例报告表包含病例纳入日期、所在地区、哨点机构名称、研究对象编号、职业、疫苗接种、发热日期、临床诊断结果、实验室检测结果值等字段。患者报告表包含日期、符合病例数、分年龄组病例数、分性别病例数、同意参与项目的病例数等字段。统计报表包含图表名称、类型、数值列名、计算方法、分组列名等字段。其他数据库表还有表单管理表、用户权限管理表、用户表。
急性发热性疾病监测系统于2017年6月正式上线运行,应用于5个哨点医院的急性发热性疾病病例报告。2017年6月-2018年12月共收集768条病例数据,其中包含登革热暴发有关病例。系统应用效果如下:一是降低开发成本。在系统定制过程中应用已有的EDDC平台和免费软件,避免采购第3方软件的费用和负担。同时系统的问卷定制、用户授权和运维均脱离信息技术公司,由卫生业务人员基于网页独立操作和自行定制,降低运维成本的同时增加系统应用的灵活性。二是严格控制数据质量。以数据质量为出发点,更专注数据的便捷、高效、高质采集。鉴于急性发热性疾病病例报告表的复杂性,通过对在线问卷定制过程中控件的选择、设置和逻辑校验脚本的编写以及人工2级审核,杜绝录入信息的缺失和逻辑错误,保证准确性和完整性。三是实现数据可视化。系统仪表盘实时展现数据监测情况并反馈数据统计结果,有助于项目人员和各类用户及时关注项目进展并聚焦数据情况。四是提高工作效率。本系统大量采用选择和数字录入,支持在线和离线两种方式填写,直报方式简化监测流程,且提供批量导入功能,减少录入时间的同时降低数据手动录入的错误率,减轻业务人员工作量。五是促进数据标准化和数据共享。利用EDDC平台内置的各类卫生、行政区划等标准数据字典,根据表单内容创建自定义的数据编码表,除文本录入以外的数据均以编码形式存储,促进各类标准化字典的使用,也为后期各类调查项目间的数据共享和整合提供基础。六是提供分层用户管理和安全保障。简化监测业务复杂流程,满足各级用户的所有需求,建立具有数据动态采集与管理、数据字典维护、用户授权管理和可视化的监测平台,最终使数据利用人员、审核人员和采集人员及其他各级参与用户受益。本监测系统可以根据用户的地区和机构编码进行批量创建用户和授权,支持用户分级授权。通过对敏感字段的保密设置和用户的安全管理实现系统的安全保障。
新发传染病的预防、检测和快速响应是全球卫生安全议程(Global Health Security Agenda,GHSA)的重要目标。为响应这一目标,基于EDDC平台完成急性发热性疾病病例报告表的在线问卷设计、发布、质控和动态采集与管理,建立急性发热性疾病监测系统,监测云南和广东两省5个哨点医院发热性疾病病例。借助信息化手段完全实现急性发热性疾病的实时监测和可视化展示,以直报模式代替以往逐级汇总上报模式,优化疾病监测的工作模式,减轻现场工作人员的工作量,提高监测工作效率和数据质量。在下一阶段的系统开发中将加强在移动设备中的统计分析和地图展示功能,为各级用户提供更精确的数据分析结果。