李儒银,李 洋,罗志宏△
(1.重庆医科大学附属第一医院 400016;2.成都体育学院,成都 610041)
突发公共卫生事件是指突然发生,造成或可能造成社会公众健康严重损害的重大传染病疫情、群体性不明原因疾病、重大食物和职业中毒及其他严重影响公众健康的事件[1]。近年来,国内外突发公共卫生事件频发,如2003年的非典型肺炎、2009年的甲型流感、2014年西非的埃博拉病毒及2019年的新型冠状病毒肺炎(简称新冠肺炎),都给国家建设、人民利益、社会经济造成了巨大损失,甚至一度引发公众恐慌情绪。而历次突发公共卫生事件均会产生大量的疫情相关数据,要充分了解疫情数据信息,才能做到“心中有数,手中有策”[2]。所以,如何有效管控突发公共卫生事件中产生的数据,协调突发公共卫生事件数据的有效开放和利用,有利于各级政府部门对疫情整体发展情况做出客观判断,部署防控措施;有利于执行部门制订科学防控方案,把握重点工作方向;有利于卫生部门合理配置资源,提高工作效率;还有利于疫情防控的国际合作和民众安抚。
“关联数据(Linked Data)”的概念由TIM于2006年提出,是“互联网+”时代,进行大数据管理、发布和服务的核心技术之一。目前,关联数据已经在药物知识发现、智慧医疗建设、医学资源共享和医学信息学知识体系构建等领域有诸多应用实践[3]。为了充分发挥关联数据在突发公共卫生事件数据管控中的价值,笔者论述了关联数据应用于突发公共卫生事件数据开放平台的必要性和技术实现路径,并以新冠肺炎疫情数据为例,设计了基于关联数据的疫情数据开放平台。同时,也分析了平台建设过程中可能存在的一些问题。
利用关联数据技术,将公共卫生领域的结构化数据通过网络进行关联和共享,充分挖掘信息价值,实现信息高效利用、提升信息协同效率,能够给予数据更大的附加价值[4]。以新冠肺炎为例,笔者发现:有关新冠肺炎疫情的数据类型多样、渠道丰富,有政府部门官方网站的数据,有医药卫生行业的主流媒体数据,有社交网络的数据,有第三方支付平台的数据等。这些信息的全方位、深层次、多渠道传播,使公众对新冠肺炎有了全面的认识和了解,增强了民众的防护意识。但这些数据之间存在内容重复、真伪难辨等现象,且数据平台之间的数据缺乏统一标准、管理混乱、共享性差、内容深度挖掘不足等问题。
由此可见,突发公共卫生事件数据的管理中还存在诸多问题,不利于公共卫生部门做出科学决策,也增加了疫情管控、医疗资源协调的难度,使得许多具体工作难以有效落实和开展;同时,突发公共卫生事件数据的不规范发布还容易引发大众的信息焦虑和心理恐慌。所以,建立行之有效的突发公共卫生事件数据开放平台势在必行。
将关联数据技术嵌入到突发公共卫生事件数据开放平台建设中,由公共卫生部门进行统一规划、统一建设、统一协调、统一管理,能够有效推动公共卫生突发事件数据管理。
突发公共卫生事件具有生命周期,其演变阶段可分为疫情潜伏期、疫情暴发期和疫情恢复期[5],在疫情发展的不同阶段,数据信息存在较为明显的差异,但也会有交叉重复。疫情潜伏期的数据包含疫情监测监控、趋势预测、风险评估、防护指南、舆情防控等;疫情暴发期的数据包括病毒检测、疫苗研制、医疗救助、物资调用、人员流动、患者上报、虚假谣言等;疫情恢复期的数据包括整理疫情起因、爆发过程、损失评估、事后分析等。根据疫情发展的不同阶段,研究者构建了突发公共卫生事件数据整合框架,见图1。
图1 突发公共卫生事件数据整合框架
根据关联数据语义描述的步骤,笔者认为突发公共卫生事件疫情数据的语义描述步骤为,(1)疫情数据标识:采用统一格式进行标识,便于疫情数据的规范化处理和集中管理;(2)疫情数据集选择:参考MeSH主题词表、医学标准术语和通用语,或自定义新的术语为数据集命名;(3)疫情数据资源描述框架的描述:使用固定格式的计算机语言描述不同数据,创建访问入口,通过搜索引擎检索数据;(4)疫情数据链接:在规范化的数据描述之后,建立疫情数据的网络链接;(5)疫情数据语义发布:将不同来源、不同类型的疫情数据转换为关联数据类型,嵌入数据的版本号或标识符,进行数据发布;(6)疫情数据平台维护与运营:及时更新平台数据,关注疫情数据的维护和实时更新。
采用关联数据技术实现了后台数据的规范、统一管理,便于各类用户的访问、浏览与检索。针对用户的操作需求,选择专门的关联数据搜索引擎,或嵌入关联数据浏览器。同时,对疫情数据进行分类导航,根据疫情发展态势,适时更新不同阶段的数据类型。
新冠肺炎是新中国成立以来在我国发生的传播速度最快、感染范围最广、防控难度最大的一次重大突发公共卫生事件[6]。本平台依托关联数据技术,构建新冠肺炎数据开放平台框架[7],见图2。通过整合各种类型、不同来源的新冠肺炎疫情数据,进行统一标引,数据解析、提取与合并,利用资源描述框架机制进行描述,建立计算机可识别的链接和语言,在Web页面上发布数据,提供访问接口,嵌入用户导航界面,使用户通过互联网进行浏览和检索,促进新冠疫情数据互联互通和深度应用。
图2 新冠肺炎数据开放平台
数据标准化是实现数据开放共享的基础。突发公共卫生事件数据开放平台的建设会涉及不同类型、非结构化数据,如疫情监测数据、病毒检测工具、疫苗研制信息、物资调用信息、防护指南信息、患者就诊信息等,以及各种医学专业术语等。所以,面对庞杂的突发公共卫生事件数据,需要全面收集、分类、整理和组织,制订科学的数据规范标准,实现语义上的互操作。
突发公共卫生事件数据的收集过程中,通常会涉及患者隐私信息,如个人背景信息、健康状况、病历信息等,一旦被泄露,会对患者的日常生活带来很大困扰。所以,数据开放的过程中,需要设定专门的隐私保护屏蔽技术,保障患者隐私权。此外,需要把握病毒检测和疫苗研发中科学数据开放与保护的平衡点,同时对涉及的临床试验、科研伦理问题,成立专门的伦理评估系统和审查机制,保证科学研究顺利开展[8]。
明确数据权利,保护数据主体、数据生产者、数据控制者和参与者、数据客体的利益平衡,才能促进数据的合理开发和使用。突发公共卫生事件中产生的数据,按照来源可分为个人数据、商业数据、政府数据、医疗机构数据,这些数据由哪个部门主张收集、如何兼顾公共利益和个人信息保护,以及所收集到数据的权利界定与归属问题均关系到数据的合法利用。所以,有必要主张数据权利,采取技术措施降低风险,避免因个人信息泄露、滥用而引发人身损害、财产损失,甚至是公众恐慌和政府信任减损[9]。
数据开放在突发公共卫生事件数据监测、分析和利用等方面起到了积极作用,如欧盟创建的新冠肺炎数据共享平台。但科学界定数据开放范围、审批数据开放对象,需要成立专门的审查机构进行严密审核,依法确定完全公开、适度公开、申请公开、保密等权限;申请者依托机构认证,签署保密协议和合理使用协议等证书。同时,还需要关注数据保护问题,必要的时候限定数据分析的用途。
由于突发公共卫生事件具有不确定性、群发性、演变复杂性、高危害性等特点,需要快速、准确地获取并有效地收集、利用相关数据,以提高应急响应的科学性和效率,降低疫情带来的危害和负面影响。本研究基于关联数据技术,提出突发公共卫生事件数据开放平台的建设方案,展现了数据开放平台在疫情防控工作中的广阔应用前景。未来研究可以依托数据开放平台,针对疫情防控中产生的科学知识、科研成果、政府决策、医疗救治等数据信息,形成专题资源数据库,强化突发公共卫生事件大数据分析和智库建设。