文 | 广州医科大学信息中心 黄劲荣
患者主索引(Enterprise Master Patient Index,EMPI)是指在特定区域范围内,用以标识每个患者实体并保持其唯一性的编码。使用EMPI可将来自多个系统的患者标识进行关联,实现同一患者多业务的关联和患者信息的统一或关联,能有效解决多系统中识别患者身份的问题,是医疗大数据可以共享的基础。2020年7月,有关部门发布《关于印发医院信息互联互通标准化成熟度测评方案(2020年版)的通知》确定医院信息互联互通测评7个等级,2021年12月,《“十四五”国家信息化规划》中明确加快推动各级医疗卫生机构信息系统数据共享及业务协同,建设互通互联的各级全民健康信息平台。患者身份识别是互联互通产生价值必须要解决的问题,尤其是同一个患者在不同医疗机构、不同医疗信息系统里的标识如何关联的问题,更是进行现代医疗大数据治理的基础性工作。只有通过正确的身份识别,才有可能保证患者在不同场所、不同时间就医信息的连续性和完整性,从而形成全面的患者信息数据。
通过构建患者主索引(EMPI)来识别、匹配、合并、取消重复的数据,净化病人记录,利用主索引可获得完整而单一的病人视图。EMPI为每个患者创建一个唯一标识符,作为各业务系统进行信息传递时的标志;与相关系统的医疗记录的标识之间建立映射,以确保同一患者分散在不同系统中的医疗信息可以完整和准确地关联、整合在一起。EMPI构建成功的关键是“匹配引擎”。匹配引擎可以是确定的或基于概率的,匹配引擎必须是可以配置和调整的,匹配引擎的准确性和性能是决定EMPI解决方案价值的关键因素。匹配引擎配置的属性应遵循国家卫计委2009年《电子病历基本架构与数据标准》的规定,包括该标准的H.02服务对象标识、H.03人口学、H.04联系人、H.05地址、H.06通信等数据组成,具体包括姓名、性别、出生日期、证件类型、证件号码、联系电话、联系人、通信地址等。本文构建的EMPI匹配引擎是将基于确定性匹配和基于概率性匹配相结合的方案,具体流程如图1所示。
图1 EMPI匹配引擎主要流程
交叉索引表是记录匹配前初始化EMPI和最终生成EMPI的关系映射表,含有匹配的过程数据,可用于实际匹配过程和后续的匹配结果质控。
组合匹配是以患者任意的基本信息项进行组合后匹配,属于确定性匹配,如证件类型和证件号码形成一个组合进行匹配,不同组合可以按照设定优先级,优先级高的完全匹配后,后续组合不再匹配,自动终止。组合匹配通常由身份辨识度高的患者基本信息项构成,匹配的准确率接近100%,如姓名、出生日期和联系方式组合,社保卡号组合等。
通过给患者不同的基本信息项进行权重设置和加权结果阈值设定,在实际匹配过程中,每一项基本信息可以选择模糊匹配或者完全匹配获得对应的权重得分,并根据权重得分的加权结果与预设定阈值的关系,决定匹配的结果,通常有三种结果,即匹配上进行合并处理,匹配不上进行拆分处理,匹配疑似同一患者进行人工判断处理,权重匹配属于基于概率的匹配,阈值设定需要综合考虑匹配的效率和匹配的质量。
根据以上EMPI构建方法,进行系统架构设计如图2所示。
图2 EMPI系统架构图
系统主要包括以下模块:
EMPI集成服务:业务系统通过接口调用,进行EMPI生成。
EMPI数据存储:将EMPI映射的各类数据进行集中存储和记录。
EMPI数据质控:以EMPI为监测主线,将EMPI疑似患者数据进行人工处理,与此同时,对按照匹配规则进行自动合并或者拆分的患者EMPI进行随机抽样核查,以动态调整匹配模式和匹配规则。
EMPI数据应用:根据EMPI数据存储中的交叉映射表对医疗大数据平台中的所有患者数据进行身份识别和处理,形成独立的患者全病程的视图,为临床应用和科学研究提供完整的数据支撑。
系统主要功能包括EMPI查询、疑似待处理、历史记录查询、组合配置管理和权重配置管理。
EMPI查询功能:根据检索条件查询生成EMPI的患者明细数据,并支持不同患者数据的对比分析,一旦发现EMPI生成错误,还可以执行合并或者拆分操作。
疑似待处理功能:将权重匹配过程中满足疑似同一身份患者阈值范围要求的患者通过人工判断后执行合并或者拆分操作。
历史记录查询:用于查询所有生成EMPI的过程记录,便于追溯和审计核查。
组合配置管理:用于配置患者不同属性组合并进行优先级排序。
权重配置管理:用于配置患者不同属性的权重并进行阈值设定。
构建EMPI是医疗信息系统互联互通产生价值的前提条件,通过EMPI实现患者不同时空下数据的关联,才能释放数据的价值。EMPI主要应用场景如下:
在构建院级数据集成平台过程中,通过EMPI的构建,实现院内不同业务系统的患者数据的关联,完成对患者在不同时间和不同系统产生的诊疗数据的整合,为患者诊疗和医生的临床科研提供高价值和便捷的数据支持。
在构建区域患者健康信息档案的过程,通过EMPI的构建,实现患者在不同医疗机构的诊疗数据的关联,完成患者健康信息档案的建设,一方面便于患者对于个人健康的管理,另一方面,也有利于医疗结构对患者的病情诊治。
在构建国家级、省级、市级、区域级专科数据中心过程中,通过构建不同专科患者的EMPI,将指定区域的患者的所有诊疗数据进行整合,能有效扩展患者的数据样本维度,能极大提升科研效率的同时,增强科研数据分析的广度及深度。
本文以国内某高校的智慧医疗平台建设为例,该平台旨在实现大学的6家附属医院数据的互联互通,形成校级3大数据中心——临床数据中心、科研数据中心和运营数据中心。将本文的EMPI构建方法和系统设计应用于智慧医疗平台建设中,截至2023年6月底,累计识别出患者实体数约1064万人,完成合并患者实体数约658万人,去重率61.84%,通过抽查EMPI的合并结果,合并准确率达到98.63%.
本文从实际问题出发,提出了一种患者主索引(EMPI)的构建方法,并通过系统架构设计和功能设计在国内某高校的智慧医疗平台上进行验证,取得了良好的验证效果,并对EMPI的应用前景进行分析总结。相信在数据已经成为生产要素的时代大背景下,医疗数据互联互通是大势所趋,EMPI的构建对于数据价值的持续释放是不可或缺的,一定会得到更加广泛的应用。