范世平 朱飞奇 舒岚 廖茂成
基于EHR和SPEEDMINER数据挖掘的粤北地区脑卒中高危人群筛查平台的初步构建
范世平 朱飞奇 舒岚 廖茂成
采用EHR与SPEEDMINER数据挖掘技术,结合临床实践,初步建立以粤北人民医院为中心,辐射周边地区的脑卒中高危人群智能分布性筛查平台。通过对筛查结果的统计分析,实现对粤北地区脑卒中高危人群进行实时监控,为各级医疗服务机构对高危人群进行针对性健康教育等干预措施提供参考依据。
电子健康档案;数据挖掘;脑卒中筛查;高危人群
脑卒中是一种急性脑血管病,具有发病率高、致残率高和死亡率高的特点。我国居民第三次死因调查结果显示,脑血管病已成为国民第一位的死亡[1]。然而,我国目前脑卒中筛查与防控工作的开展,与现实存在较大的差距,主要表现在以下几个方面:一是未广泛开展高血压与血清同型半胱氨酸筛查;二是未重视颈动脉粥样硬化斑块和狭窄的筛查与规范化治疗;三是绝大部分医院重脑卒中的治疗,但轻预防;四是社区、农村人群脑卒中高发,但是该人群对脑卒中的筛查和预防极不关注;这些问题导致我国脑卒中发病率急剧增加。
脑卒中筛查与防治工程是我国一项重大的国民健康促进工程,是一项利国利民的德政工程。积极开展脑卒中筛查,可以做到防患于未然。脑卒中高危人群筛查和干预可提高国民防治知识知晓率、用药率、控制率,综合预防和联合干预高血压、高血糖、血脂异常、房颤及吸烟、饮酒等不健康生活方式,降低脑卒中发病率、复发率、致残率和死亡率[2-3],减轻百姓、社会及政府的经济负担。本平台以居民电子健康档案和数据挖掘为基础,提供粤北地区脑卒中高危人群的智能分布,实现对脑卒中高危人群的动态监控与干预。
粤北地区脑卒中高危人群初筛平台以粤北区域医疗信息网络服务平台为依托,通过接口获取区域平台数据,抽取整理后存入数据仓库的数据库。在初筛平台上制定脑卒中高危人群智能分布的分析模型,通过Speedminer数据挖掘工具的报表和图形功能来读取结果,为临床脑卒中防治与干预提供指引,进一步发挥粤北地区脑卒中筛查与防治基地的巨大作用。粤北地区脑卒中高危人群筛查平台的系统架构见图1。
图1 脑卒中初筛平台架构
1.1 脑卒中筛查数据采集 脑卒中风险筛查的基本数据是整个平台架构的基础,脑卒中风险筛查包括:(1)BP≥140/90 mm Hg,或未知;(2)心房颤动(房颤)和心瓣膜病(经区/县级以上医院明确诊断);(3)吸烟(吸烟的定义为每天吸烟至少1支,连续1年以上);(4)血脂异常,或未知;(5)糖尿病;(6)很少进行体育活动(根据2000 年国民体质监测方案,体育锻炼的定义是每周体育锻炼≥3次、每次坚持30分钟、持续时间超过1年);(7)明显超重或肥胖(BMI≥26.0 kg/m2);(8)有卒中家族史。对满足以上8个条件中任意3个或3个以上危险因素,或者既往有卒中/短暂性脑缺血发(transient ischemic attack,TIA)病史的患者,则判定为脑卒中高危人群;以上8个条件中低于3个危险因素,但患有慢性病(高血压、糖尿病、房颤或瓣膜性心脏病)之一者,定义为中危人群;以上8个条件中低于3个危险因素,并且无慢性病者为低危人群[4]。
在区域医疗平台内,通过每位患者唯一的身份标识——个人主索引MPI(Mask Patient Index)获取居民电子健康档案(PHR)、电子健康记录(EHR)和脑卒中筛查基本信息表,调取包括居民多次就诊的HIS(医院信息系统)、LIS(实验室信息管理系统)、PACS(医学影像存档通讯系统)、RIS(放射信息管理)、EMR(电子病历)等一系列数据与信息,存储到数据仓库的数据库,为脑卒中危险人群的判断提供临床依据。
1.2 脑卒中筛查数据分析评估 数据挖掘是一个从数据中提取模式的过程,是一个受多个学科影响的交叉领域,包括数据库系统、统计学、机器学习、可视化和信息科学等; 数据挖掘反复使用多种数据挖掘算法从观测数据中确定模式或合理模型,是一种决策支持过程。利用数据挖掘工具从数据仓库中的大量数据获取有效的、新颖的、潜在有用的、最终可理解的一个模式过程[5]。粤北地区脑卒中高危人群筛查平台通过Speedminer数据挖掘技术提供脑卒中筛查数据的统计、分析与评估[6]。在平台上建立脑卒中筛查主题,脑卒中危险人群的维度包括危险等级、性别、年龄、地区分布等,同时定义数据钻取的顺序,通过对数据库数据的切片、切块、钻取和旋转等各种分析、剖析,通过数据挖掘工具的报表和图形功能来读取结果,使用户能从多角度、多侧面地观察数据,展示脑卒中初步筛查的各项结果。脑卒中筛查平台流程图见图2。
图2 脑卒中初筛平台业务流程
1.3 脑卒中筛查平台统计分析实例 以下是利用脑卒中高危人群筛查平台,以粤北地区各县市2013年脑卒中筛查人员数据为基础,进行抽样统计分析。图3为韶关3市辖区、4县、1自治县、2县级市脑卒中筛查的低危、中危、高危、TIA、卒中患者分布情况。
图3 脑卒中危险人群地区分布
在脑卒中危险人群分布图的基础上进一步进行数据钻取。以韶关市武江区为例,从年龄、性别等维度对脑卒中危险人群进行数据挖掘与分析,如图4、5所示。通过图4与图5的统计分析,可以初步判断这一地区脑卒中高发人群集中在50~70岁之间,以男性居多。
图4 脑卒中危险人群年龄分布
图5 脑卒中危险人群性别分布
脑卒中筛查平台除按照地区、性别、年龄筛查外,还可按照危险因素进行筛查。仍以韶关市武江区为例,通过平台统计分析出脑卒中高危人群危险因素主要包括脑卒中、TIA、高血压、高血脂、卒中家族史等。如果把危险因素作为第一层,可进一步挖掘数据,统计分析各危险因素的年龄比例和性别比例。
我国每年用于治疗脑血管病的费用估计约120多亿元,再加上各种间接经济损失,每年因本病的总支出近200亿元。脑卒中已对国民的生命健康造成严重威胁,并将大幅度增加疾病负担。“2020健康中国”战略规划研究中考虑将“脑中风筛查与防控”列入重大专项。
基于EHR和SPEEDMINER数据挖掘的粤北地区脑卒中高危人群筛查平台以粤北区域医疗平台为基础,利用区域平台的个人健康档案、电子健康记录及脑卒中筛查基本信息表等获取人员就诊信息,以先进SPEEDMINER数据挖掘技术为工具,提供粤北地区脑卒中高危人群的智能分布,实现对脑卒中高危人群的动态监控与干预,以指导脑卒中健康教育及区域防治干预,从源头上促进国民健康工程的建设与发展,对于脑卒中筛查与防治工作具有重要意义。与此同时,以完善的信息系统和WLAN网络技术为依托,将现代信息技术与医学人文关怀融为一体,搭建以辐射农村县医院为重点的区域医疗信息网络服务系统平台,实现将分散在不同机构的健康数据整合为一个逻辑完整的信息整体,满足与其相关的各种机构和人员需要。该平台的目标是使医疗服务人员在任何时间、任何地点都能及时获取必要的信息,以支持高质量的医疗服务;使公共卫生工作者能全面掌控人群健康信息,做好疾病预防、控制和健康促进工作;使居民能掌握和获取自己完整的健康资料,参与健康管理,享受持续、跨地区、跨机构的医疗卫生服务。
当然此平台在统计分析方面不够完善,分析因素比较单一,需要在以后的应用过程中不断总结、探索与完善。
[1] 陈竺.全国第三次死因回顾抽样调查报告[R].北京:中国协和医科大学出版社,2008:14-17.
[2] 刘凤群.脑卒中患者的健康指导与保健[J].中华现代护理学杂志,2006,3(3):260-261.
[3] 赵亚飞,杜雪平,董建琴.脑卒中社区防治的现状及存在的问题[J].中国全科医学,2010,13(14):1493-1495.
[4] 张振汉.北京市朝阳区八里庄地区40岁以上人群脑卒中危险因素现状调查[J].中华脑血管病杂志(电子版),2010,7(6):322-329.
[5] 用户指南V 1.0中文版[M/OL].[2011-10-20].http://ishare.iask. sina.com.cn/f/8971898.html.
[6] 时松和,施学忠,杨永利,等.基于数据挖掘的艾滋病综合防治居民健康档案管理信息系统设计与实现[J].现代预防医学,2013,40(16): 2953-2957.
Applying the technology of EHR and SPEEDMINER data mining, combining clinical practices, the project preliminary builds a high-risk population stroke screening platform centered on YueBei People’s Hospital covering the surrounding areas.explore the establishment of stroke screening platform of YueBei region based on electronic health records and data mining. The project integrates with magnanimity information resources which aimed at building the platform of YueBei region. By the statistical analysis of screening results, it realizes real-time monitoring of YueBei region high-risk population, which helps to make health guidance and interventions for all medical service institution.
Electronic health records;Data mining;Stroke screening;High-risk groups
10.3969/j.issn.1009-4393.2016.2.104
2012年韶关市科技计划(医学类)项目(2012 CX-K 86)
广东 512026 汕头大学医学院附属粤北人民医院办公室 (范世平 舒岚 廖茂成) 汕头大学医学院附属粤北人民医院神经内科 (朱飞奇)
范世平 E-mail:82959680@qq.com