高血压早期预警和健康管理平台的构建

2014-02-16 01:19桂小柯张丽杰陈禹保周家蓬王丽娟刘洁琳温绍君刘
中国卫生标准管理 2014年21期
关键词:预警高血压用户

桂小柯张丽杰陈禹保 周家蓬▲ 王丽娟刘洁琳温绍君刘 康

1 北京市计算中心,北京 100094;2 首都医科大学附属北京安贞医院,北京 100029;3 北京中医药大学东方学院,河北 廊坊 065001▲通讯作者:周家蓬 Email:zhoujp@bcc.ac.cn

基金项目:北科院海外人才项目(OTP-2011-011,OTP-2012-011),北自然重大项目(7120001),北京市计算中心萌芽计划项目

论著

高血压早期预警和健康管理平台的构建

桂小柯1张丽杰1陈禹保1周家蓬1▲王丽娟2刘洁琳2温绍君2刘 康3

1 北京市计算中心,北京 100094;2 首都医科大学附属北京安贞医院,北京 100029;3 北京中医药大学东方学院,河北 廊坊 065001▲通讯作者:周家蓬 Email:zhoujp@bcc.ac.cn

基金项目:北科院海外人才项目(OTP-2011-011,OTP-2012-011),北自然重大项目(7120001),北京市计算中心萌芽计划项目

为了控制和降低高血压的病死率、致残率,提高患者知晓率、治疗率,减轻高血压以及其他慢性疾病对个人和社会造成的负担,我们开发了高血压早期预警和健康管理平台。该平台基于云计算和大数据挖掘技术,包括数据收集与档案的建立、风险评估与重点人群分类、健康指导、效果评价等四个部分,平台界面简洁、使用简便,可面向普通个人用户,也可本地化到社区使用。

高血压;健康管理;早期预警

高血压是中风、心肌梗塞、心衰及外周动脉疾病的一个主要危险因素。随着我国国民经济的快速发展,人民生活水平的日益提高,生活节奏的加快,工作压力的增大,肥胖、吸烟、缺少运动、摄盐量过多等危险因素的增多,高血压患病率有升高的趋势,因此提高患者的知晓率、治疗率,构建高血压早期预警系统具有重要的现实意义。

与高血压早期预警类似,健康管理是在更大范围内对一般性人群的健康风险因素进行全面管理的过程,其宗旨是调动个人及集体的积极性,有效利用有限资源来达到最佳的健康效果,充分体现未病先防的健康理念。

1 总体设计思想

收集已有的高血压的病例对照数据,利用数据挖掘的方法,构建出高血压早期预警的模型,然后将此模型应用到平台新的数据上进行高血压早期预警。健康管理平台通过多种途径收集数据,如图1所示,把不同医院体检单位和终端采集仪器获得的健康数据,进行统一标准、统一格式,存放到北京市计算中心的数据库内。为每个用户创建健康档案,并对用户的历史数据进行可视化展示,同时结合用户的健康指标信息和预警模型,对用户的健康风险作出评估,并提出改善的指导建议。此平台基于web以B/S结构的网络形式提供服务。

图1 业务系统流程

2 高血压早期预警模型的构建

2.1 基于常规体检数据的模型

参考已有的研究[1],与北京市安贞医院合作,获取1048例常规体检数据,其中病例高血压773例,正常对照275例,年龄介于16~86岁之间。数据涵盖了性别,年龄,家族史数字,血脂异常,吸烟数字,饮酒数字,收缩压,舒张压,高盐饮食,BMI,心率,ALT,BUN,CRE,UA,CHO,LDL,HDL等生理生化指标信息。采用多元线性回归的方法,分别以收缩压和舒张压作为依变量进行回归分析,多元线性回归结果显示性别、年龄、吸烟、饮酒、BMI、心率、CRE以及UA对血压值存在显著影响(P<0.05)。由于医院和体检中心常采用是否患高血压来记录病人档案,同时为了避免健康管理用户血压值测量不准确引进误差,因此本研究将血压值转化为是否患病的离散变量,对其进行logistic回归分析[2],构建出在不同风险因素下高血压患病风险的模型。

2.2 基于基因数据的模型

根据各年龄段血压的正常值[3],基因对血压值的影响[4],生活习惯、环境因素等对血压的影响模拟了16847例样本数据,样本数据考虑了基因、年龄、性别、体质指数、摄盐量、摄油量、抽烟、饮酒、孤独感、压力等十个风险因素,我们对该数据集进行风险因素相关性分析,并使用最小近邻法(KNN)对各种风险因素缺失的情况下预测准确性进行评估,发现基因信息是模型准确预测的关键,见表1。

表1 风险因素和预测效果

由表1不难发现,作为内在遗传因素的基因所扮演的角色似乎是无可替代的,而其他若干外界环境因素的缺失对整体预测效果影响并不大,这是由于外界因素彼此间的相关度较高(彼此可以弥补缺失信息)。除了KNN法,另外三种常用的机器学习方法也在本研究中加以运用:人工神经网络(ANN)、支持向量机(SVM)和随机森林(Random forest),预测效果基本一致。

3 健康管理平台构建

3.1 数据采集和存储模块

健康数据的采集主要通过以下三种方式:(1)用户在网站个人中心页面上填写健康信息并提交;(2)上传电子病历或者体检报告;(3)自动采集,通过特定的便携式终端采集系统自动上传。便携式终端自动采集系统包括电子血压血糖仪、心电检测仪等,用户建档以后,可以通过刷身份证实现快捷登录,能够实时上传健康数据,并对数据进行实时展示。

存储方面,使用开源的MySQL作为数据库管理系统,一个表存放一类健康数据,以用户为中心建立多表之间的一一对应关系,确保数据的正确性和完整性。对于不同类型的用户设置不同的权限级别,防止对数据的非法操作。通过搭建高可用性的MySQL集群,根据负载在不同数据库节点间分担访问压力,保证服务的高可用性。

3.2 健康风险分析模块

健康风险分析模块主要针对不同人群和个体:(1)根据年龄、性别以及健康状态等特点对人群进行分类。我们将人群分为18岁以下、18~30岁、30~40岁、40~50岁等亚组,并根据对方多项健康指标划归为健康组、亚健康组、低危组、高危组等。通过组内及组间健康状态及风险因素的综合比较,筛选出显著发病风险因素。(2)由于个体存在遗传上的差异,通过群体水平的数据构建出的健康模型,应用到不同个体时会有偏差,因此平台可结合用户累积上传的数据(多个时间点)构建个体化预测模型,这体现了个体化医疗的思想。

3.3 健康指导模块

健康指导模块主要包括专家建议系统、个人健康实时管理等,具体形式包括手机短息通知本人或亲友,以及通过网络健康知识库等互动形式提高用户的积极性,使其主动了解和关注自己的健康状况。(1)通知本人:依据各种影响健康的因素如气温突变等,系统适时通过短信或者电邮等方式,提醒客户注意健康保健和及时体检,以达到随时随地为客户健康服务的目的;(2)亲友提醒:提醒对象除了用户本人以外,还可以绑定到亲友家人的手机或者电邮;(3)健康知识库:整合完备的健康信息知识库,让用户主动去了解健康相关知识,自主地关注自己的健康。

3.4 健康管理效果评价模块

本模块的功能旨在帮助长期使用本平台的客户对个人的健康管理效果进行科学公正的评估,并及时有效地改善原分析模型,以使结果更加精准。本模块核心算法采用一系列机器学习的方法,包括KNN、ANN、SVM、随机森林等,旨在实现真正的个体化预测。

4 平台系统设计

本平台发布系统采用LAMP技术开发[5]。采用Linux系统环境,以Apache组件作为网络服务器软件,使用PHP编写动态网页,用MySQL作为服务器端数据库开发环境,采用B/S服务模式,通过域名(http://he.biocloud.org.cn)为互联网为用户提供一种直观高效,简单易用的图形界面。使用用户在任何一个地方通过能连接互联网的设备上的浏览器,就可以注册登录,进行健康管理。

由于利用一系列机器学习的数学模型进行健康风险评估需要大量的运算,因此本平台主要采用分布式计算框架对任务进行调度;同时也初步采用云计算技术中针对大数据、特别是非结构化大数据的Hadoop平台[6],结合Rhadoop等方法,将部分计算任务和结果存取任务分解到多台Hadoop计算节点上,确保及时响应大数据用户的查询请求。

5 讨论

据报道,80%的医疗支出用在了那些可以预防的疾病上。因此最根本的任务是防疾病于未然,将疾病消灭在萌芽状态,这就是健康风险评估的内容,包括了高血压等慢性疾病的预测。健康管理在西方发达国家已经有多年的实践[7],我国起步较晚,但现在也已经呈现蓬勃发展的态势,健康管理服务公司如雨后春笋般涌现,但绝大多数仅停留概念炒作,或者售卖检测设备的原始阶段,并没有真正将用户健康资源进行计划、组织、加工利用。

伴随着我国老龄化社会的到来,健康管理和疾病预警将会是极其有意义的事业。因此,我们采用完全免费的系统及软件,构建了该高血压早期预警及健康管理平台的测试版,供广大医疗健康管理工作者及相关的科研工作者参考。

[1]Echouffo-Tcheugui JB,Batty GD,Kivimäki M,Kengne AP.Risk models to predict hypertension.A Systematic Review. PloS one.2013;8(7):e67370.

[2]倪延延,卢锦荣,张晋昕.二分类反应变量多水平模型及其软件实现.中国卫生信息管理杂志,2013(1):75-80.

[3]Shimada K, Fujita T,Ito S, Naritomi H, Ogihara T,Shimamoto K, Tanaka H,Yoshiike N.The importance of home blood pressure measurement for preventing stroke and cardiovascular disease in hypertensive patients:a subanalysis of the Japan Hypertension Evaluation with Angiotensin II Antagonist Losartan Therapy (J-HEALTH) study. a prospective nationwide observational study.Hypertension Research.2008;31(10):1903-11.

[4]Kim YJ,Go MJ,Hu C,Hong CB,Kim YK.Large-scale genome-wide association studies in East Asians identify new genetic loci influencing metabolic traits.Nature genetics.2011;43(10):990-5.

[5]余立强.LAMP架构搭建与网站运行实例.网络与信息,2011,25(8):50-2.

[6]White T.Hadoop:the definitive guide.O'Reilly.2012.

[7]张士靖,周志超,杜建,等.国内外健康管理研究热点对比分析.医学信息学杂志,2010(4):6-10.

Construction of Hypertension Early Warning and Health Management Platform

GUI Xiaoke1ZHANG Lijie1CHEN Yubao1ZHOU Jiapeng1WANG Lijuan2LIU Jielin2WEN Shaojun2LIU Kang3
1 Beijing Computing Center,Beijing 100094,China;2 Beijing An Zhen Hospital,Beijing 100029,China;3 Beijing University of Chinese Medicine Dongfang College,Langfang Hebei 065001,China

A hypertension early warning and health management platform was built,in order to control the mortality and morbidity of hypertension via improving patients' awareness,and to reduce the economic burden for individuals and the society.The platform is based on cloud computing and big data mining techniques,and is composed of four parts:data collection and archives risk assessment and classification for populations of different health grades health guidance and evaluation of effects of risk factors.

Hypertension,Health management,Early warning

R473.2

B

1674-9316(2014)21-0001-03

10.3969/J.ISSN.1674-9316.2014.21.001

猜你喜欢
预警高血压用户
《全国高血压日》
全国高血压日
高血压用药小知识
如何应对难治性高血压?
法国发布高温预警 严阵以待备战“史上最热周”
关注用户
关注用户
关注用户
机载预警雷达对IFF 的干扰分析
如何获取一亿海外用户