基于传感器聚类数据挖掘的物联网智慧医疗模型设计*

2014-07-18 11:03潘永才李可维黄本雄皮健夫付勇前
传感器与微系统 2014年4期
关键词:聚类无线传感器

黄 辰, 潘永才, 李可维, 黄本雄, 皮健夫, 付勇前

(1.湖北大学 计算机与信息工程学院,湖北 武汉 430062;2.武汉第二船舶设计研究所,湖北 武汉 430064;3.华中科技大学 电子与信息工程系,湖北 武汉 430074)

基于传感器聚类数据挖掘的物联网智慧医疗模型设计*

黄 辰1, 潘永才1, 李可维2, 黄本雄3, 皮健夫1, 付勇前1

(1.湖北大学 计算机与信息工程学院,湖北 武汉 430062;2.武汉第二船舶设计研究所,湖北 武汉 430064;3.华中科技大学 电子与信息工程系,湖北 武汉 430074)

现代智慧医疗需要操作简洁、反应迅速,能够提供智慧诊断的信息化平台,提出基于物联网无线传感器技术的智慧医疗模型。系统利用附着在患者身上的各类传感器采集到的生理信息数据,采用基于密度的带有噪声的空间聚类(DBSCAN)算法的数据分析方法,用非线性映射把患者的生理信息数据转换到高纬度的特征空间,对变换后的矢量数据进行聚类分析,从而提升聚类结果并有效辅助医务人员进行诊断。

物联网;智慧医疗;基于密度的带有噪声的空间聚类算法

0 引 言

当今医疗机构为了提供针对性的治疗,划分了种类繁多的专科科室。科室划分越细,医院的机构组成就越庞大,用于记录各类医疗信息的文档资料也成倍增加,导致管理医院的难度和成本大幅度提升,因此,对医院进行信息化管理是必然趋势。

物联网(IoT)通过无线传感器感知物理世界的信息,利用安装在物体上的通信设备,在无线传感器的支持下,让感知到的信息进入互联网实现任意物体的互联互通[1]。作为物联网的重要应用领域,智慧医疗需要实现患者、医务人员、医疗机构、医疗设备之间的多向信息流交互,并将传统医疗区域的范围从医院扩展到患者家里。医疗物联网中的高性能服务器和数据库,通过优化数据处理算法对海量数据流进行智慧化分析,提升医疗服务的效率[2]。

针对上述智慧医疗系统的需求,本文提出了一个基于密度聚类数据分析方法的智慧医疗系统,患者通过便捷的高速宽带无线接入网络[3],利用智能无线传感器将病情信息上传。作为系统的核心功能,数据辅助分析是利用采集到的海量数据,为患者进行智慧诊断。本文引入基于密度的带有噪声的空间聚类(density-based spatial clustering of application with noise,DBSCAN)算法的数据分析方法,用非线性映射把患者的病情数据输入空间变换到一个高纬度的特征空间,在该特征空间扩展DBSCAN算法,提升聚类结果。

1 系统设计思路

本系统从功能上来说分为三大部分,包括患者数据收集、多平台登录交互和服务器数据处理。

在患者数据收集部分,系统能够利用安装在患者身上的无线传感器,实现无处不在的患者生理信息采集[4],提供血压、体温、脉搏等多项人体生理指标的检测功能,并且能够方便接入医用物联网[5]。

在多平台登录交互部分,采用了B/S(browser/server)架构(浏览器/服务器),适合于多平台,通过有浏览器可以在任何时候任何地方登陆系统。

在服务器数据处理部分,由于实际测量中的环境影响,不可避免地会产生异常数据,需要采用符合医疗实际,可以剔除异常数据的数据分析算法。根据上述系统功能,可以设计出系统的网络架构,如图1所示是系统架构图。

图1 智慧医疗系统架构Fig 1 Intelligent medical system architecture

2 相关核心技术

2.1 层次化智慧医疗体系架构

智慧医疗是无线传感器网络的重要应用领域,具备联网能力的无线传感器网络能够使大量医疗监护工作无线化、远程化和自助化,缓解资源短缺、资源分配不均的窘境,降低公众的医疗成本[6]。完整的智慧医疗体系分为7个层次[7]:业务管理系统、电子病历系统、临床应用系统、慢性疾病管理系统、区域医疗信息交换系统、临床支持决策系统、公共健康卫生系统。

2.2 B/S和SSH框架

面向多平台的B/S架构指的是浏览器/服务器架构,主要的事务逻辑是在服务器端实现的[8]。SSH框架是指Struts 2+Spring+Hibernate的组合框架,是目前最成熟的Web应用轻量级框架。本系统使用JSP技术来开发前端,为创建显示动态内容的Web页面提供的解决方案,具有低成本、适用平台广、组件可重用等特点[9]。

2.3 DBSCAN算法

进入服务器的海量数据中存在的异常点需要通过数据挖掘的方法进行查找,在统计学研究领域对异常点的定义是:基于某种度量而言,该数据点与数据集中的其他数据有着显著的不同[10]。

在智慧医疗中,附着在患者身上的无线传感器节点,可以感知到多维属性的测量值,这些多维属性的传感测量值构成的向量代表患者当前生理状况的特征点。聚类算法可以有效查找特征点的异常点,分析得到相似数据组,并和其他数据组相区别。

典型聚类算法有BIRCH算法、DBSCAN算法和CURE算法[11]。DBSCAN算法是基于密度的聚类算法,能够把具有足够高密度的区域划分为簇,并可在噪声的空间数据库中发现任意形状的聚类[12]。该算法通过保证单个异常点不产生一个簇来发现异常点。有2个参数来控制簇的产生:MinPts为簇中节点的最小数目;e为簇的半径。对于在簇中的每个点,必须存在簇中另外一点,它们之间的距离小于一定阈值。DBSCAN算法对数据进行操作时不会进行任何预处理,其时间复杂度为O(nlgn)。

3 智慧医疗管理系统模型

3.1 系统用户身份设计

系统用户主要是医务人员,包括医生、护士以及医疗单位的设备管理人员等,任何一类医务人员都可以在多个平台上,通过浏览器登陆管理系统。根据身份的不同,相应人员能完成的操作也不同。

3.2 系统框架设计

3.2.1 数据库的设计

在系统的开发阶段,使用MySQL数据库作为系统数据库。作为关系型数据库,MySQL具有的的体积小、速度快、开源、使用成本低的特点,可以很好地支持企业级系统的开发[13]。针对物联网病房信息管理系统的特点,每个实体类对应一张表,各表有关联关系。图2给出了主要表的数据关系模型图。

图2 数据关系图Fig 2 Data relationship map

本系统使用了DBSCAN算法的数据分析方法,根据该算法的特性,除了一般属性外,还需要加入数据获取时间和坐标信息以便定位。引入坐标信息的目的是方便单个数据值在空间中转化成数据点,其值设定为与获得的身体数据信息等值。

3.2.2 前台页面的设计

根据职务权限的不同,前台页面有患者页面、医生页面、护士页面和管理员页面之分。各页面有完成相应的职务的功能模块。不同的职务显示不同的界面,当对应的普通职务进行更高权限的操作时,系统转到失败页面并提示权限不够。

3.2.3 后台服务器的设计

对于后台服务器部分,使用Tomcat作为Web服务器。Tomcat是一个开源的Web应用服务器,其运行时占用的系统资源小,扩展性好,支持负载平衡与邮件服务等开发应用系统常用的功能[14]。

3.3 DBSCAN算法的数据分析

系统的另一个核心部分是数据分析研究。其设计思路是利用DBSCAN算法对数据进行处理,得到不同的数据簇,再将簇与标准数据进行对比做出判断。在系统中,数据通过传感器和智慧医疗设备收集,然后上传到数据库服务器。通过算法智慧剔除异常数据,然后将有用数据进行分析,得出结果。整个流程如图3。

图3 数据处理流程Fig 3 Data processing process

对患者的血压、体温等数据分析需要先剔除异常点,然后对其进行分析。使用DBSCAN算法来对患者血压、体温等数据进行处理,将数据以类划分,那些孤立的少数点将视为异常点剔除掉,余下的数据簇作为有用数据,根据其特征和时间信息来判断患者在某个时段的身体状况。DBSCAN算法有3个重要定义,它们分别解释了密度可达、密度相连和簇的概念[15]:

定义1.对于对象p的ε相邻对象表示为Nε(p),且Nε(p)={q∈D|dist(p,q)≤ε},对于给定的值MinPts,对象q如果是对象p的ε相邻对象,则称点p从q直接密度可达。

定义2.对于给定的ε和MinPts,如果对象集合D中存在一个对象o,使得对象p和q是从o关于ε和MinPts密度可达的,那么就称对象p和q关于ε和MinPts密度连接。

定义3.对于对象集合D,簇C是满足如下条件的集合D的一个非空子集:

1) ∀p,q,如果p∈C,并且p和q是密度可达的,则q∈C;

2) ∀p,q∈C,p和q密度相连的。

DBSCAN算法需要2个重要参数,一是点p领域ε半径;二是领域内包含点的最小数目MinPts。整个监测的流程如下:首先指定某个患者的身体数据信息集合,从中选择任意对象p,扫描所有对象找出p关于ε和MinPts密度可达的集合;如果p是核心对象,则集合p的所有可达对象形成簇;否则,p不是核心对象,即是异常点,应该剔除掉。

系统测量患者在一定时间段的脉搏、血压和体温信息,设脉搏、血压和体温为特征向量,用(S,F,T)表示。在三维数轴中这些点将展开为点集[16]。设点集为G,使用欧氏距离计算空间中各点的距离

i=1,2,…,n;l=1,2,…,n;j=1,2,3.

其中,Pij为第i个特征点的j维坐标值,Zlk为第l个聚类点的j维坐标值,Z由系统指定。

为了将这些点聚类,首先需要指定参数ε和MinPts的值。参数值是受到时间段内测量数据点的次数影响的,且它们之间存在的是正比关系。根据患者的病情确定测量次数,进而确定参数值。

该系统中DBSCAN算法的执行过程如下:

1)任意选取点集G中的不属于任何数据簇的点对象P,将其创建为一个新的数据簇;

2)点P作为新创建的数据簇的核心点,与其它数据点比较,将密度可达点加入该数据簇中;

3)循环步骤(2)直到没有点可以加入簇为止,然后再执行步骤(1);

4)当点集中所有点都属于某个数据簇,则结束。

在经过算法处理后,数据将成簇存在。需要将簇中点的数目a和MinPts比较,确定簇的有效性:

a.当a

b.当a≥MinPts时,该簇为有效数据组成的簇,被系统保留。

被系统保留的数据簇就是患者生理数据的真实体现。这些数据用于和标准健康数据进行比较,根据各项生理数据偏差值的大小便可以完成病因判断,也就是完成了系统的智慧诊断。

此数据分析法有较强的灵活性,根据患者的病情症状,可以对算法的参数进行更改:对病情较重的患者,增加测量次数,提高MinPts的大小,降低ε的值,可以更加准确地得到患者的当前生理数据;对于某种慢性病患者,延长时间段选取的时长,并增加时间段的选取个数,多次运用算法,可以得到患者在较长时间的生理状况,并作出智慧诊断。

4 实验结果

本文采用Matlab编写功能程序,选择从湖北省武汉市某三甲综合医院获得的实际数据进行验证,将该医院某科室半年内采用与本系统类似的生理信息检测设备得到的检测数据统计在一起,形成一个独立数据库,然后采用DBSCAN算法进行处理分析。将做出诊断之前的生理信息特征提取数据,和诊断之后的确诊结论进行绑定处理,以提高预测能力的准确度。

表1所示的是综合生理特征值的实际数据和预测数据的比较,可以得到预测数据与实际数据之间的误差为5.5 %,表明预测模型的结果是接近实际的。

表1 综合生理特征值Tab 1 Integrated physiological characteristics value

5 结束语

智慧医疗信息化系统是目前医疗发展的一个重要内容。本文基于物联网无线传感器技术采集患者生理信息数据,提出了DBSCAN算法的数据分析方法,能够剔除异常数据并将有效数据聚类为簇,成簇的数据和健康数据做比较便能做出病因判断。据此得出智慧诊断结果能够有效为医护人员提供治疗参考。

[1] Atzori L,Iera A,Morabito G.The Internet of tings:A survery[J].Computer Networks,2010,54(15):2787-2805.

[2] Kwon P,Kim H,Kim U.A study on the web-based intelligent self-diagnosis medical system[J].Advances in Engineering Software,2009,40(6):402-406.

[3] 林 晓.见证时代发展,从有线网络到无限网络[J].网络与信息,2011(6):3-5.

[4] 张 琰,忻展红.Wi-Fi与电信业的发展[J].北京邮电大学学报,2004,6(4):39-41.

[5] 李建功,唐雄燕.智慧医疗应用技术特点及发展趋[J].中兴通讯技术,2012,18(2):13-22.

[6] Trace D,Naeymi-Rad F,Haines D,et al.Intelligent medical record-entry[J].Journal of Medical Systems,2003,17:139-141.

[7] 任菁菁,何前锋,金 瓯,等.感知健康、智慧医疗—物联在医疗健康领域的应用[J].中国信息界(e医疗),2011(3):46-47.

[8] 蔡 隽.基于B/S架构开发的医疗设备管理系统[J].电脑与电信,2011(2):60.

[9] 钱 敬.B/S架构中的数据推送设计与实现[J].电脑知识与技术,2013(10):2356-2359.

[10] Barnett V,Lewis T.Outliers in statistical data[M].New York:John Wiley & Sons,1994:4-24.

[11] Osinski S,Stefanowski J,Weiss D.Lingo:Search results clustering algorithm based on singular value decomposition[J].Intelligent Information Processing and Web Mining Advances in soft Computing Volume,2004,25:359-368.

[12] Tan P,Steinbach M,Kumar V.Introduction to data mining[M].范 明,译.北京:人民邮电出版社,2011:32-41.

[13] Schwartz B,Zaitsev P,Tkachenko V.High performance My-SQL[M].王晓东,译.北京:电子工业出版社,2010:16-30.

[14] Brittain J,Darwin I.Tomcat:The definitive guide[M].吴 豪,译.北京:中国电力出版社,2009:8-20.

[15] Han J,Kamber M,Pei J.Data mining:Concepts and technique-s[M].Urbana:Morgan kaufmann,2011:12-34.

[16] 刘双喜,王 盼,张春庆,等.基于优化DBSCAN算法的玉米种子纯度识别[J].农业机械学报,2012,43(4):190-191.

Design of intelligent medical model based on sensor clustering data mining in IoT*

HUANG Chen1, PAN Yong-cai1, LI Ke-wei2, HUANG Ben-xiong3, PI Jian-fu1, FU Yong-qian1

(1.School of Computer and Information Engineering,Hubei University,Wuhan 430062,China;2.Wuhan Second Ship Design and Research Institute,Wuhan 430064,China;3.Department of Electronic and Information Engineering,Huazhong University of Science and Technology,Wuhan 430074,China)

Modern intelligent medical care needs an information platform which can provide easy operation,fast response,and intellective diagnose,so propose intelligent medical model based on Internet of things(IoT) wireless sensor technology.This system collects physiological datas by intelligent sensors attached to patients,and adopts data analysis method based on density clustering density-based spatial clustering of applications with noise (DBSCAN) algorithm using space transformation,which converts physiological information to a high dimension feature space using nonlinear mapping,and carry out clustering analysis on transformed vector data,to promote clustering efficiency and assist medical staffs to diagnose.

Internet of things(IoT); intelligent medical;density-based spatial clustering of applications with noise(DBSCAN) algorithm

2014—01—29

国家自然科学基金资助项目(61201254);湖北省软科学物联网产业发展专项项目(2011DHA014);教育部大学生创新创业计划资助项目(201210512004)

TP 393

A

1000—9787(2014)04—0076—04

黄 辰(1983-),男,福建龙岩人,博士,讲师,主要研究领域为无线传感器网络、物联网、云计算、智慧城市。

猜你喜欢
聚类无线传感器
康奈尔大学制造出可拉伸传感器
《无线互联科技》征稿词(2021)
简述传感器在物联网中的应用
基于K-means聚类的车-地无线通信场强研究
“传感器新闻”会带来什么
无线追踪3
跟踪导练(三)2
基于ARM的无线WiFi插排的设计
一种PP型无线供电系统的分析
基于高斯混合聚类的阵列干涉SAR三维成像