一种面向无线体域网的低能耗数据融合隐私保护算法*

2017-12-08 07:41翟羽婷史春燕
传感技术学报 2017年11期
关键词:分片保护性密钥

翟羽婷,史春燕,王 磊

(1.张家口学院理学院,河北 张家口 075000;2.中国科学院苏州生物医学工程技术研究所,江苏 苏州 215163)

一种面向无线体域网的低能耗数据融合隐私保护算法*

翟羽婷1,史春燕1,王 磊2*

(1.张家口学院理学院,河北 张家口 075000;2.中国科学院苏州生物医学工程技术研究所,江苏 苏州 215163)

无线体域网能够借助低能耗高精度传感技术实时采集并分析多种模态的人体健康体征数据,需要在数据传输过程中对关系到个人隐私的健康敏感数据进行保护。针对无线体域网数据融合过程中的隐私保护需求提出一种针对性更强的低能耗数据融合SMART-RR算法,利用人体健康数据存在周期重复性和健康数据冗余特点,提出不等长时间间隔、加入重复性归约因子的数据融合策略。仿真实验表明,SMART-RR算法是一种数据通信量小、高隐私保护性和高精确度的低能耗数据融合隐私保护算法,在面向无线体域网的人体健康体征数据采集分析领域具有一定应用价值。

无线体域网;数据融合;隐私保护;低能耗;重复性归约

随着无线通信技术、物联网以及低能耗传感设备开发技术的不断进步,无线传感器网络WSN(Wireless Sensor Network)得到长足发展,在健康医疗、环境监测、国防建设等诸多领域得到广泛应用。无线体域网WBSN(Wireless Body Sensor Network)是WSN在健康医疗领域的一个重要分支,已经吸引了包括远程医疗、远程监护、社区养老等多领域研究者的关注[1-2]。WBSN通过将植入式、可穿戴式或者近体式等不同种类的低能耗传感器节点安置于人体体内或体表,收集多种模态的人体健康体征数据,比如体温、心电、脉搏、血压、血氧等信息并通过无线通信网络逐级上传到数据采集父节点,基于数据挖掘与智能分析技术辅助医护人员对人体健康状况做出判断。

基于体域网的健康数据系统能够实时采集大规模多模态的人体健康数据,为精准医疗和健康大数据分析提供了可能性,研究者已经针对WBSN数据融合算法进行了深入研究[3-5]。WBSN中的健康数据沿着数据融合树形结构逐级上传并融合,这些数据包含了大量的关系个人健康状况的隐私信息,一旦传感网络中的某些节点被恶意入侵,这些敏感的隐私信息就有被监听的可能,导致健康数据融合异常,造成难以估计的健康数据安全灾难,影响用户对基于无线传感器网络技术的远程医疗和健康监护的信任。

为了提高无线传感器网络中数据融合的安全性,研究者提出了多种不同的加密技术和算法,包括密钥分配算法、同态加密算法等。密钥加密算法通过给WSN中的传感器节点预分配密钥的方式进行加密保护,防止网络传输过程中的敏感信息被监听泄露,但是由于数据融合过程加入了频繁的密钥分配与解密操作,往往降低了数据融合效率,增加了传感器节点的能耗[6]。为了提高数据融合效率,文献[7]提出了一种面向WSN的同态加密算法,在加密密文基础上进行融合计算,但是这种方法的隐私保护性有所减弱,如果传感器网络中某些节点被恶意入侵后,可能导致相邻节点中的隐私数据不能得到有效保护。文献[8]在密钥分配算法基础上提出了CPDA(Cluster-based Private Data Aggregation)和SMART(Slice Mix AggRegaTe)两种算法,传感器节点采集数据之后首先进行分片操作并传送到不同的节点,以这种方式增强敏感数据的隐私保护性,即使网络内部某些节点被入侵攻破,也不能清晰解析得到完整准确的数据。杨庚等[9]在分析了SMART算法由于对传输数据进行分片操作导致数据融合精确度有所下降的不足之后,提出了加入多种优化因子的一系列改进算法,通过对比实验与分析验证了所提出算法在隐私保护性、精确度以及分片接收率等方面的性能。由于WBSN采集得到的人体健康数据往往具有多模态特性,可以在现有的隐私保护算法基础上进一步研究针对多模态健康数据的数据分片策略、基于不等长时间间隔数据的数据融合算法,从而提高健康数据隐私保护性并且降低WBSN网络通信量。

本文针对面向体域网健康数据采集与智能分析的个人健康敏感数据安全性和精确性需求,在SMART及相关算法的基础上加入局部优化因子,提出一种数据融合隐私保护算法,降低WBSN中传感器节点数据冗余度和传感网络通信量的前提下提高个人健康数据的隐私保护性。本文第1节对基于无线体域网的健康数据采集分析系统模型进行讨论,介绍健康数据监测系统的拓扑结构和低能耗传感器节点;第2节从SMART系列算法应用在WBSN中的缺陷分析出发,提出基于树形结构的数据融合模型和加入优化因子的数据融合隐私保护算法并进行理论证明;第3节通过仿真实验对算法的隐私保护性、数据通信量和精确度等性能进行分析评价;第4节总结所研究的内容并展望未来工作。

1 体域网健康数据采集分析系统模型

WBSN通过将低功耗、高精度的传感器置于被监测人体的体表或体内,借助WSN技术组网形成一套能够实时采集并传输人体健康数据的无线传感器网络结构,从而支持健康医疗数据分析,为远程医疗、实时监护提供支持。本节首先介绍基于无线体域网的健康数据检测系统拓扑结构,然后描述用于人体健康数据采集的低能耗传感器节点。

1.1 健康数据监测系统拓扑结构

基于无线体域网的人体健康数据采集与分析系统硬件拓扑结构如图1所示,由置于人体体表的多种体征数据传感器节点、数据传输节点和数据分析节点组网实现。

图1 基于无线体域网的健康数据系统拓扑结构

置于人体体表的多种健康体征数据传感器分别采集获得人体的脉搏、体温、脑电、心电、血压和血氧信息,并通过无线通信网络周期性地传递给上一级数据传输节点;数据传输节点收集多模态的人体健康数据,进行噪声等垃圾数据的过滤,并根据数据类型进行第一层级的数据融合计算,将计算结果上传到数据分析节点;数据分析节点获得初步处理后的健康数据信息,并进行最终的数据融合计算,此时得到的信息对于辅助医护人员做出人体健康体征判断具有参考价值。

1.2 应用于WBSN的低能耗传感器节点

在健康医疗领域的实际应用中,WBSN往往采用低能耗高精度的无线传感器节点进行布点与数据采集。首先,用于采集人体健康体征数据的每个无线传感器节点是能量受限的,必须严格控制传感器节点的能耗从而延长整个传感网络的生存时间[10]。WBSN中的无线传感器节点的能量主要消耗在无线网络通信过程中,因此需要尽量降低传感器节点之间的数据通信量和数据冗余。其次,由于受到人体活动、外部环境电磁干扰等影响,WBSN传感器节点采集到的数据经常伴随各种噪声信号,降低了所获取健康体征数据的准确性和完整性[11]。

2 低能耗数据融合隐私保护算法

WBSN中的各种传感器节点获取多模态人体健康数据之后通过树形无线传感网络逐层上传并融合,数据传输通信量和加密解密机制直接影响敏感的个人健康数据隐私保护性和WBSN能耗性。本节将WBSN抽象为包含三层结构的树形网络,提出一种基于重复性规约因子的数据融合算法,并利用密钥分配机制提高数据隐私保护性。

2.1 基于树形结构的数据融合模型

WBSN可以用一个连通有向图G(V,E)表示,其中顶点v(v∈V)表示WBSN中的节点,有向弧e(e∈E)表示节点之间的数据传输链路。典型的WBSN一般包含3种类型节点:(1)叶子节点,由采集和传输人体健康数据的多种传感器组成;(2)融合节点,数据传输节点承担收集多模态健康数据并进行数据融合计算功能;(3)QS(Query Server)节点,数据分析节点负责数据的最终融合分析。由上述三类节点组成树形结构的数据融合过程如图2所示。

图2 基于树形结构的数据融合过程

3种类型的节点构成树形结构,其中QS节点作为根节点得到数据融合结果并提供进一步健康体征分析的依据,融合节点负责从叶子节点接收数据并融合计算后传递给根节点,叶子节点采集多种模态的健康数据并上传给相应的节点,基于树形结构的数据融合过程是单向传输的。

目前应用于WSN中的数据融合函数结构可以表示为式(1):

f(t)=φ[d1(t),…,dn(t)]

(1)

式中:di(t),(i=1,2,…,n)表示节点i在t时刻采集得到的数据,算子φ表示融合计算因子,比如count、average、max、min等sum函数[9]。

作为WSN在健康医疗领域分支和具体应用的WBSN,其所采集传输的是人体多模态健康数据,其中某些模态的数据具有明显的周期特性:比如,脉搏信号、心电信号、脑电信号等,而且人体健康数据在大多数时间是基本正常的,对健康分析更有价值的往往是那些异常信号。因此,可以在WBSN的数据分片和传输策略设计时考虑上述领域特点,对于大量存在的周期性正常数据进行压缩处理,重点收集偶发性的异常数据,从而降低无线传感器网络的数据通信量。本文提出基于不等长时间间隔的数据融合函数如式(2):

(2)

2.2 基于重复性归约因子的数据融合算法

本文在SMART系列算法[9]基础上进一步改进,针对WBSN应用提出一种基于重复性归约因子(SMART-Repeatability Reduction)的数据融合算法SMART-RR。

数据加密解密采用随机密钥分配策略:产生一个包含K个密钥的密钥池,从中随机选取k个密钥(k

SMART算法基本结构包括3个主要步骤:(1)Slice. 每个节点将采集得到的数据分成J片,其中J-1片发送到从相邻节点集中随机选取的J-1个节点;(2)Mix. 节点收到分片数据后利用共享密钥解密;(3)AggRegaTe. 利用TAG算法进行数据融合。WBSN中某些模态的数据具有明显的周期重复性,加入重复性归约因子的SMART-RC算法针对这一特点将数据采集传输时间间隔根据不同模态数据划分为不等长的时间片,并对时间片内的周期重复性数据进行归约,限制数据通信量以降低无线传感器网络能耗。根据采集得到的数据是否具有周期重复性,节点可以分为周期性节点集Vr和非周期性节点集Vu。

SMART-RR算法流程

输入:无线体域网WBSN的数据融合树结构G(V,E),节点集合i∈Vr(脉搏、心电传感器节点)和i∈Vu(体温、血氧传感器节点)

输出:数据融合结果D。

1. WHILE 节点i∈V,Vi⊂V DO

2. 节点i在h跳内随机选择节点集Vi

3. 计算节点i的数据传输时间间隔参数Δti

4. END WHILE

5. IF 节点i∈Vr

6. 时间间隔设定Δti=10tr

7. IF 10个周期的时域特征Ft-domain相等

8. 去除重复性保留1个向量值;

10. END IF

11. END IF

12. WHILE 节点jd∈ViDO

13.J-1片压缩数据发送到节点jd

14. 节点jd利用共享密钥解密;

15. END WHILE

16. 输出结果:数据融合结果D

相比于SMART算法,加入重复规约因子的SMART-RR算法能够大量减少由于周期重复性健康数据传输所造成的通信负载,虽然每个节点对于数据传输时间间隔Δti的计算相比SMART算法消耗一定时间和处理资源,但是分析可知时间复杂度为O(1)并且不需要每次计算,因此产生的额外开销可以忽略。

3 实验与性能分析

为了验证本文提出的基于重复性规约因子的SMART-RR算法的性能,本节从隐私保护性、数据通信量和精确度3个方面进行仿真实验,并将SMART-RR算法与TAG算法、SMART算法进行对比分析,选取包含脉搏、心电、体温和血氧四类生理参数的仿真数据进行比对。

3.1 隐私保护性

SMART算法和SMART-RR算法的隐私保护性主要来自于数据分片传输和加密解密机制[12]。每个节点采集到的数据被分为J片并向相邻节点发送其中的J-1片数据,只有当窃听者获取所有J-1个出度链路和所有入度链路才能解密该节点此次发出的完整信息。

节点采集得到的数据被窃听解密的概率P可以表示为式(3):

(3)

式中:p=k/K表示由于密钥分配策略导致的数据被窃听的概率,D表示网络中所有节点的入度最大值,Pd=λ表示节点入度为λ的概率。

SMART算法和SMART-RR算法的隐私保护性均符合式(3),TAG算法没有引入隐私保护策略,因此隐私保护性弱于前两种算法。SMART-RR算法的隐私保护性如图3所示。

图3 SMART-RR算法的隐私保护性

从仿真实验结果可以看出,SMART-RR算法由于采用了数据分片传输与加密解密方式,能够更好地实现数据隐私保护效果,当J≥3时无健康数据被窃听的概率可以控制在小于0.5%的范围内,这在健康医疗领域的实际应用能够满足要求。测试结果也指导我们在设计基于WBSN的人体健康数据监测系统时对于节点数据分片片数应该设定在3片以上才能保障个人健康数据的隐私保护性。

3.2 数据通信量

应用于人体健康数据监测的WBSN节点能耗直接影响了传感器网络的生存时间和可用性,由前文分析可知节点能耗主要消耗在无线网络的数据通信过程中。因此,应该尽可能降低WBSN节点的数据通信量从而有效控制传感器节点能耗[13]。

用于WBSN数据融合隐私保护技术的数据通信量主要包括节点分片数据发送通信量和数据融合通信量。数据融合通信量与网络规模直接相关,即WBSN网络结构和节点数量确定后数据融合通信量固定。因此对比分析SMART-RR算法与SMART算法的节点分片数据发送通信量,这也是基于数据分片隐私保护算法主要的通信量额外开销。TAG、SMART、SMART-RR 3种算法的数据通信量如图4所示,其中SMART和SMART-RR中的J都设定为3。

图4 TAG、SMART、SMART-RR算法的通信量

从仿真结果可以看出,由于加入数据分片策略,SMART和SMART-RR算法的数据通信量均小于TAG算法,而且由于SMART-RR对存在重复性数据进行了一定的归约操作,因此数据通信量得到进一步压缩。对SMART-RR算法数据分片数与通信量之间关系进一步分析,从图5仿真结果可以看出随着J的增大数据通信量出现先增大后减小的趋势。

图5 SMART-RR算法通信量随分片数变化

图6 SMART-RR算法精确度随分片数变化

3.3 精确度

本文所提出的SMART-RR算法与SMART算法都是基于SUM函数[9]进行数据融合计算,定义数据精确度为:

c=|DQS|/|∑Di|

(4)

式中:|DQS|为融合后根节点的数据量,|∑Di|为所有传感器节点采集得到的原始数据量。如图6所示,SMART-RR算法的数据精确度对分片数J比较敏感,当J≥5时精确度成显著提高趋势,当J≥8是精确度趋于稳定。

综合上述对于算法隐私保护性、数据通信量和精确度的仿真分析,可以看出在SMART-RR算法中数据分片数J的设定直接影响算法性能,应该在实际应用中根据隐私保护性等具体要求选择更加合适的参数。

4 结论

本文针对应用于人体健康数据采集与分析系统的WBSN数据融合隐私保护算法需求,提出了一种基于重复性归约因子的数据融合算法,能够面向人体周期重复性明显的某些健康体征数据进行数据压缩,从而降低传感器节点的数据通信量和能耗,延长WBSN生存时间。通过仿真实验与对比分析验证了算法在隐私保护性、数据通信量和精确度等方面性能,与同类型算法相比在人体健康数据采集应用领域具有一定优势。进一步的工作可以进一步研究其他数据融合策略的隐私保护算法,收集更多实际案例分析算法的应用价值。

[1] 宫继兵,王睿,崔莉. 体域网BSN的研究进展及面临的挑战[J]. 计算机研究与发展,2010,47(5):737-753.

[2] 王明宇,杨吉江,陈昊,等. 基于体域网和云平台的远程数字健康系统发展的研究[J]. 计算机科学,2012,39(6A):195-200.

[3] Gravina R,Alinia P,Ghasemzadeh H,et al. Multi-Sensor Fusion in Body Sensor Networks:State-of-the-Art and Research Challenges[J]. Information Fusion,2017,35:68-80.

[4] 孙凌逸,黄先祥,蔡伟,等. 基于神经网络的无线传感器网络数据融合算法[J]. 传感技术学报,2011,24(1):122-127.

[5] 邱立达,刘天键,林南,等. 基于深度学习模型的无线传感器网络数据融合算法[J]. 传感技术学报,2014,27(12):1704-1709.

[6] He W,Liu X,Nguyen H,et al. PDA:Privacy-Preserving Data Aggregation in Wireless Sensor Networks[C]//Proceeding of the 26th IEEE International Conference on Computer Communications. Anchorage,AK. 2007:2045-2053.

[7] Ruj S,Nayak A,Stojmenovic I. Fully Secure Pairwise and Triple Key Distribution in Wireless Sensor Networks Using Combinatorial Designs[C]//Proceeding of the 30th IEEE International Conference on Computer Communications. Shanghai,China,2011:326-330.

[8] Castelluccia C,Mykletun E,Tsudik G. Efficient Aggregation of Encrypted Data in Wireless Sensor Networks[C]//Proceeding of the 2nd Annual International Conference on Mobile and Ubiquitous Systems:Networking and Services. San Diego,USA,2005:109-117.

[9] 杨庚,李森,陈正宇,等. 传感器网络中面向隐私保护的高精确度数据融合算法[J]. 计算机学报,2013,36(1):189-200.

[10] 彭向东,张华,刘继忠. 基于过完备字典的体域网压缩感知心电重构[J]. 自动化学报,2014,40(7):1421-1432.

[11] 刘毅,宋余庆,刘哲,等. 一种面向体域网的ECG信号小波阈值去噪法[J]. 计算机科学,2014,41(11):175-178.

[12] Madden S,Franklin M J,Hellerstein J M. TAG:A Tiny Aggregation Service for Ad-Hoc Sensor Networks[C]//Proceeding of the 5th Symposium on Operating System Design and Implementation. New York,USA,2002:131-146.

[13] 张伟,颜仕星,李国正. 无线脉搏波测量及性别区分—基于在体传感网的多点测量应用[J]. 计算机工程与应用,2010,46(35):231-234.

翟羽婷(1982-),女,硕士学位,张家口学院理学院讲师,从事计算机教学工作,主要研究方向包括无线传感器网络、信号传输隐私保护技术、计算机联锁技术等;

史春燕(1983-),女,硕士学位,张家口学院理学院讲师,从事计算机教学工作,主要研究方向包括无线传感器网络、多模态数据融合算法等;

王磊(1982-),男,博士学位,硕士生导师,中国科学院苏州生物医学工程技术研究所副研究员,从事医疗健康软件研发工作,主要研究方向包括无线传感器网络、数据挖掘与数据融合算法、医疗健康人工智能应用研究等,wanglei@sibet.ac.cn。

AnEnergy-SavingandPrivacyPreservingDataFusionAlgorithminWirelessBodySensorNetwork*

ZHAIYuting1,SHIChunyan1,WANGLei2*

(1.College of Science,Zhangjiakou University,Zhangjiakou Hebei 075000,China;2.Suzhou Institute of Biomedical Engineering and Technology,Chinese Academy of Sciences,Suzhou Jiangsu 215163,China)

Wireless body sensor network could collect and analyze the multi-modal health data of human body in real time by means of energy-saving and high-accuracy sensor technology,and the sensitive data related to personal privacy should be protected in the process of data transmission. Aiming at the requirement of privacy preserving in the data fusion process of wireless body sensor network,a new SMART-RR algorithm is proposed in this paper,in which an unequal time interval and repetitive data reduction joined factor data fusion strategy is embedded in the algorithm using the characteristics that human health data is cycle repeatability and redundancy. Simulation results show that the SMART-RR is an energy-saving privacy preserving data fusion algorithm with small data communications,high privacy protection and accuracy,and has certain application value in human health signs oriented data acquisition of wireless body sensor network domain.

wireless body sensor network;data fusion;privacy preserving;energy-saving;repeatability reduction

TP393

A

1004-1699(2017)11-1734-06

项目来源:江苏省政策引导类计划—前瞻性联合研究项目(BY2016049-01)

2017-03-07修改日期2017-07-06

10.3969/j.issn.1004-1699.2017.11.020

猜你喜欢
分片保护性密钥
上下分片與詞的時空佈局
幻中邂逅之金色密钥
分片光滑边值问题的再生核方法
密码系统中密钥的状态与保护*
CDN存量MP4视频播放优化方法
基于模糊二分查找的帧分片算法设计与实现
TPM 2.0密钥迁移协议研究
一种对称密钥的密钥管理方法及系统
宁夏保护性耕作的必要性及技术模式探讨
保护性开发利用高铝煤炭资源的必要性及相关建议