龙 浩
(徐州工业职业技术学院,江苏 徐州 221002)
随着社会经济的快速发展以及科技水平的提高,智能手机得到广泛应用,特别是今天的智能手机已发展成集加速度计、电子罗盘、陀螺仪、GPS、麦克风、照相机、亮度传感器、温度传感器、接近传感器等众多廉价而强大的嵌入式传感器于一身的可编程无线移动智能终端,而且,大部分还可以通过接口接入睡眠传感器、EEG耳机、气压计、雷达/热成像摄像头、化学传感器、心律传感器、心率监测传感器等外置传感器。普通用户随身携带的移动智能终端作为基本的感知单元,随时随地利用搭载的传感器感知周围环境信息,如城市环境监控、交通监控、路面监控和路边可用停车位统计等,并将感知数据通过无线网络(包括4G、5G、WiFi等)上传到服务器,实现感知任务的执行和感知数据的收集上传。在此背景下,一种新的感知范式得以形成并取得快速发展,开启了移动互联的新领域——移动群智感知(MCS)的大门[1]。MCS涉及感知数据的获取、处理、聚合以及态势评估等多个环节,它包括社会计算、无线传感器网络、机会网络在内的多学科高度交叉热点研究领域。这种新颖的感知模式,可利用群体的优势克服单个感知终端的数据精度相对较低的缺点。随着应用规模的扩大,终端感知上下文变得越来越复杂,持续感知实时处理以及运行环境动态变化等特征,需要基于社会行为分析的机会式数据收集,同时异构型海量感知数据处理的压力越来越大,应用的实时性要求越来越高。这些特征为其开发、运行带来诸多新的挑战,作为物联网下一个成功的关键和新型感知模式的发展方向,可靠的数据收集已成为深化物联网研究的核心技术,一些关于MCS数据收集的基本问题亟待解决。因此,开展MCS技术研究具有十分重要的现实意义和应用价值。
最近,研究者开发了部分以用户为中心的传感系统,目的是利用人们携带的智能设备或车载传感器感知本地数据,或反应客观物理现象。针对城市建筑和规划,通过传感技术理解人们在一个城市公共区域的活动和交互行为,将物理空间和社会空间相融合,以事件地图的形式向用户提供可视化服务。CarTel是MIT开发的基于车辆传感器的信息收集和发布系统,用于环境监测、采集路况信息、诊断车辆状况等,安装在车辆上的嵌入式CarTel节点负责收集和处理车辆上多种传感器采集的数据,使用Wi-Fi或BlueTooth等通信技术,在车辆相遇时交换数据,也可以通过安装在路边的无线AP将数据发送到Internet上的服务器。美国东北大学发表在英国自然杂志(Nature)上的研究成果表明,通过分析手机移动网络数据,发现人的移动轨迹具有高度的时空规律性,其移动分布接近于幂律模型,通过分析每个用户移动轨迹熵,发现93%的用户移动具备可预测性。微软亚洲研究院利用用户GPS数据,在分析了大量用户的轨迹数据基础上,发掘兴趣点,为用户提供个性化位置服务。Zhou利用公交车乘客的智能手机来预测公交巴士的到站时间,取得了较好的准确性。Reddy等人考虑参与式感知模式并开发了一个招聘框架,使组织者基于地理位置和时间的可用性以及参与习惯选择适当的用户进行数据收集。
目前,在隐私保护方面主要从数据加密方法、用户匿名方法、数据加扰和混沌感知区域进行研究。文献[2]进一步提出了一个PPTDS方案,PPTDS方案在原有的两个不共谋云平台的基础上通过一个完全可信的第三方增加方案的容错性。该方案增加了容错性,也增加了一个可信的第三方降低方案的实用性。文献[3]提出了一个单向网络协议的匿名数据收集方案。该方案通过对等网络协助匿名数据传输从而保护发送者的身份。文献[4]提出了一种基于信任的数据融合方案,通过节点行为来计算和评估节点的信任值,并能够及时检测和排除受损节点。文献[5]提出了在服务器不可信情况下解决移动群智感知中数据隐私保护问题的方案。
移动群智感知(MCS)过程采集到的数据很可能带有敏感信息,如身份、地理位置、时间等个人信息,数据采集者或转发者担心这些信息传给其它节点会暴露自己的隐私,传统的公钥体制并不适合MCS中形成的机会网络。
下一代互联网的不断发展引起因特网用户数量和数据流量激增。因此,设计提供安全、高效数据传输的新型算法已成为未来网络技术发展的重要研究问题之一。网络编码不仅可提高数据传输吞吐率,其本身的特性还可提供数据机密性,且计算复杂度小、执行过程简单。基于网络编码的安全、高效数据传输的研究尚处于起步阶段,很多有价值的研究问题亟待探索和研究。针对结点窃听的被动攻击模型,通过对传输拓扑选择和安全网络编码设计问题进行联合优化,研究了在信息论安全、弱安全两种安全需求下传输拓扑选择算法和安全网络编码算法。其次,针对流量分析的被动攻击模型,设计了基于网络编码的匿名传输方案,利用网络编码的向量空间特性隐藏编码包之间的线性相关性,达到匿名性的要求。另外,针对恶意篡改数据包的主动攻击模型,利用网络编码向量空间的特性,提出了基于短零向量的实时差错检测策略,具有较低的通信开销和复杂度。
本文设计一种MCS中基于网络编码的弱安全多播传输拓扑构建方法,获取所在网络的参数;将所在网络表示为有向图,有向图由节点和边构成,节点包括源节点、中间节点和目的节点,如果两个节点之间存在一条通信链路,则在这两个节点之间连接一条具有该方向的边;每条有向边的容量等于对应通信链路的容量,代价等于对应通信链路的代价;根据有向图建立整数传输速率的基于网络编码的弱安全多播的传输拓扑构建的数学模型;采用整数线性规划求解方法进行求解,获取整数传输速率的基于网络编码的弱安全多播的传输拓扑构建方案。方法实现了整数传输速率的基于网络编码的弱安全多播在满足弱安全需求的条件下,传输拓扑的构建,使得网络内安全传输吞吐量最大,与此同时保证了最大吞吐量时的最小传输代价,实现了网络的效率与代价优化。
在MCS中,参与者携带的传感设备获得的信息包括该感知设备感知的数据包及其它参与者转发过来的信息。我们首先定义信息接收模型,然后根据该模型设计加密和编码策略。
定义1(信息接收模型):对于节点u∈V,现有信息m=(α1,L,α2,…,αn)(x1,L,x2,…,xn)T,m可以为u感知的信息或者是网络中其他节点转发过来的信息。其中(x1,L,x2,…,xn)为一代信息的集合,记X=(x1,L,x2,…,xn)T,(α1,L,α2,…,αn)为编码向量,记为A0,则m=A0X,此时u中存储的与m为同一代的数据包为M,M系数矩阵记为A,M=A X。
在定义1的信息接收模型中,将M划分为两个集合M={C,D},其中Ci为C中第i个信息,同时记C中信息的个数为|C|,D中信息的个数为|D|。将M中编码过的信息放入C中,未编码的信息放入D中,此时若M=,则将m存储在u中。如果M≠ ,根据m是由u产生分两种情况:
设所有信息包集合为M,M={mi|1≤i≤n},考虑到普通传感节点缓存空间的限制,感知数据mi到达中间节点u后,在网络编码之前,设计缓存控制策略,使接收的数据量符合当前节点的存储要求,为了增大节点存储空间的利用率,当满足以下条件之一时,节点u拒绝接收mi。一是当mi中的编码向量与M中系数矩阵线性相关时,mi对最终解码无用,应拒绝接收。二是当mi未到达目的服务器时,若mi是编码包,而M中存在编码过的包是由mi和其他包编码出来的,拒绝接收mi。下面我们考虑具体的弱安全编码策略,按照m是否被编码分为以下两种情况:
1)当mi未被编码时,mi所包含的信息对u是可见的,需要将mi所包含的信息隐藏起来。此时若M=0,则在有限域Fq中随机选取一个系数g≠1,则新信息mrew=gm,将mrew及相应的编码向量存放至u中。若M≠0,将M划分为两个集合M={C,D},将M中编码过的包放入C中,未编码的包放入D中,若C≠NULL,每次将D、mi、Ci存放至新的集合H中,然后使用编码函数code(H)进行随机线性网络编码,若C=NULL,则将D与mi合并为H,然后使用编码函数code(H),最后删除M中的信息,将编码过的信息保存至u中。
2)当mi为已编码的包时,将M划分为三个集合C1,C2,D,其中C1存放只有一个消息编码生成的信息包,C2中存放其余的编码过的包,D中存放M中未编码的信息包。若D≠NULL,将D与mi合并为H,然后使用编码函数code(H)。若≠NULL,将C1与mi合并为H,然后使用编码函数code(H)。编码函数code(H)是在有限域中使用随机线性网络编码进行信息的线性组合,所有的运算均在Fq中完成,假设H中存储的信息为α1m1,α2m2,…,αnmn,这里系数α1=(α1,α1,…αk)称为编码向量,编码时随机地从有限域中取出l个系数k1,k2,…,kl,编码后得到的信息包为k1α1m1+k2α2m2+…+knαnmn。
在解码时,只考虑服务器端进行。当信息mi传输到服务器后,先将解码出的信息及服务器未解码的消息加入至Z中,Z为编码后的信息包,并将解码出的信息作好标记。然后对Z进行高斯消元,得到Z'=A'X,若系数矩阵A'中存在仅有一个数为1,其余数为0的行,该行为Z'i=(0,0,…,1,…,0)(x1,x2,…,xj,…,xn)T=xj,得到xj=Z'i,解码过程完成。
通过使用弱安全网络编码算法,采集的信息在转发至相邻节点时,原始信息被隐藏起来,实现了信息的隐私保护。算法提供的是弱安全保护,并未像公钥体制实现了非常可靠的安全性能,相对公钥体制,所提方法在较少计算消耗的情况下,提供隐私保护的同时提升了网络性能,使用弱安全网络编码可以增大信息传输成功率,获得更优的性能。
隐私保护是用户最为关心的问题,是互信协作的基础,它是MCS走向大规模应用的关键。研究具有弱安全网络编码的隐私保护机制、协议和相关算法,将弱安全网络编码用于群智感知的信息转发中,以较小的计算开销获得用户隐私保护,在改善网络性能的同时,提升了感知数据的质量和数据收集的可靠性,无需大量的计算开销,能在一定程度上提升网络性能。