晏然
本文针对5G通信时代物联网应用的新趋势和新特点,分析了海量传感器使用以及相应产生的采集海量数据的处理需求,并提出了在本地智能节点进行数据预处理和融合的概念,从而能显著减轻通信网络的负荷,以及云端服务平台的处理压力。本文以智能家居场景为例,分析了利用模糊算法进行数据融合的方法,以及该方法在嵌入式平台下实现的局限性。本文针对性地提出了优化算法,并结合实验和仿真数据,验证了该方法的有效性。
电信技术迅猛发展,即将进入5G时代。5G通信最重要的应用之一是基于物联网的各种应用场景,比如智能家居,智能工厂,环境监控等等。
各类物联网应用的基础是环境数据的采集,这是靠物联网感知层来完成,具体而言,是各类型的传感器节点。而物联网应用的发展有以下几个趋势:
(一)更大的部署空间:需求的发展,要求我们在更大的空间范围内实现物联网布置,如更大型的智能化工厂,如智能家居应用场景由普通居室向别墅,酒店发展,等等。而通信技术的发展,为更大空间内实现节点互联提供了实现的可能性。更大的空间意味着更多的感知节点,更多的采集数据。
(二)更精细的采集频度:许多需求对实时性要求在提高,如智能驾驶,又如智能家居领域,要获取更好的控制体验和控制精度等等。采集频度的增加必然会带来数据量的增加。
(三)对环境变化和测量误差的容忍度要求更高:复杂的应用场景和海量的数据,必然会带来大量的测量误差和噪声数据,对这些噪声数据合理平滑将成为重要的技术难点。
从技术层面观察,这些应用发展趋势带给我们的是海量的数据,以及带有噪声的数据。如何对这些数据进行预处理,减轻节点通信的压力,以及集中处理云平台的压力,是值得研究的课题。我们通过引进数据预处理和数据融合模块来实现这些功能。
以智能家居系统为例,引进数据预处理和数据融合功能的系统总体架构如图1所示:
为减轻网络流量的压力,数据融合模块将在本地节点完成。考虑到计算能力和数据获取的方便性,该功能将部署在智能家居网关设备上。
数据预处理和融合模块将实现以下功能:
1、对异构数据进行预处理,统一数据格式和封装。数据的异构性来源于感知层各类型传感器的不同。
2、对噪声数据的平滑。噪声数据可能来自于测量精度的影响,环境的突发性变化,以及通信过程中产生的传输误差等等。平滑的数据将对后续数据处理环节的效率产生积极影响。
3、对海量数据进行融合,减少有效数据量,在不影响感知精度的情况下尽量减少通信网流量压力和后续数据处理负荷量。
下文将重点分析数据融合的实现方法以及在物联网环境下的优化实现。
(一)数据融合算法简介
数据融合算法是各类数据融合技术的核心研究内容。选择数据融合算法,要综合考虑数据的类型,数据特征分布,数据分析目的等等差异,还要考虑到实现的难度和计算量差异。
常见的数据融合算法有以下四种
1、加权平均算法
加权平均算法就是对待融合数据进行加权平均,从而得到融合结果。
假设对 n 个采集点进行融合,第 i 个节点数据为Ai,权重为 Wi,i=1…n,则融合结果如下式1所示:
加权平均算法是一种简单直接的融合算法,它要求确切的获知每个节点的權重信息,而在具体物联网应用中这往往是很繁琐的,难以做到的,而且可能是频繁变化的,因此应用场景有限。
2、D-S 证据理论算法
证据理论是Dempster于1967年首先提出,由他的学生Shafer于1976年进一步发展起来的一种不精确推理理论最早应用于专家系统中,具有处理不确定信息的能力。作为一种不确定推理方法,证据理论的主要特点是:满足比贝叶斯概率论更弱的条件;具有直接表达“不确定”和“不知道”的能力。
设m1和m2是由两个独立的证据源(传感器)导出的基本概率分配函数,则Dempster组合规则可以计算这两个证据共同作用产生的反映融合信息的新的基本概率分配函数。
3、神经网络算法
人工神经网络(Artificial Neural Networks,ANN)系统是 20 世纪 40 年代后出现的。它是由众多的神经元可调的连接权值连接而成,具有大规模并行处理、分布式信息存储、良好的自组织自学习能力等特点。
神经网络规则建立需要大量数据的训练。由于分布式的特点,对噪声数据具有天然的容忍性。
4、模糊理论算法
模糊理论(Fuzzy Logic)是在美国加州大学伯克利分校电气工程系的L.A.zadeh(扎德)教授于1965年创立的模糊集合理论的数学基础上发展起来的,其基本精神是接受模糊性现象存在的事实,而以处理概念模糊不确定的事物为其研究目标,并积极的将其严密的量化成计算机可以处理的讯息,不主张用繁杂的数学分析即模型来解决模型。
模糊理论将数据概率化,获取的数据理解为某具体值的概率分布,融合过程转化为概率函数的融合。
以上几种融合算法中,加权平均算法简单直接,但实用性有限;D-S 证据理论算法和神经网络算法均存在复杂性较高,计算量大的问题,对嵌入式硬件平台性能要求比较高。本文将选择模糊理论算法进行重点研究。
(二)基于模糊理论的数据融合算法
模糊理论算法的基本思想是将数据模糊化,概率化。
对于传感器网络内某个传感器组合A,其融合值由函数三元组{ F(A),R(A),M(A) },表达。
其中F(A)为融合函数,它定义了具体的融合算法。常见的融合算法有最大(小)值法,中间值法,均值法等等。
R(A)为容许度函数,它定义了数据间的相似程度。R函数的取值范围在[0,1]之间,值越接近 1,说明数据相似度越高,相似度越高则融合难度越低。
M(A)为模糊测度函数,它代表了融合的传感器组代表数据的可靠度。参与融合的节点数占总节点数比例越多,则M的值越大,反之则越小。
假设某个待融合的传感器网络共有n个采集节点,这些节点可以任意组合,形成的传感器组合的数量为2n-1。根据模糊算法理论,该传感器网络最终融合输出为:
其中i的取值为1~2n-1。AND运算为取最小值,OR运算为取最大值。
由上式可见,模糊算法的计算量由节点数n来决定,随着节点数n的增加,算法计算量将成指数级增长,从而对在嵌入式硬件环境中实现算法增加难度,因此有必要对算法进行优化。
(三)针对嵌入式平台的算法优化
嵌入式硬件平台一般偏重于控制而计算力较弱,对算法优化的重点为减少计算量和数据存储量。
根据上文介绍可知,降低计算量的关键在于参与节点数n。如果能够设法降低n的值,则能够大大降低总体计算量,适应嵌入式环境的要求。在一个固定系统中,物理节点数量n一般是固定的,我们的思路是减少有效节点数。
一般而言,节点采集数据都存在一定的冗余度,这种冗余度体现在空间分布冗余和时间采样冗余两个方面。例如:如果一段时间内待监测环境参数没有发生大的波动,可是适当减少采样的频度;如果检测环境参数的空间分布有一定的平滑性,可以适当降低有效节点的分布密度。通过两个维度对数据进行合理丢弃,就等效降低了参与融合的节点数。
以智能家居系统的温度变化监控为例:
图2为背景温度为8℃,启动空调加热至23℃的温度变化曲线,在开始两分钟以内,空调主机处于预热阶段,温度上升较慢;在13分钟以后,达到设定目标温度,温度变化率变缓。在上述两个时间段内,可以通过合理丢弃采集数据的思路,降低数据融合的计算量。
对数据进行丢弃,需要考虑两个要点:
1、冗余数据丢弃阀值
我们设定一个空间值:
其中C为上次融合输出结果,?为一个设定常数,代表了被测量值的合理波动,合理选择?需要对于环境有一定的先验知识。T即为衡量数据是否冗余的阀值空间。
当待融合数据没有进入上述值空间,代表该数据需要进入正常的融合算法过程;当待融合数据进入该值空间范围,则代表该数据的冗余度较大,可以考虑丢弃。
2、数据权重值
对每个待融合数据,赋予其伴随权重值记为W。W取值为正整数,初值为1。W表达了与该数据相似的数据量,W越大,表示该数据代表的数据量越多;W=1表示该数据只代表自己。
当某数据落入丢弃阀值空间内时,我们将它丢弃;但是丢弃的数据量太多时,往往会造成计算精度的下降。因此,通过引进数据权重,我们给定该数据一定机会重新参与融合。
对该数据赋予重新融合的机会通过修改模糊测度函数来实现。
(一)仿真试验场景
仿真实验场景设定为某智能家居现场,空间范围为100m 100m。传感器节点类型设定为温度传感器,传感器感知范围为20m。
为了方便对比,使用普通的模糊融合算法和基于权重丢弃的改进算法两种方法进行数据融合实验,融合次数设定为50次。
传感器节点位置为随机均匀分布,如圖4所示:
(二)仿真试验结果
基于算法原理分析可知,实际参加融合的有效节点数是衡量算法改进效率的重要指标,模拟实验首先对两种算法的有效参与节点数进行了统计,结果如图5:
图中红色点线为传统融合算法参与节点的数量,基本在100左右小幅波动;蓝色点线为改进后的算法对应的节点参与数量,从第三次融合迭代开始,参与节点数降低到50个左右,降低了一半。传统算法中几乎所有节点都参与了每次融合过程;而改进后的算法能大大降低参与节点数,从而能更大程度降低算法的计算量需求。
在达到降低参与节点数的设计目标的同时,我们还要确保算法融合结果的正确性和精度指标,对此我们对两种算法的融合结果值进行了比较,如图6:
图中红蓝两色点线对应的分别是传统算法和改进算法的融合值拟合曲线,两者对比可知,改进算法的准确度和精度能达到设计要求。
本文首先分析了5G通信网背景下物联网应用场景新的需求,指出传感器网络扩展和海量数据带来的技术问题。文章提出了在本地智能节点进行数据预处理和数据融合的必要性和重要性。随后分析比较了常见的几种数据融合算法。本文选择模糊理论基础上的数据融合算法进行重点研究,并针对嵌入式硬件环境对算法进行了改进。通过基于阀值和权重的丢弃处理机制,能降低参与融合计算的有效节点数量,从而大大降低计算量和对硬件的要求。仿真模拟实验结果证明,改进算法能够达到传统模糊算法能达到的准确度和精度,是一种有效的算法。
基金项目:本文系湖南省教育厅科学研究项目《基于智能决策的智能家居系统研究》论文,项目编号:17C1343。