李凌霞++李冰冰++王建
摘 要:针对物联网海量信息的特点及信息处理所需解决的关键问题,文中分析了物联网信息处理的主要技术方法和信息处理过程中的信息决策方法,根据现有研究成果,指出了物联网信息支持和决策技术所面臨的挑战、研究的热点领域和进一步的研究方向。
关键词:物联网;信息处理;信息融合;决策技术
中图分类号:TP216 文献标识码:A 文章编号:2095-1302(2017)10-00-04
0 引 言
物联网利用射频识别装置、无线传感器、红外感应器等信息传感设备,运用各种接入技术将物与物、人与物通过网络设施互联,实现对物体的识别、感知、监测、跟踪,最终实现具体应用领域的智能管理与控制[1]。随着物联网广泛应用于生产生活中,物联网系统规模越来越大,各种感知设备产生了海量异构信息,使得资源共享、数据分析和挖掘难以实现。以智能居家养老为例,系统的健康监测、家电控制、室内环境监测、安全监控等传感设备随时会产生大量异构数据,并存在结构化数据、半结构化数据及非结构化数据,如何借助信息处理技术,将这些信息高效地存储起来,以便通过数据分析、数据挖掘的手段发现有用信息,为应用领域的智能决策提供信息支持,成为物联网领域研究的重要内容。
国内外学者对物联网信息处理技术进行了深入研究,在物联网信息支持和决策技术方面取得了一定成果。本文对物联网信息处理技术的主要方法和基于云计算的信息处理技术进行了分析,探讨了物联网信息处理研究的热点领域。通过对信息处理过程中的决策方法的研究,分析了现有的研究成果,指出了物联网信息支持和决策技术所面临的挑战、研究的热点领域和进一步研究的方向。
1 物联网信息处理概述
物联网应用领域广泛,通过运用各种无线传感设备、智能嵌入设备、视频摄像设备等采集信息,设备种类繁多且不断变化,信息传输易受外界因素影响,因此物联网信息具有海量、多源、异构、冗余、有噪声、时间序列相关、地理位置分散等特点[2]。数据的组成包括结构化数据(如设备信息、用户信息等)、半结构化数据(如XML数据)、非结构化数据(如图片、音频数据、视频数据等)。因此物联网应用中信息处理需要考虑以下几个关键问题:
(1)信息的数据结构易扩展,满足物联网应用不断发展的需要,能适应数据多源、异构、数据类型多样的特点。
(2)海量物联网数据在有限、固定存储能力的情况下,能够保证信息快捷高效地存储,便于快速决策。
(3)物联网采集数据的设备精度不一致,信息传输也易受外界影响,需要排除数据的冗余和噪声,提高信息的精确性和可靠性。
(4)有利于物联网规模化发展,对传感设备所采集的信息,通过信息处理技术获得多维的特征信息,提高了信息的完整性,支持不同的应用。
2 信息处理技术分析
信息处理的目的是将物联网传感设备所采集的信息,通过建立特定的信息空间,完成信息从输入到具体应用的转换;再经过信息量化,从海量信息中选择与应用密切相关的信息,过滤掉不相关的传感信息,实现信息的选择;最后对信息进行优化处理,从而获得更加准确的目标数据或决策所需信息。目前,物联网信息处理技术研究主要包括两方面,即信息融合和基于云计算的信息处理。
2.1 信息融合
信息融合技术本质上是模仿大脑综合分析信息的过程[3],在物联网中主要解决多源异构信息的整合,消除信息冗余和噪声,提高信息的精确度和可信度,提取可操作的知识,促进不同应用的有效数据分析和挖掘决策。目前,国内外学者对物联网信息融合主要在以下几方面进行研究:
(1)利用数学方法和人工智能理论,将信息融合在数据级融合、特征级融合、决策级融合三个层次上开展;
(2)利用语义技术,将具体应用的物联网感知层原始信息转化为具有语义的结构化数据,使机器可理解和操作;
(3)解决物联网中异构系统集成和互操作的问题。
2.1.1 人工智能理论在信息融合中的应用
文献[4]对数据级融合、特征级融合和决策级融合三类信息融合技术原理、适用领域及技术差异进行了评述,指出了利用人工智能理论进行信息融合过程中存在的问题和挑战。文献[5]在分析信息融合面临的问题与挑战时, 总结了近10年来信息融合技术的进展历程,探讨了未来几个可能的研究发展方向。本文在文献[4,5]的基础上总结了信息融合领域的主要人工智能方法,及在物联网应用中需要解决的问题,面临的挑战和进一步的研究方向。
目前主要的人工智能方法包括贝叶斯估计、证据理论推理、模糊理论、神经网络、专家系统、多Agent理论,这些方法占信息融合算法应用的80%,另外卡尔曼滤波、遗传算法、粗糙集、支持向量机等也有应用。
(1)贝叶斯理论是基于概率论、图论解决不确定性或随机性的信息表达和推理的方法[6],根据经验设定先验概率,求取后验概率,需要收集所有的先验条件概率。概率公式的精度依赖于先验概率假设集的有效性,适用条件比较苛刻,通用性差。
(2)证据理论推理是一种重要的不确定性推理理论,可以处理信息的不确定性和多义性[7],但各证据中的概率分配函数的确定需要人为设定,而证据理论的判别准则没有统一的一般性理论,通用性较差。
(3)模糊理论通过构造隶属函数来描述不完全的、不确定的信息,利用模糊规则库建模进行数据处理。构造隶属函数是人为设计的,同时权重的选择也有一定的主观性,因此,如果选择不当会影响准确性[8]。
(4)神经网络是对人脑神经系统的模仿,具有自主学习新知识和自推理能力,通过神经元节点对大量信息进行融合。从数据容量和处理速度来看,深层神经网络在应对物联网海量数据和处理复杂任务时有更优的效果[9]。
(5)专家系统主要由知识库、推理机、数据库、解释器、接口等组成,专家系统具有并行与分布处理、多专家系统协同工作、自主学习和推理能力,目前大多数智能决策系统都基于专家系统 [10]。endprint
(6)多智能体在分布式人工智能领域有广泛的适用性,多智能体相当于多个“子程序”间的调用[11],可以完成对异构信息的收集、处理和融合。多智能体与粗糙集、神经网络理论结合,是信息融合中重要的智能信息處理方法,具有推理决策能力。
侯可佳等人[12]提出基于贝叶斯分类器的模拟退火算法进行信息融合,提高信息的正确性和完整性。陈景年等人[13]通过构建鲁棒贝叶斯网和利用统计量x2构建贝叶斯网,来删除不完整性数据的冗余属性,提高数据处理的准确率。李艳娜等人[14]将证据理论与本体论相结合,提出了基于证据理论的上下文本体建模及不确定性推理方法,使得推理模型具有自适应性,解决了证据理论产生证据冲突的局限性问题。张秋等人[15]提出一种基于证据理论和模糊算法的多传感器数据融合方法,利用模糊集的隶属函数确定各传感器所测信息的可信度,再通过D-S证据合成,辨别测量精度较高的传感器,以此来提高信息融合精度。宗华等人[16]提出将专家系统嵌入神经模糊推理系统中,专家系统可实现动态调整模糊神经网络的结构,在模糊隶属函数的选择上加入专家系统,实现适应度、隶属度函数的自适应调节,提高了置信度估计模型的可信度、准确度。曹一家等人[17]结合分布式多智能体技术,提出利用多智能体集成感知信息,采用D-S证据理论多智能体集成进行决策级融合,得到最终决策结果,完成大规模电网的故障诊断。
采用人工智能方法进行信息融合解决了面向具体应用的信息处理,在实际应用中可以通过多种智能方法的结合进行信息融合,可以有效规避单一算法存在的弊端,达到更好的信息处理效果。但不同系统应用依然存在信息异构性等问题,对物联网规模化发展还不能实现系统间的信息互操作。
2.1.2 语义技术在信息融合中的应用
语义技术通过语义描述和标记技术实现感知设备信息的描述和处理[18],基于传感数据语义环境上下文进行信息融合,将物联网感知层的原始信息转化为具有语义的结构化数据,使机器可理解和操作;另一方面物联网要实现规模化发展,面对各系统间感知信息的异构和孤立问题,利用语义技术解决异构系统集成和互操作问题。
丁亚飞等人[19]利用语义物联网中的语义协同方法,推理语义节点之间的关系,使语义网络具有自适应性,可自适应服务需求的变化。吴学华等人[20]提出了一种基于多个领域本体及链接开放数据的语义互操作方法,通过为传感器数据添加语义,采用本体实体表管理同一领域本体来规范统一本体,可以较好地实现多领域的语义互操作。Gary Berg等人[21]提出基于认知的自主态势分析Agent体系结构,利用Agent建立多层次本体,从不同的本体模块生成扩展本体的新类别以改进本体,语义技术基于改进的本体论可更好地进行语义推理。
当前物联网中语义技术都是针对具体应用的解决方案,还没有建立不同应用领域的语义模型参考标准,定义的语义结构不同而无法实现不同系统间的信息互操作,物联网要实现规模化发展,需解决异构物联网系统间语义的一致性问题与异构系统的互操作问题。语义互操作是物联网信息处理研究的热点内容之一,用来解决物联网规模化发展中的“信息孤岛”问题。
2.2 基于云计算技术的信息处理
基于云计算的信息处理主要利用虚拟化技术,即利用设备虚拟化、网络虚拟化和云平台虚拟化[22],通过虚拟化设备用不同的信息处理技术对一个传感设备所采集的信息进行处理,得到不同的特征信息,支持不同的应用;通过物联网网络资源虚拟化实现分布式控制传感设备节点,避免单点故障,还可实现传感数据面向多个应用的信息共享。平台虚拟化在以云为中心的物联网中可以为用户不同的应用需求提供数据,用户无需关心数据的融合问题。于心俊等人[23]通过虚拟多传感器数据得到不同特征的信息,采用D-S证据理论对数据进行信息融合,以对粮食存储过程中的霉变、虫害等进行预测。李敬兆等人[24]设计了自反馈BP神经网络算法进行信息融合,在云平台层运用该信息融合算法进行故障诊断,避免了由于单个传感器采集的信息不能完全准确地反映真实状态的弊端。亓开元等人[25]提出利用云计算的核心技术——MapReduce编程模型,解决大规模传感数据和历史数据的数据流实时处理需求同计算、存储能力不足的矛盾,通过数据预处理、分布缓存和复用中间结果的方法进行数据流本地化处理。M'arcio Miguel Gomes等人[26]利用云计算的虚拟化技术构建用于接收和存储过滤数据的中间件,重构物联网的基础设施,通过多线程编程算法,实现物联网的实时通信和资源的可扩展。Mohammad Amin Taherkhani等人[27]提出在云平台上布置Web应用,实现网络资源虚拟化,针对具有私有性的应用设计算法实现信息处理。
利用云计算技术进行信息融合,可以为用户不同的应用需求提供数据,支持不同的应用,还可实现传感数据面向多个应用的信息共享,可更好地解决物联网规模化发展问题。但目前云计算的核心技术基本掌握在微软、Google、Amazon等国外公司,而主流开源平台Hadoop、Nimbus等技术基于Linux平台实现,且我国大多数物联网应用系统是基于Windows平台开发的,因此我国利用云平台实现物联网信息处理依然存在技术挑战。
3 决策技术
物联网应用中依据信息处理过程相应有两个方向的应用系统决策方式,一方面是应用人工智能的方式在进行信息融合的过程中建模,在模型中采用相应的人工智能算法进行决策,或者采用语义技术进行信息融合,构建基于语义上下文的决策模型。另一方面是基于云计算平台,通过构建面向具体服务的信息决策模型实现信息决策。
杨斌等人[28]对物联网海量多维信息按需采集的决策问题进行研究,利用遗传算法对物联网在多重状态下构造网络子网,进行多目标最优化求解建模,以均衡节点信息量和传感网络传输需求,实现按需采集。冯建周等人[29]从语义入手构建物联网本体模型,基于关联数据方法构建以行为关联模型和资源关联模型为核心的物联网语义关联网络,提出一种基于事件的推理算法实现语义推理,从而更好地实现基于语义上下文的智能决策。胡东滨等人[30]将本体技术与云计算技术相结合,构建了基于云平台环境的决策问题分析服务框架,有效提高了基础资源共享和知识的重用性,为决策分析提供服务。徐杨等人[31]构建了基于语义的物联网信息资源描述、推理和应用模型,利用多智能体系统实现从物联网中准确定位具体传感器,实现获取信息、信息融合、信息决策的系统。endprint
目前,物联网应用都是面向具体应用的小规模物联网,对于每一种具体应用需开发相应的应用平台、信息处理和存储系统,物联网规模化发展依然存在系统异构、信息异构的问题。构建开放性平台[32](如facebook),通过开放应用程序的编程接口,将平台上的数据资源开放提供给第三方开发者,将有助于实现物联网规模化发展,应用开放性的平台为多用户提供信息支持和决策将成为物联网的研究热点。
现在主流数据库技术有关系型数据库和非关系型数据库技术两类[33],关系型数据库经过30多年的发展技术成熟,具有强大的信息决策功能,但其数据结构的可扩展性差,物联网数据存储目前主要采用关系型数据库技术。非关系型数据库(如MongoDB)采用数据结构可扩展的数据模式,更适用于物联网中大量文本、图片等半结构化、非结构化数据的存储与管理,非关系型数据库将作为物联网的信息支持和决策技术研究的热点。
4 结 语
本文重点分析了基于人工智能理论、语义技术和基于云计算的物联网信息处理技术,通过对信息处理技术所取得成果的分析,探讨了物联网信息处理研究的热点领域;讨论了物联网应用中依据信息处理过程的信息决策方法及其所取得的成果,指出了物联网信息支持和决策技术所面临的挑战和进一步的研究方向。
参考文献
[1]周开乐,丁帅,胡小建.面向海量数据应用的物联网信息服务系统研究综述[J].计算机应用研究,2012,29(1):8-11.
[2]胡迎新,马新娜,郑丽娟.物联网数据管理研究[J].智能处理与应用,2014,4(4):79-82.
[3]陈科文,张祖平,龙军.多源信息融合关键问题、研究进展与新动向[J].计算机科学,2013, 40(8):6-13.
[4]王洪波.物联网信息融合技术及存在的问题研究[J].计算机应用研究,2013,30(8):2252-2255.
[5]潘泉,王增福,梁彦,等.信息融合理论的基本方法与进展II[J].控制理论与应用,2012, 29(4):599-615.
[6]明安龙,马华东,傅慧源.多摄像机监控中基于贝叶斯因果网的人物角色识别[J].计算机学报,2010,33(12):2378-2386.
[7]李冬梅,林友芳,黄厚宽,等.基于证据理论的本体不一致性度量方法研究[J].计算机研究与发展,2013,50(3):559-567.
[8]曹科宁,王永恒,李仁发,等.面向物联网的分布式上下文敏感复杂事件处理方法[J].计算机研究与发展,2013,50(6):1163-1176.
[9]焦李成,杨淑媛,刘芳,等.神经网络七十年:回顾与展望[J].计算机学报,2016,39 (8):1697-1716.
[10]余国雄,王卫星,谢家兴,等.基于物联网的荔枝园信息获取与智能灌溉专家决策系统[J].农业工程学報,2016,32(20):144-152.
[11]郭清,夏虹,韩文伟.物联网的压水堆CRDM故障信息融合方法分析[J].哈尔滨工业大学学报,2015,47(3):83-87.
[12]侯可佳,黄军,白晓颖,等.一种位置服务测试数据生成技术研究[J].计算机学报,2016,39(11):2161-2174.
[13]陈景年,黄厚宽,田凤占,等.用于不完整数据的选择性贝叶斯分类器[J].计算机研究与发展,2007,44(8):1324-1330.
[14]李艳娜,乔秀全,李晓峰.基于证据理论的上下文本体建模以及不确定性推理方法[J].电子与信息学报,2010,32(8):1806-1811.
[15]张秋,孙顺远,梁小凡,等.基于FS-DS的信息融合方法及其应用[J].计算机工程,2013, 39(5):48-52.
[16]宗华,宗成阁,于长军,等.多传感器信息融合NFE模型的研究及应用[J].电子与信息学报,2010,32(3):522-527.
[17]曹一家,刘毅,高振兴,等.一种大规模电网故障诊断的多智能体信息融合模型与方法[J].电力自动化设备,2010,30(7):14-18.
[18]袁凌云,王兴超.语义技术在物联网中的应用研究综述[J].计算机科学,2014,41 (S1):239-246.
[19]丁亚飞,李冠宇,张慧.语义物联网中基于语义空间的语义协同方法研究[J].计算机应用与软件,2016,33(2):1-6.
[20]吴学华,史一民,李冠宇,等.语义物联网中一种多领域信息互操作方法[J].计算机应用研究,2016,33(9): 2726-2730.
[21] Gary Berg-Cross,Wai-Tat Fu,Augustine Kwon. A Cognitive-based Agent Architecture for Autonomous Situation Analysis[J]. ACM,2007(8):162-167.
[22]王峰.物联网数据处理若干关键问题研究[D].长春:吉林大学,2016.
[23]于心俊,乔瑞林,王艳芳.基于虚拟多传感器信息融合的粮情预警系统[J].自动化与信息工程,2008,29(4):1-3.
[24]李敬兆,邓绘梅.自反馈BP网云计算信息融合算法及应用[J].华中科技大学学报,2012, 40(SI):316-319.
[25]亓开元,赵卓峰,房俊,等.针对高速数据流的大规模数据实时处理方法[J].计算机学报,2012,35(3): 477-490.
[26] M arcio Miguel Gomes, Rodrigo da Rosa Righi. Future Directions for Providing Better IoT Infrastructure[J]. UbiComp14 Adjunct.ACM ,2014,9:51-54.
[27] Mohammad Amin Taherkhani, Ryoma Kawaguchi. An IoT based Parking Reservation Service for Smart Cities[J]. ACM ,2016(5):24-25.
[28]杨斌,李军军,郝杨杨.物联网海量多维信息的按需采集决策问题研究[J].计算机工程,2013,39(3): 111-117.
[29]冯建周,宋沙沙,孔令富.物联网语义关联和决策方法的研究[J].自动化学报,2016,42 (11): 1691-1700.
[30]胡东滨,曾钊伟.基于本体的“两型社会”建设决策问题分析的云服务框架[J].计算机应用研究,2015,32(1): 35-40.
[31]徐杨,王晓峰,何清漪.物联网环境下多智能体决策信息支持技术[J].软件学报,2014,25(10):2325-2345.
[32]陈文艺,闫洒洒,宋亚红.基于MongoDB的物联网开放平台数据存储设计[J].西安邮电大学学报,2016,21(2): 78-82.
[33]李廷力,李宏宇,田野,等.物联网存储模式与方案研究[J].计算机应用研究,2013,30(11): 3201-3208.endprint