张庆来 张军 苏云
摘 要:随着物联网技术的发展,城市社区中各类数据量剧增,内容也越来越丰富。文章以华林山社区为例,调研了社区物联网数据分布现状,分析了基于物联网数据的社区管理决策目标,之后提出语义数据融合框架,最后根据框架提出了华林山社区的数据融合方案。该研究成果,对于推进社区的信息化建设,提高管理人员的决策水平具有参考作用。
关键词:社区管理;数据融合;语义网;SSN;SOSA
中图分类号:G202;C916 文献标识码:A文章编号:2096-4706(2021)23-0173-04
Research on Community Semantic Data Fusion Based on Internet of Things Technology
ZHANG Qinglai, ZHANG Jun, SU Yun
(School of Management, Lanzhou University, Lanzhou 730013, China)
Abstract: With the development of Internet of Things technology, the amount of all kinds of data in urban communities has increased dramatically, and the content is becoming richer and richer. Taking Hualinshan community as an example, this paper investigates the current situation of community Internet of Things data distribution, analyzes the Community Management decision-making objectives based on Internet of Things data, then puts forward the semantic data fusion framework, and finally puts forward the data fusion scheme of Hualinshan community according to the framework. The research results of this paper can be used as a reference to promote the information construction of the community and improve the decision-making level of managers.
Keywords: Community Management; data fusion; Semantic Web; SSN; SOSA
0 引 言
隨着社区中物联网数据越来越多,社区管理人员面对大量的数据却很难做出有效决策。数据融合技术可以根据管理人员设定的决策目标,快速对数据进行加工处理,浓缩数据以支持决策。数据融合技术在数据的搜集、加工、判断方面具有独特的优势,而语义网技术则在自动推理、机器互动方面具有一定的专长。本文试图将数据融合技术与语义网技术结合起来,提出语义数据融合方案,用于支持社区管理工作中的有效决策。
数据融合(Data Fusion,Data Aggregation),又称数据聚集,是指对来自多个传感器的数据进行多级别、多方面、多层次的处理,从而产生新的有意义的信息,而这种新信息是任何单一传感器所无法获得的[1]。常见的聚集操作有以下几种,MAX(求最大值)、MIN(求最小值)、SUM(求和)、COUNT(计数)、AVERAGE(求平均值)、MEDIAN(求中位数)等[2]。多传感器数据融合算法主要有加权平均法、神经网络法、Kalman滤波法、贝叶斯估计法、D-S证据理论等[3]。
2017年10月,W3C提出了SSN(Semantic Sensor Network Ontology)本体推荐标准,用于描述传感器、制动器与采样器的工作过程。SSN包括一个轻量级的核心本体叫SOSA(Sensor,Observation,Sample and Actuator),用于描述它的基本类与属性。SSN和SOSA可以描述包括物联网在内的多种应用场景,这为基于物联网技术的语义数据融合提供了基础。
1 社区物联网数据分布与决策目标
1.1 社区物联网数据分布现状
本文选择了兰州市华林山社区作为样本展开相关研究工作,该社区存在监控视频、门禁数据、计量传感器数据、特殊传感器、智能传感器等类型的物联网数据。该社区已经安装了监控系统,可以实现实时图像采集。社区中已经开始使用门禁系统,可以对社区门禁与楼宇门禁实现在线监控与数据统计。部分楼宇开始应用水电气等物联网传感器来搜集数据,已有居民使用智能家电、在线监控等工具。在华林山社区中可以通过传感器采集的数据有:
1.1.1 小区门禁数据
可以来自门禁摄像头的图像识别,可以来自车库的红外线识别,主要提供与车辆有关的信息。可以用来监控车辆情况,包括时间、地理位置、车牌号、收费等数据,进而可以分析拥堵与停车场情况,也可以与驾驶员关联起来,进行行为模式识别。如果小区采用RFID钥匙出入,也可以对社区居民的相关数据进行搜集。
1.1.2 楼宇门禁数据
楼宇门禁主要搜集关于居民出入的信息,主要来自使用RFID钥匙的智能门锁,可以搜集关于时间、楼宇号、房间号、计数(天计数)等方面的数据。楼宇门禁的数据可以用来分析个人行为模式等。
1.1.3 居民活动数据
可以通过搜集小区基站关于手机的信息,主要是基站连接数量等非敏感数据。在经过授权的情况下,可以搜集GPS定位数据、移动轨迹等敏感数据。
1.1.4 计量传感器数据
数据源来自各类传感器如水电燃气、温度等的计量设备。通过数据分析判断特定事件,如水电气异常事件、异常消费等,可以用于事件监控与预警。
1.1.5 视频监控数据
主要来自小区的各类监控摄像头,其中高清摄像头可以进行图像识别和事件识别。
1.1.6 其他数据
包括专门传感器如压力传感器、温度传感器、烟雾传感器、各类气体检测传感器等搜集的数据,还包括未来会广泛应用的智能传感器如个人医疗设备、智能家居设备数据等搜集的数据。
1.2 基于物联网数据的社区决策目标
决策目标的识别是一个动态过程,需要周期性的进行,不断对决策目标集合进行修正。华林山社区中的决策目标集合包括以下几个方面。
1.2.1 事件预警类
事件预警类内容包括:
(1)突发人群聚集事件管理:社区的重大节日,或者传统活动,可能会出现大量人员聚集。根据历年数据,可以对参与人群的规模做出大致预测。如果通过数据分析手段发现异常时,应向值班人员发出预警。
(2)异常行为模式事件管理:通过物联网数据(摄像头、小区门禁)、移动网络数据(地理位置与数量)的统计,可以发现异常行为模式,之后做出预警。
1.2.2 日常监测类
日常监测类内容包括:
(1)常规监测处理:对基于物联网的数据进行建模,能够识别特殊的车辆、人员等,甚至可以识别特殊的事件。
(2)阈值监测处理:对社区内各类计量传感器进行监控,如果传感器数值突破界限即进行预警,此类数值包括最大值、最小值、频度、位置变动范围等。阈值分析可以使用物联网方式监控设备或资源的运行情况,如水电气、通信等。
2 社区语义数据融合框架
2.1 数据融合方式
由于华林山社区地理范围较大,传感器种类较多,传感器数量也相对较多,因此采用分布式数据融合方式比较合适。源节点(又称传感器节点,采集节点)发送的数据经中间节点转发时,中间节点(又称数据融合节点,融合节点)查看数据包的内容,进行相应的数据融合后再传送到汇聚节点,由汇聚节点实现数据的综合[4]。汇聚节点与决策目标相关联,必要的时候,汇聚节点可以给中间节点和源节点反馈调节信息。
2.2 语义数据融合框架
传统的数据融合方法中,从传感器获取数据,要经过数据(像素)级融合、特征级融合与决策级融合[5],在数据级进行数据粒度最小的数据融合,在特征级需要进行数学统计计算完成数据融合,而在决策级必须对数据进行建模分析后,才可以完成数据的融合,触发决策目标。在决策级融合,数据复杂且与决策目标高度相关,语义表达能力与推理能力就显得尤为重要。
2.2.1 传统数据融合与语义数据融合关系
传统数据融合与语义数据融合各有优势,如果能有效结合起来,将能兼顾二者的优点。传统的数据融合适用于相同类型的传感器数据加工处理,如果涉及不同类型的传感器,就需要人工干预,事先决定数据融合的方式与过程。当不断有新传感器类型出现,并加入社区传感器网络的时候,人工干预的方式就会由于工作量大,容易出错而变得效率较低。此时,如果能引入基于语义网的数据融合方式,由于数据的语义描述只需要进行一次,之后的数据融合过程可以由机器自动完成,并可以进行语义推理,效率将会大大提高。
传统数据融合与语义数据融合相结合的过程中,需要决定在哪一级引入语义描述。虽然可以在特征级引入本体描述,也可以在决策级引入本体描述,但数据的语义只有在与决策目标相关联时,语义分析与推理的价值才得以展现出来,在数据级与特征级主要涉及的是数据运算,语义价值并不能得以充分体现。因此,本文拟在数据融合的决策级引入语义描述的方案。
2.2.2 语义数据融合
第一步,采取传统数据融合方法完成数据级与特征级的数据融合。
第二步,采用语义数据融合方式完成决策级数据融合。在这一步中,需要选择合适的本体来描述传感器数据,如果找不到合适的本体就可能需要自行构建本体。如果社区中的传感器数据需要不同的本体来描述,那么还需要完成不同本体之间的集成工作。最后基于本体描述,可以建立推理规则,并采用推理工具进行语义推理,之后将推理结果与决策目标关联。
在这种融合模式中,传统数据融合与语义数据融合存在着分工。传统数据融合负责将来自多个传感器的原始数据完成数据级与特征级的数据融合,之后再由语义数据融合负责完成跨越传感器类型的数据融合,并与决策目标关联。本文提出的数据融合框架如图1所示。
3 社区语义数据融合方案
3.1 本体选择与构建
社区中存在多种类型的传感器,决策目标集合构成也相对复杂。因此,需要考虑社区内可供选择的各类本体规范。与社区管理相关的本体有很多,如RDF、RDFS、OIL、DAML、OWL、SKOS等,这些语言都是遵循XML语言标准,具有良好的语法,支持推理,表达能力强并使用方便[6]。社区的管理涉及多方面的因素,而不同的领域需要不同的本体进行描述,可供选择的本体主要有FOAF、SIOC、ORG、vCard、Event Ontology、SSN等。构建领域本体常用的描述语言是RDF与OWL,但RDF不能很好地支持精确语言关系描述,OWL又过于复杂,介于二者之间的SKOS既可以描述語义关系,又相对简单灵活,适合轻量级的语义关系描述。
3.2 本体集成
基于本体进行数据融合时,通常有三种方法:单本体方法、多本体方法与混合方法[7]。但这种本体集成的思想不适用于SSN,SSN可以通过模块化的方式使用多个本体。在本体领域,本体模块化是一个用来将本体划分成更小单位的通用方法。SSN通过使用owl: import语句,通过集成或映射本体的方式,将现有的多个本体进行合成。
SSN的垂直模块化是将一个本体构建于另一个本体之上,高层本体有方向的使用owl: import语句引入低层模块,SOSA作为核心不引入任何本体。SSN的水平模块化本体有可能互相依赖,所有给SSN提供领域词汇的本体均被认为是水平模块。
3.3 数据描述
3.3.1 传感器数据SSN描述
SSN可以对数值型数据、日期时间型数据、位置数据等进行观测,对数值型数据可以区分不同的计量单位。以下以温度传感器为例,说明SSN对传感器数据的描述过程为:
@prefix rdf: <http://www.w3.org/1999/02/22-rdf-syntax-ns#> .
@prefix time: <http://www.w3.org/2006/time#>.
@prefix sosa: <http://www.w3.org/ns/sosa/> .
@prefix ssn: <http://www.w3.org/ns/ssn/> .
@prefix xsd: <http://www.w3.org/2001/XMLSchema#> .
@prefix qudt-1-1: <http://qudt.org/1.1/schema/qudt#> .
@prefix qudt-unit-1-1: <http://qudt.org/1.1/vocab/unit#> .
@base <http://examplecomminty.org/data/> .
<Observation/202112301> rdf:type sosa:Observation ;
sosa:observedProperty <Building/No.5/Appartment/1201/TemperatureDetection> ;
sosa:madeBySensor <sensor/hlsc123> ;
sosa:hasResult [
rdf:type qudt-1-1:QuantityValue ;
qudt-1-1:numericValue “20.5”^^xsd:double ;
qudt-1-1:unit qudt-unit-1-1: DegreeCelsius ] ;
<sensor/hlsc123> rdf:type sosa:Sensor ;
sosa:observes < Building/No.5/Appartment/1201/TemperatureDetection > ;
sosa:madeObservation <Observation/202112301>, <Observation/202112302>, <Observation/202112303> .
上述文档描述了一个传感器,编号为hlsc123,它进行了三次观测,编号分别为202112301、202112302、202112303,其中编号为202112301的观测对象为Building/No.5/Appartment/1201,类型为温度检测,观测的结果为double型的数值数据20.5,单位是摄氏度。
3.3.2 基于数据融合的SSN描述
SSN基于单个传感器进行语义描述,而传统数据融合是基于多个传感器的。为了解决这一矛盾,可以采取虚拟节点的方法。
首先,采用传统数据融合方式得到多个传感器节点的值,这些数据通常来自同一类传感器。在数据融合过程中需要进行数据级与特征级融合,可能的操作类型有总和、平均值、加权平均、计数、最大值、最小值、挑选随机数等。
其次,在采用SSN描述传感器数据时,将传感器命名为一个虚拟出来的数据融合节点,由传统数据融合的中间结点提供数据级与特征级融合的结果数据,并用comment进行说明:
<Observation/ Virtual_node_hlsc987> rdf:type sosa:Observation ;
rdfs:comment “This is a virtual node composed of hlsc123, hlsc124, hlsc125. “@en ;
最后,描述虚拟节点其他特征。其他特征语义描述与单个传感器节点描述方法相同,但其对应的数据已经是中间结点融合后的统计数据。
3.4 语义推理
在进行基于语义数据融合的决策时,可以利用语义网内置的语义推理功能进行逻辑推理。当前,语义分析与推理多采用Jena开发包来实现。Jena是惠普公司开发的一种使用Java语言的语义Web开发工具,提供了多种类型的推理机,可以为社区中的各类决策目标如事件预警类、日常监测类建立推理规则。
3.5 决策目标关联
基于语义融合的结果数据,既可以构建各类数据分析模型建立与决策目标的关联,也可以根据事先设定的语义推理规则,完成社区管理决策任务。无论采用哪种方式,都可以实现基于物联网数据的机器自动分析和预警,从而提升社区管理能力与水平。
4 结 论
本文基于数据融合方法与语义网理论,提出了社区中语义数据融合方案。数据融合方法存在着一些固有的问题,如封闭问题域、固定推理关系等,语义网技术可以有效地弥补这些缺陷。采用语义数据融合方式来进行社区的数据融合,同样存在着一些问题,如多媒体数据类型的语义数据融合目前没有完美解决方案。随着物联网、语义网等技术的发展,这些问题将会得以解决,从而让社区管理变得更加自动化和智能化。
参考文献:
[1] 何友等.多传感器数据融合算法综述 [J].火力与指挥控制,1996,21(1):12-21.
[2] 李建中,高宏.无线传感器网络的研究进展 [J].计算机研究与发展,2008(1):1-15.
[3] 周鹏.多传感器数据融合技术研究与展望 [J].物联网技术,2015,5(5):23-25.
[4] 唐慧,胡向东.无线传感器网络数据融合研究综述 [J].信息安全与通信保密,2007(7):62-64+68.
[5] 赵继军,刘云飞,赵欣.无线传感器网络数据融合体系结构综述 [J].传感器与微系统,2009,28(10):1-4.
[6] 钱斌.基于语义网的舆情监控系统的设计与实现 [D].兰州:兰州大学,2016.
[7] 王薇.基于关联数据的图书馆数字资源语义融合研究[D].南京:南京大学,2013
作者简介:张庆来(1972—),男,汉族,河北保定人,副教授,博士,研究方向:信息管理與管理信息系统、企业信息化等。