基于HMM和BP神经网络组合模型的用水行为识别

2019-09-23 00:30赵太飞谷伟豪马欣媛段延峰
水资源与水工程学报 2019年4期
关键词:准确度用水概率

赵太飞, 谷伟豪, 马欣媛, 段延峰

(1.西安理工大学 自动化与信息工程学院, 陕西 西安 710048; 2.户县农村供水管理中心, 陕西 西安 710300)

1 研究背景

目前,在我国水资源需求量逐渐增加,供不应求的情况下,地下水资源被大量开发和利用,导致了水位下降、水质污染等问题[1]。我国超过一半的人口生活在农村地区,农村居民用水是水资源管理的主要构成。在水资源溃乏并且需求量不断增大的背景下[2],通过研究农村居民用水的行为,揭示居民的用水类型和过程,科学地评估农村居民用水需求,对不合理用水行为采取相应的节水措施,是保障居民用水安全、缓解水资源矛盾的重要方法,对农村地区用水安全和管理有着重要的研究意义[3]。

目前,研究识别居民用水行为的文献较少。文献[4]通过在家中供水设施的关键位置部署少量低成本且易于安装的传感器,使用动态时间规整算法识别居民用水行为。但是,部分用水事件的识别精度比较低。文献[5]在家庭用水基础设施中部署压力传感器HydroSense,通过数据挖掘技术分析用水设施传播到传感器的压力,识别用水行为。但是部署的传感器影响了美观,潜在地增加了成本。文献[6]提出了一个基于web的知识管理系统的设想,该系统可以提供关于如何、何时、何地水的实时消耗信息。文献[7]采用基于决策树的分析工具Trace Wizard跟踪用水流量确定家庭用水事件类别。但是该方法是复杂的模式匹配问题,识别准确度不高,并且耗费大量的时间和资源。文献[8]应用隐马尔可夫模型和动态时间规整算法的组合模型对居民用水行为进行识别。该方法能准确区分具有相似流量模式的用水事件,应用模式匹配算法自动识别居民用水行为。

目前在用水行为识别领域使用的主要技术中,HMM对时间序列的建模能力较强,稳健性好,但是分类决策能力比较弱,需要大量先验知识,自适应能力较差,占用资源较多[11],主要在语音识别领域、故障诊断领域、行为识别领域[9-10]等应用;BP神经网络的分类能力和对不确定信息的描述能力强,其网络的容错性以及鲁棒性极佳[13],但是它对时间序列的建模能力很差,收敛速度慢,有时容易陷入局部最小值情况[14],主要应用在模式识别、图像处理、智能控制、预测等领域[12]。

因此,全面考虑这两种模型在其他领域的运用,将这两种模型的优势结合并提出一种HMM和BP神经网络优点的组合模型[15]。该组合模型具有强大的建模能力、分类性以及适应性强等特点,能更准确地自动识别居民用水行为。本文首先对用水事件的流量数据进行预处理,建立各个用水事件的HMM,在BP神经网络中输入最佳概率,进一步区分类似流量事件的不同行为。BP神经网络的输入是根据Viterbi算法原理推导出最优输出状态的概率,可以使该模型达到最佳识别效果。

2 HMM和BP神经网络的基本原理

2.1 HMM基本原理

由具有一定状态数的隐马尔可夫链和一般随机过程构成的隐马尔可夫模型是一个双重随机过程。对于隐马尔可夫模型,不能直接观察到它的状态转移,但是可以通过观察状态分析隐含状态,因此称之为隐马尔科夫模型。目前该模型已经成功应用于多个领域。可用如下N、M、A、B、π共5个参数来表示一个完整的隐马尔科夫模型[16],其中N为隐含状态数目,M为可观测状态数目。

A=(aij)N×N:隐含状态转移概率矩阵。矩阵A中任意元素aij代表其从初始状态si转移到状态为sj的概率。

B=(bj(k)):观察状态转移概率矩阵。bj(k)是指因隐藏状态sj产生观察状态vk的概率。

π={πi},系统初始状态概率矩阵。该矩阵表示t=1时,在隐含状态下的概率矩阵。

一般可以用λ=(N,M,A,B,π)来表示一个HMM。由于N、M均为定值,所以1个HMM还可以简写为[17]:

λ=(A,B,π)

(1)

2.2 BP神经网络基本原理

BP网络是利用误差反向传播训练算法的神经网络,是前馈型全局逼近神经网络。BP神经网络包括输入层、输出层和中间隐含层,神经元的连接方式在层与层之间是全互连型,在同层之间没有相互联接。BP学习算法的实质是尽可能优化总体网络误差,BP神经网络包括以下两个过程。

(1)输入信号的正向传播。在输入端输入初始信号,该信号分别在不同隐含层被处理,被隐含层处理完毕后送到输出层。输出层检测信号,若检测到的输出与期望不一致,则进入第2个过程。

(2)误差信号的反向传播。反向传播过程中,计算误差信号的值,然后传回误差信号,该信号方向与之前相反,按误差不断减小的原则调整权值,直到网络误差趋向最小。

这种输入信号的正向传播过程和误差信号反向传播过程,就是输入信号在BP神经网络隐含层被处理,并且不断调整和优化每层的权值,也就相当于网络的学习过程。BP学习算法的实质是计算神经网络误差信号的最小值,使用最速下降法,通过分析误差函数的负梯度方向修改权系数。网络每层权值的改变由传播到此层的误差决定,BP学习算法结束依据的标准是误差达到精度要求。

3 HMM和BP神经网络组合模型的建立

参考前人方法的研究基础,全面考虑了HMM模型和BP神经网络模型的优势和不足,使HMM和BP神经网络结合起来[18],将HMM的最佳状态输出概率作为BP神经网络的输入,建立组合模型。首先为居民用水行为的6个事件分别建立一个HMM,使用Viterbi算法分析各个网络模型,然后得出最优输出概率;将HMM的最佳状态输出概率作为BP神经网络的输入,然后将HMM的输出概率和期望的输出做比较训练BP神经网络,在BP神经网络的作用下,HMM模型的分类能力得到很大的提升,使得最终的识别结果更加准确[19]。

具体训练过程如下:

(1)选定HMM的结构类型为左右HMM,对HMM参数进行初始化,并且初始化BP神经网络模型;

(2)选取各个用水事件流量数据,并且对数据进行预处理,训练模型的数据选取约占总数据的4/5,剩余的数据用于验证该算法模型;

(3)为每个类别的用水事件分别建立一个HMM模型并对各个HMM进行训练,对模型的参数进行重估,确定新的HMM参数;

(4)通过Viterbi算法计算各个HMM中最大状态输出概率,在识别过程中,经过Viterbi算法计算,输出6个用水事件的HMM中的最佳状态输出概率,并将此最佳状态输出概率和期望输出输入到3层结构的BP神经网络中进行学习,使网络的实际输出更加接近于网络的期望输出,BP神经网络选择S型函数作为传输函数,使用基于梯度下降的训练算法,综合考虑误差的平方以及权值的梯度下降方法对权值进行修改,以达到BP神经网络的期望效果;

(5)检测BP网络是否收敛,如不达到收敛要求,则继续对BP网络进行训练;否则,执行下一步;

(6)训练好组合模型后,在数据集中抽取测试数据,输入训练好的组合模型中,记录识别结果,并计算识别准确度。

HMM和BP神经网络的组合模型的识别流程如图l所示。

图l HMM和BP组合模型

4 结果与分析

本文以户县庞光镇为研究区域,随机选取一份2015年4月份的用水资料,这份用水资料包含25户样本家庭,通过统计分析这些用户半个月以来的用水情况,得出每个用户的用水行为,将这些用水行为数据统计分类建立一个样本库。训练模型数据就从该样本库选取,大约占总样本数的4/5,剩余的1/5则用于验证该模型。

在数据集中抽取测试数据,输入训练好的HMM和BP神经网络的组合模型中,记录识别结果,并计算识别准确度。将基于HMM和BP神经网络的组合模型的识别结果同单独应用HMM模型和BP神经网络的识别结果进行对比[20],如表1所示。

表1 基于HMM、BP、HMM和BP组合模型的识别率结果对比 %

由表1可知,HMM对于洗浴、洗锅、洗衣服的识别准确度比较低,对这3种事件的识别准确度不高的主要原因是因为这3种事件有一个类似的流量模式,隐马尔可夫模型对于相似模式的事件的识别无法达到最佳。

BP神经网络对相似流量模式的洗浴、洗锅、洗衣服事件的识别结果仍然不高,这是因为这3种事件的流量模式容易混淆,使单一的BP神经网络无法更好地区分识别,因此造成了识别准确度不高的结果。

从表1中可以看出,和传统的HMM、BP神经网络模型相比,HMM和BP组合模型提高了其识别能力的准确度。对于具有不同流量模式的用水事件,如农田浇水、冲厕所、漏水等用水行为,这3个模型都能较好地识别,尤其是HMM和BP神经网络的组合模型,在识别准确度上更高;而对于具有相似流量模式容易混淆的洗浴、洗锅、洗衣服事件,在传统HMM和BP神经网络中无法得到比较高的识别准确度,即便使用HMM和BP神经网络的组合模型,其识别准确度也并未达到比较高的水平。因为在这3种事件中,它们的流量模式非常相似,从而使得其识别准确度无法得到很大提高。从识别结果中可以发现,HMM和BP神经网络的组合模型,其识别准确度比单独应用HMM模型约高8.78%,比单独应用BP神经网络约高8.92%。

从本文的实验结果中可以看出,辨别居民的不同用水行为的分析可以采用HMM和BP神经网络的组合模型,该组合模型的识别准确度高于其他传统模型。两种模型的组合使用,对准确识别居民用水行为,具有重要意义和参考价值。

5 结 论

本文在分析了HMM和BP网络的优缺点的基础上,建立了HMM和BP神经网络的组合模型对居民用水行为进行识别,实现了对6个居民用水事件的识别。该组合模型对于居民用水行为的识别具有较高的准确度。研究结果中可以看出:

(1)HMM模型对于洗浴、洗锅、洗衣服等用水行为的识别准确度低于BP网络模型。

(2)BP网络模型对于农田浇水、冲厕所、漏水等用水行为的识别准确度低于HMM模型。

(3)HMM和BP神经网络的组合模型在用水行为识别准确度上比单独应用HMM模型高8.78%,比单独应用BP神经网络高8.92%。

本方法的实现,对于优化家庭用水需求管理策略,提高当前农村地区的节水行为并改善水资源管理薄弱现状有重要的意义。

猜你喜欢
准确度用水概率
哪些火灾不能用水扑灭?
第6讲 “统计与概率”复习精讲
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
节约洗碗用水
Phosphatidylinositol-3,4,5-trisphosphate dependent Rac exchange factor 1 is a diagnostic and prognostic biomarker for hepatocellular carcinoma
动态汽车衡准确度等级的现实意义
上海建立大用水户用水实时监管制度推进城市节水
对GB 17167实施过程中衡器准确度要求问题的探讨