基于融合GMM与SVM的船载非侵入式负荷识别方法*

2022-11-09 00:51贾东宁

中国海洋大学学报（自然科学版） 2022年1期

贾东宁

(1. 中国海洋大学信息科学与工程学院，山东青岛 266100； 2.青岛海洋科学与技术试点国家实验室，山东青岛 266237)

近年来，随着海洋勘探与海洋开发的迅猛发展，船舶技术也有了突破性的发展，船舶数量与日俱增。在促进资源采集与经济提升的同时，随之也带来了船舶系统经济性与安全性的问题，尤其是船载电力系统的控制问题，成为海洋船舶系统安全与节能的一个关键点。由于船舶内部的电力改造涉及的问题较多，如何实现低成本、低工时、高效益的电力监测与控制成为船载电力系统发展的重中之重，亦是实现船载电力终端与船员之间实时交互的重要支撑[1-3]。该技术的关键在于高级量测体系(Advanced metering infrastructure，AMI)系统及终端技术，智能用电双向互动运行模式及支撑技术，用户用电环境与用电模式的互相影响三个方面[4]组成。而船载负荷监测技术是AMI最为重要的组成部分，是实现用电分析，实现船舶电力安全预警，节能降耗的基础和关键。因此，开展有效的负荷监测方法研究对船舶电力系统的高质、高效发展具有重要的指导意义。

非侵入式负荷监测技术(Non-intrusive load monitoring，NILM)基于传统的侵入式负荷监测方法增加了成本低、便于安装、可接受性良好等优点[5]。主要的实现思路就是通过负荷分解方法，将入户总负荷信息分解为各电器设备信息，进而获取不同电器的能耗情况等用电信息[6]。NILM方法以其经济成本少，实用性强成为国内外研究的热点。NILM的典型过程是在电力入口处安装监测设备，通过监测该处的电压、电流等信号就可以分析得到负荷集群中单个负荷的种类和运行情况[7]。

本文主要就负荷识别技术展开探讨。负荷识别技术主要通过数学优化方法和模式识别方法进行分析。文献[8]应用启发式算法实现稳态电流波形的分解，但该方法分解的电流波形偏差较大。文献[9-10]使用支持向量机(SVM)在低频采样的情况下对负荷种类进行识别，该方法对大功率阻性电器的识别效果较好，但难以识别小功率电器。文献[11]考虑了电器设备在时间上的使用规律，应用因子隐式Markov 模型，简化对负荷电器添加标签的过程，但该方法仅考虑存在开关状态的用电负荷，当负荷种类较多时，该方法识别精度较低。文献[12]将单个周期的电流电压波形表示为V-I图，应用卷积神经网络进行船舶电力负荷种类的识别，得到了较好的识别效果。文献[13]使用k-近邻(k-Nearest Neighbor，k-NN)以及动态模糊C均值聚类对船舶电力负荷种类的识别，实现了对小功率电器约90%的识别准确率。总体而言，基于数学优化方法[14]及机器学习方法相关的负荷识别算法研究已相对较多，但大部分算法均基于单一负荷识别算法进行探究，且涉及负荷种类不多，处理的场景也比较简单。应对复杂场景的综合型识别算法相对较少。因此，为保证在复杂场景下对多类负荷识别的准确性与稳定性，本文提出了一种基于混合SVM/GMM算法的负荷识别方法。应用事件检测过程中提取的有效负荷特征建立识别模型并进行负荷种类的辨识。

1 负荷波形与特征

NILM系统主要依靠安装在用户电力入口处的硬件设备采集用电信息并进行分析处理。本文依靠实验室开发的智能用电采集模块进行电力数据的采集和处理，该模块采样率为4k，可同时采集电流电压数据并完成特征提取工作。通过智能用电采集模块提取3类具备代表性的负荷电流数据进行分析如下。

图1为计算机电流波形。图形上半部分为计算机一个完整运行过程概况。图形下半部分自左至右依次为开启、运行、关闭三段过程的细节波形图。容易看出计算机启动过程需要经过数个工频周期才能进入稳态过程，且计算机通常具备EIST-智能降频等技术，使得计算机的运行电流幅值持续变化。

图1 计算机电流波形

图2为冰箱电流波形，冰箱属于船载电器常用的常开型电器，其启动瞬时电流较大。并且由于其相对特殊的启动方式，开启冰箱时，需要经历数秒的电流变化才能达到稳定状态。

图3为制氧机的电流波形。在制氧机的运行过程中，电流存在周期性的幅值变化，该过程极易被误判为小功率负荷的重复投切。

图2 冰箱电流波形

图3 制氧机电流波形

由于电器种类繁多，不可避免的会出现电流峰值相似的电器。同时，由于部分电器之间的电流幅值相差较大，并且部分电器基本不存在稳定状态，这给电器的识别问题带来了较大的难度。但不同类型的电器由于内部硬件特性的差异，其暂态电流形式会有所区别。为实现负荷类型的准确识别，应从负荷的电流波形数据中提取有效特征，以最大程度描述每种电器负荷的独特性，本文提取包括主峰值(Ipeak)、峰峰值(Ipp)、均方根(Irms)、标准差(Isd)、波形系数(FF)、相位角(PA)、波动倾斜度(Slope)、暂态能量(TE)、暂态平均功率(TP)、单个周期波形面积(Iarea)、三次谐波(TH)和五次谐波 (FH)共计12个负荷特征用于识别。

2 负荷识别算法

支持向量机模型是定义于特征空间上的线性分类器，其学习策略为间隔最大化，可形式化为求解凸二次规划问题，等价于正则化的合页损失函数最小化问题。而核函数的使用，使得SVM成为实质上的非线性分类器。SVM方法具有良好的推广泛化能力，但在用电分析实际应用过程中发现单独使用SVM对提取的特征进行模型训练与测试时，其准确率虽能够保持较高的识别能力，但尚存在可优化的空间。因此，引入具有良好统计分布描述能力的GMM方法，结合两种方法构成混合分类器可以进一步提高单独使用SVM分类器时的分类性能，实现具备更高准确率的分类方法。

2.1 支持向量机(SVM)

给定特征空间上的训练数据集：

T={(x1,y1),(x2,y2),…,(xN,yN)}，

xi∈X=Rn,yi∈Y={+1,-1},i=1,2,…,N。

式中：xi是第i个样本所包含的特征，yi为第i个样本所属类别。假定训练集线性可分。训练分类器的目标是在特征空间找到一个分割超平面，该超平面能将样本特征分割到不同的类别中。通常，当训练数据集线性可分时，存在无穷多个分离超平面可将两类数据正确分离，而为了得到唯一最优解，引入间隔最大化概念求解最优分离超平面。为求解方便，将最大化问题转换为最小化问题，即

s.t.yi(w·xi+b)-1≥0,i=1,2,…,N。

可以看出，上式为一个凸二次规划问题。对该问题求解可得最大间隔分离超平面及分类决策函数。为实现对线性不可分问题的处理，对每个样本点引入松弛变量ξi≥0，使函数间隔加上松弛变量大于或等于1。则约束条件变为

yi(w·xi+b)≥1-ξi。

式中，C>0为惩罚参数，通常由应用问题决定，C值大时对误分类的惩罚增大，C值小时对误分类的惩罚小。此时，将线性不可分的SVM学习问题转换为如下最小化问题

s.t.yi(w·xi+b)≥1-ξi,i=1,2,…,N；

ξi≥0,i=1,2,…,N。

此时得到的SVM模型可对线性分类问题实现较好的分类效果。而对于非线性问题，需借助核函数将输入空间映射到特征空间，使得输入空间的超曲面模型对应到特征空间的超平面模型。如此，分类问题的学习过程可通过在特征空间中求解线性支持向量机来实现。

如前所述，支持向量机本身是一个解决二分类问题的模型，而对于多分类问题，可采用”一对一”或”一对多”策略实现分类模型的建立。本文使用高斯核函数SVM分类器，并结合”一对一”策略实现对多类电器负荷分类模型的建立。识别过程中，待识别的特征样本输入到SVM模型中，输出判别结果在每个类别上的概率分布。SVM算法考虑了学习空间的复杂性，在有限样本中在拟合程度和判别准确率之间折中选择最佳，使其能够实现对未知样本的良好识别能力。

2.2 高斯混合模型(GMM)

高斯混合函数(Gaussian Mixed Model，GMM)指多个高斯分布函数的线性组合，GMM理论上可以解决同一集合下包含多个不同分布的情况。设有随机变量X，高斯混合模型可表示为

式中：N(x|μk,Σk)表示GMM中的第k个分量；πk是权值因子，且满足

高斯混合算法是一种聚类算法，但当每个样本的类别已知时，其模型参数可通过最大似然估计较容易的获得。本文提取用于模型训练的特征通常带有标签，因此可设定样本容量N，K分类的样本为L(k)=N1,N2,…,Nk。有

通过上述过程即可求解GMM模型参数。对每类负荷特征建立一个GMM模型，识别过程中将待识别的样本传入到每一个GMM模型计算对数似然函数，其可表示待识别样本与该类别的接近程度，对所有类别得到的结果做归一化处理，转换为近似概率分布的形式。

2.3 融合SVM/GMM

本文通过融合GMM与SVM的输出结果，实现对待识别样本的判别。通过智能硬件采集模块对电器开关状态进行监测和判定，当识别到电器开关时，将硬件模块提取上传的12种特征数据构成样本特征。为实现样本均衡，在实际用电环境下对每类电器进行同等次数的开关操作，采集特征数据并添加类别标签构建模型训练样本库。训练过程中，使用两种算法分别通过样本库中的特征数据独立进行模型训练，得到支持向量机模型(S-model)和高斯混合模型(G-model)。在识别过程中，分别通过S-model和G-model对待识别样本进行结果预估。将SVM预测结果由输出分类类别调整为输出测试样本在各个类别上的概率分布Psvm。同时，计算待识别样本在每个类别GMM模型上的对数似然函数，得到Fi(i=1,2,…,n)。对Fi进行归一化近似转换为输出测试样本在各个类别上的概率。最终加权融合两类算法输出的概率分布，获取融合算法对待识别样本最终判别的电器类型

3 实验

为验证本文所提方法的有效性，通过智能硬件采集模块采集包括电饭煲、冰箱、笔记本等共计46类电器的开关特征数据进行算法有效性的验证工作。将开和关特征分别作为独立的模型特征库，进行模型训练和测试工作。对每类电器采集同等数量的特征样本用于建模，并进行同等次数的测试以保证结果的均衡性。

参与模型训练的电器主要为船载常用电器，并包括不同品牌的同类电器(以数字区别)。电器额定功率范围约10～1 600 W。电器详细类别如表1所示。

表1 46类电器类型列表

每类电器各采集200组开关数据作为训练样本，每类电器特征数据保存为一个CSV文件构成模型特征库。每类电器进行约80次识别测试。由于当智能硬件采集模块识别到电器开关时才将特征数据上传，且算法本身复杂度较低，因此足以实现基于SVM算法和基于混合SVM/GMM算法的同时判别测试。应用基于RBF核函数的SVM方法进行S-model的训练，通过网格遍历优化得到最优参数设定c=32 768.0，g=8.0。应用GMM方法对每类负荷建模，构建G-model。

建模成功后，通过开关电器实现对模型的测试。记录基于SVM与基于混合SVM/GMM方法的识别情况。为全面的比较分析两种多分类算法的分类性能，除准确率外，引入微平均F1指标与宏平均F1指标。其中宏平均F1指标需先求解每个类别的F1值，再对得到的所有F1值求取算术平均值作为全局指标。而微平均F1指标通过先累加计算各个类别的TP，FN，FP的值，再通过这些累加值求取F1值。通过这两种方式的平均F1值的计算实现对系统整体性能的评测。宏平均F1指标平等对待每一个类别，因此其值主要受稀有类别的影响，而微平均F1指标平等考虑所有测试样本，其值受常见类别的影响比较大。两种算法的性能对比分析见表2。

表2 算法性能指标对比

Note：①Algorithm; ②On-off state; ③Macro; ④Micro；⑤Precision; ⑥Recall; ⑦F-value; ⑧This paper; ⑨On; ⑩Off.

可以看出，应用本文所提混合方法在识别测试过程中，在开关状态下的各项指标均优于单独使用SVM方法，宏观查准率(Precision)平均提高3.91%，宏观查全率(Recall)平均提高3.78%，宏平均在开关状态下平均提高3.85%。微观查准率(Precision)平均提高3.7%，微观查全率(Recall)平均提高3.7%，微平均在开关状态下平均提高3.7%。可以看出，当本文所提方法用于多分类船舶电力负荷识别时，在性能指标上较单独应用支持向量机方法有一定的提高。

4 结语

应用支持向量机与高斯混合模型相结合的方式对船舶电力负荷特征进行分类模型构建。通过对高斯混合模型输出值进行变换，转换为近似的概率分布，与支持向量机得到的概率分布进行融合，实现识别准确率的提升。本文所提方法实现简单，可行性较高, 具有较好的工程实用价值。但该方法过分依赖负荷特征，一旦负荷特征计算偏差较大将导致误判。因此，后续将考虑引入更高效的原始波形处理算法并与当前模型相结合，以进一步提高整个系统的稳定性和识别准确率。