余 锐,郑 亮,熊 俊,陈 愚,陈柏汗,钟 璐
(1.国家电网公司西南分部,四川 成都 610042;2.国电南瑞南京控制系统有限公司,江苏 南京 211106)
随着能源互联网的发展,电力通信设备不断增多,其运行状态对电网安全稳定控制装置的影响逐渐增大,通信设备缺陷分析已成为影响电网安全稳定运行的关键因素。电力通信规模不断扩大,原有的通信设备检修工作方式难以支撑通信设备的大规模投入使用带来的压力,设备多且复杂给检修人员带来了相当大的工作负担,同时也给电网运行带来了一定的风险,运维人员的通信检修水平亟待提高[1-2]。当前通信设备的运维人员在日常工作中也会对所发现和处理的缺陷进行记录,方便日后的查看、统计和分析[3]。但此类方法都是依靠经验进行人为消缺,未对其原因作深入分析,导致检修效率低且不能有效预防缺陷的产生。
数据挖掘技术在电力通信系统多个领域的应用已经日渐成熟。在用大数据进行设备缺陷分析方面,文献[4-7]使用关联规则对电力变压器等二次设备进行了缺陷分析,寻找二次设备的薄弱环节并对诱发薄弱环节的原因进行了探究。文献[8-9]引入了聚类分析理论和层次分析法,从数据挖掘的角度对光伏出力进行了建模,并将其用于含光伏发电的系统可靠性评估。上述研究重点针对电力系统二次设备,探究二次设备的缺陷和影响因素,尚未涉及对电力通信设备缺陷的分析,且研究方法对于通信设备应用的适应性不足。文献[10-11]对电力通信设备的技术和业务进行了介绍,并提出如何优化通信网的相关策略,但对通信检修中,如何快速找到电力通信设备缺陷的影响因素,提高检修速率和减小用户损失,并未作深入研究。现有基于大数据的其他二次设备的研究集中在通信检修和故障分析层面[12-15],但很少有研究对电力通信设备缺陷进行溯源以发掘缺陷规律并提供降低通信设备缺陷发生率的思路,且多数研究使用传统Apriori算法,复杂度高且内存占用量大,不适用于电力通信设备缺陷数据,面对通信设备缺陷时依旧是效率低、损失大。
针对以上问题,本文以同步数字体系(SDH)传输设备的物理模型基础为例,结合设备本身、人为因素、外界环境,并对Apriori算法进行改进,再导入电力通信设备缺陷数据,提出1种基于改进Apriori算法的电力通信设备缺陷关联性分析方法。首先,对整体研究思路进行阐释,然后基于SDH通信设备物理模型,分析通信设备缺陷产生的影响因素与通信设备的缺陷特征;接着,融合关联规则和改进Apriori算法数据模型,提出电力通信设备缺陷关联性分析,对通信设备缺陷进行多维度综合诊断;最后,以当地实际通信设备缺陷数据,对基于改进Apriori算法的通信设备缺陷关联性分析方法的有效性进行验证。
以SDH通信传输设备为例,电力通信设备缺陷关联性分析方法的总体实现框架,如图1所示。首先,对具体通信设备进行建模,通过采集近1 000条当地实际通信设备缺陷数据,包括缺陷类型和影响因素,如E={信号丢失,尾纤中断,过量误码,光功率过载,环境温度变化},并对原始数据库进行有效分析,形成通信设备缺陷多维度影响因素和通信设备缺陷分类图;然后,对缺陷数据库进行编码整合,将缺陷类型以字母分类,影响因素以数字分类,形成由字母和数字构成的数据集800条;接着对Apriori算法进行改进,根据缺陷数据模型,使用关联规则和改进Apriori算法对编码整合的数据进行深入分析,计算出设备缺陷候选项集的支持度,以及影响因素和设备缺陷之间的置信度,找出支持度较高的缺陷频繁项集,并将置信度高的影响因素与缺陷形成强关联,可知信号丢失这类设备缺陷出现次数较多,且多由尾纤中断和光功率过载所导致,因此,在设备状态检修时,重点针对此缺陷类型进行预防性故障排查,并在此类型故障发生后,首先,对尾纤中断和光功率过载等影响因素进行故障检修,从而实现基于改进Apriori算法的电力通信设备缺陷关联性分析方法。
图1 总体实现框架Fig.1 Overall implementation framework
SDH是1种将复接、线路传输及交换功能融为一体并由统一网管系统操作的综合信息传送网络,SDH传输设备抽象成逻辑存在即是SDH网元,其传送网可分为3层:电路层、通道层和传输媒质层。其中,电路层是面向业务的,可直接为用户提供通信业务SDH的业务承载,通道层可进一步分为高阶通道层和低阶通道层。高阶和低阶通道层易产生过量误码和轨迹标识失配等缺陷。传输媒介层中的段层又分为复用段和再生段,其中复用段MST设备易产生过量误码等远端缺陷,而再生段RST设备易产生信号丢失和帧丢失等缺陷。
SDH传输设备的缺陷与一些模块有密切关系,其中包括光模块和光纤收发器。光模块的作用就是发送端把电信号转换成光信号,通过光纤传送后,接收端再把光信号转换成电信号。而光纤收发器是1种将短距离的双绞线电信号和长距离的光信号进行互换的以太网传输媒体转换单元,光纤收发器一般应用在以太网电缆无法覆盖、必须使用光纤来延长传输距离的实际网络环境中,同时在帮助把光纤最后1 km线路连接到城域网和更外层的网络上也发挥了非常大的作用。
电力通信设备告警、缺陷通常由多种因素引起。通过采集通信设备缺陷数据,分析诱发通信设备缺陷的关键因素,建立电力通信设备多维度影响因素体系。
根据SDH传输设备模型,分析其性能和运行参数,以及设备在不同通道层易产生的缺陷,发现电力通信设备多维度影响因素通常可分为外部因素和内部因素2个方面。外部因素包括环境温湿度变化、光纤线路质量、人为操作不当、防震防尘条件、极端自然灾害等。其中人为操作不当多为光纤方向接错和时钟源参数设置错误。内部因素是指引发告警缺陷的设备源发性因素,包含了设备投运时长、光功率过载、网络层报文出错、设备厂家类型、设备负载程度等一系列因素。
电力通信设备有多种缺陷,这些缺陷可分为信号丢失、帧丢失、过量误码、轨迹标识失配、指针丢失、时钟失效、信号劣化、链接失效等等,如果不进行及时的通信检修,这些缺陷会引发严重的故障,给电网和用户造成巨大的损失。
关联规则(Association Rules)能够反映事物之间的相互依存性和关联性,如果2个或多个事物之间存在一定的关联,通过数据挖掘出其相关性,并分析内在的原因,进而可以快速找出导致该结果最可能的原因或者从原因预测出结果。
如果对于1个数据集,项(Item)指分析数据中的1个对象,项集(Itemset)就是由若干项构成的集合,每1条缺陷数据记录就是1个项集,记为I={I1,I2,…,In}。其中Ii表示缺陷数据中每1个缺陷元素或影响因素。关联规则表示为A⟹B,其中A∈I,B∈I,且A∩B≠∅。本文A对应于通信设备缺陷的影响因素,B则表示通信设备的缺陷。评价1条关联规则的优劣有2个重要的指标,即支持度(Support)和置信度(Confidence)。支持度为某项集在数据集中出现的频率,置信度则表示关联规则的可靠程度。
对于1个项集I,影响因素A和设备缺陷B是其中的2个子项集,对于1条关联规则A⟹B,关联规则A⟹B的支持度如式(1)所示:
(1)
式中:count(A∪B)表示影响因素A项集元素和缺陷B项集元素同时出现的数量,count(dateset)表示所有缺陷记录的数量。
关联规则A⟹B的置信度如式(2)所示:
(2)
式中:count(A)表示影响因素A项集元素在数据库中出现的数量。本文计算影响因素A和缺陷B形成的关联规则的支持度和置信度,若都满足所设定的最小阈值,这一对影响因素和缺陷即可形成强关联。
Apriori算法的核心思想是自连接和剪枝。其算法过程依赖算法的2条性质,即:1)频繁项集的所有非空子集也必是频繁项集;2)非频繁项集I的项集中添加事物A,则新的项集I∪A也一定不是频繁项集。
然而算法过程存在不足之处,从候选项集到筛选频繁项集,需要频繁扫描数据库,时间复杂度高,内存占用量大。现对算法进行改进,从而更快分析电力通信设备缺陷数据。首先对缺陷数据进行分层处理,分为通道层和传输介质层,其中通道层再细分为低阶和高阶,而传输介质层中的段层再分为复用段和再生段。接着对设备缺陷数据库进行预处理,映射成仅含有“0”、“1”元素的矩阵,即布尔矩阵。矩阵行表示1条缺陷数据,列表示缺陷分类和影响因素;若bi×j=1表示缺陷j出现在第i条数据中,若bi×j=0表示缺陷j未出现在第i条数据中,由此以“0”、“1”元素组成矩阵B,生成通信设备缺陷布尔矩阵。例如,现有5条设备缺陷记录,对应5种设备缺陷,分别为信号丢失、帧丢失、轨迹标识失配、指针丢失、信号劣化,每条记录存在对应缺陷即为1,否则为0,由此可形成5×5的布尔矩阵,如式(3)所示:
(3)
式中:A、B、C、D、E分别为5种设备缺陷对应的编号。
对Apriori算法进行改进,具体为,电力通信设备缺陷布尔矩阵B每列缺陷项并集产生候选频繁C-1项集;统计布尔矩阵B每列“1”元素出现的次数,进行剪枝操作,即若j列“1”元素出现次数Sj≤n×a%,删除布尔矩阵该列,即删除该缺陷项,产生频繁L-1项集;再对频繁L-1项集进行连接操作,即布尔矩阵B缺陷项列进行逻辑“与”运算,产生候选频繁C-2项集。例如针对上述矩阵,最小阈值设为20%,即Sj≤1时,删除矩阵E列,即信号劣化缺陷,再对新矩阵进行逻辑“与”运算,得到如式(4)所示:
A B C D AB AC AD BC BD CD
(4)
式中:AB、AC、AD、BC、BD、CD为对新矩阵的对应列进行逻辑“与”运算得到的缺陷列。
再对候选频繁C-2项集各子元素的“1”与设定的最小阈值进行比较,若不满足则删除,更新频繁L-2项集。依次下去进行剪枝和连接操作,直到更新到L-k项集。改进算法实现过程如图2所示。
图2 改进Apriori算法流程图Fig.2 Flowchart of improved Apriori algorithm
为了使通信设备的缺陷管理水平得到提高,就要对通信设备缺陷进行及时的分析和处理,当电网的通信设备出现异常时,需要工作人员发现其异常,并对缺陷信息及时记录,电力生产系统对各种通信设备的缺陷信息进行管理。若只分析数据本身的含义,在实际运维过程中通信设备运行产生的数据量大,有些数据冗余且不具代表性,得不到太多有用的价值。因此,本文采用关联规则对电力通信设备缺陷进行关联性分析,将原始数据编码整合后,导入改进后的Apriori算法,结合通信设备模型与改进后Apriori算法模型提出基于改进Apriori算法的通信设备缺陷关联性分析方法。
分析缺陷规律需要获取有效且具有代表性的特征数据构成项集。根据上述多维度影响因素、缺陷特征分类、通信设备模型分析可知,引起缺陷的影响因素和缺陷分类这2个数据量是分析设备失效、缺陷规律的必需元素。由此可构建缺陷关键因素集合,如式(5)所示:
DR={Dm,Fn,Mi}
(5)
式中:Dm为缺陷的分类;Fn为导致缺陷的多维度影响因素;Mi代表数据来源地。
基于得到的某地缺陷数据,筛选出缺陷关键因素集合DR,再利用改进Apriori算法获取频繁项集,从而得到所需要的关联规则。为分析产生规律并提出关联性分析方法,需要获取以下强规则,如式(6)所示:
R:Fn⟹Dm
(6)
式中:R规则表示影响因素与缺陷的关联关系,用于分析何种影响因素导致了何种缺陷,以产生缺陷规律。所提出的基于改进Apriori算法的电力通信设备缺陷关联性分析模型如图3所示。
图3 基于改进Apriori算法的电力通信设备缺陷关联性分析模型Fig.3 Correlation analysis model of power communication equipment defects based on improved Apriori algorithm
为验证提出的基于改进Apriori算法的电力通信设备缺陷关联性分析方法的有效性,收集某地区的电力通信设备缺陷数据进行实际算例的仿真,利用改进后的Apriori算法分析通信设备缺陷数据。
对收集的通信设备缺陷进行整理归纳,得到800条有效缺陷集合。归纳得出主要缺陷类型8类,包括:信号丢失、帧丢失、过量误码、轨迹标识失配、指针丢失、时钟失效、信号劣化、链接失效;影响因素则主要包含9类,分别为尾纤中断、光功率过载、网络层报文出错、环境温度变化、设备运行时长、设备制造参数、环境湿度变化、极端自然灾害、设备负载程度。对样本数据进行编号,其中,尾纤中断、光功率过载等9类影响因素用1~9进行编号,而信号丢失、帧丢失等8类缺陷用A~H进行编号,每1条数据如E1={A,1,C,D,3,6}。采取改进后Apriori算法的电力通信设备缺陷关联性分析方法对收集的缺陷数据进行分析。将每条记录中的设备缺陷和影响因素通过编码映射成布尔矩阵,由于样本集数据量较大,设定改进Apriori算法的最小支持度阈值和最小置信度阈值分别为10%和50%,经过频繁项集的循环自连接与剪枝,可得到频繁项集,并根据置信度指标挖掘强规则。
将上述类似E1的数据集导入改进后的Apriori算法,通过计算字母编号的支持度形成设备缺陷的频繁项集,计算字母与数字编号之间的置信度得到设备缺陷与影响因素之间的关联关系,如A与1+2之间的置信度较高,则可形成1+2⟹A的强关联,及尾纤中断+网络报文出错⟹信号丢失。根据频繁项集挖掘的强规则共有23条,从中筛选出可供分析缺陷机理及提出关联性分析方法的满足最小阈值条件的有效强规则共有13条,得出结果见表1。
根据表1计算得出的支持度和置信度,可以分析得出何种缺陷类型多发且多由何种影响因素导致,可构建电力通信设备缺陷数据规则库,如图4所示,数字表示强规则的置信度。
图4 通信设备缺陷数据规则库Fig.4 Rule base of communication equipment defects data
根据规则库,可针对当地电力通信设备状态检修及故障检修,给设备运维人员提出参考意见及建议:
1)根据电力通信设备缺陷数据规则库对发生的设备缺陷进行溯源分析,找到该缺陷对应的影响因素,由于置信度高代表该规则可靠性高,即此类影响因素更可能导致此类缺陷,应优先对此类影响因素进行诊断。例如在发生信号丢失或帧丢失时,应监测尾纤、光功率和网络报文质量,运行光纤收发器及光模块的自诊断功能;在状态检修时,可以针对无线信号质量与软件运行状态关键影响因素进行预防性故障排查,以减少信号丢失和帧丢失缺陷的产生。
2)在日后的运维过程中采取手段避免此种影响因素的发生,从而降低缺陷率。支持度高的缺陷和影响因素代表某种缺陷多发且具有规律性可循,可采取预防性措施提前找出对应缺陷的影响因素,在日后的运维过程中安排巡查检修,避免此类缺陷的发生,从而降低缺陷率。例如过量误码及轨迹标识失配多因环境温度变化和设备运行时长,应及时对周围环境温度进行检测,若不在设备正常运行范围内,必须及时做出调整措施,对设备运行状态也应及时检查,过度使用的设备应立即更换。应当针对该缺陷问题提高运维人员的专业能力及意识。
3)如果是单个缺陷产生,例如只有帧丢失或轨迹标识失配,应当对置信度极高的尾纤中断、光功率过载或环境温度变化、设备运行时长进行检测,若还掺杂着其他缺陷,则应对同时导致这些缺陷的另加原因进行重点防范。
本文将800条数据记录映射成布尔矩阵,通过设置最小支持度阈值,分别运用传统Apriori算法和改进Apriori算法对样本进行关联性分析,改进Apriori算法有效减少了候选项集的遍历次数,高效找出缺陷频繁项集,大大降低了时间复杂度和内存空间,比较结果如表2所示。
表2 时间复杂度比较Table 2 Comparison of time complexity
1)本文所提方法可以分析电力通信设备缺陷产生规律,找到导致设备缺陷的重要影响因素并形成强关联,在预防性状态检修及故障检修时,可重点预防信号丢失、帧丢失等主要缺陷,并当缺陷发生后,优先排查尾纤中断、光功率过载等影响因素。
2)改进后的Apriori算法大大提高程序运算效率,节约内存容量,自关联性分析方法适合于大量电力通信设备缺陷,仿真实例验证了本文方法的有效性,为优化通信检修提供策略,确保电网安全稳定运行提供保障。