王佳楠,李喜旺,李泽宇,于同伟,李树阳
1(中国科学院 沈阳计算技术研究所, 沈阳 110168) 2(中国科学院大学,北京 100049) 3(国家电网公司东北分部, 沈阳 110180) 4(国网辽宁省电力有限公司 电力科学研究院, 沈阳 110006) 5(国网辽宁省电力有限公司, 沈阳 110006) E-mail :wangjianan15@mails.ucas.ac.cn
随着在互联网领域内的应用愈发成熟,云计算技术正逐渐向其他领域中推广.通过将包括计算能力、存储能力、交互能力等各种互联的计算资源予以有效的整合并进行具有层次结构的虚拟抽象化,云计算能够为用户提供大规模的共享虚拟计算资源[1].本着计算资源服务化的思想,云计算平台能够为各项应用提供按需的计算服务,应用在部署时无需考虑底层的配置方式和系统架构,为集成不同配置需求的应用系统提供可能[2].依靠资源池化、软件定义网络(SDN)[3]、虚拟机状态迁移等平台可靠性保障策略,云平台充足的资源供给和灵活的可用保障使应用在运行时无需考虑其对应底层具体硬件的可用状态.
为满足当前智能电网自动化、网络化建设的需要,在当前的智能变电站系统中,部署了大量的计算控制单元和网络通信设备,用以自动化的实现保护、测控、计量等功能,并为各功能模块提供高速的信息保障.作为一套由各类型计算单元和通信网络组成的计算机系统,智能变电站在实现系统内节点控制和数据通信的同时,还需要完成与远程调度中心的数据交互.因此,为保证智能变电系统的稳定高效运行,既需要使其拥有高效的计算能力,还需要部署稳定全面的可靠性保障措施.
结合云计算技术的系统可靠性优势与智能变电站自身的系统结构.本文提出了一种智能变电站的云技术架构,由云平台统一提供计算资源和配置网络拓扑,通过资源冗余等云技术策略保证系统的可靠性[4],并使用成功流法(GO方法)评估云技术架构在提高系统可靠性方面的优势.
智能变电站是智能电网建设的重要基础,是发、输、变、配、用电和调度等各环节信息交互的关键支撑点,信息交互与处理的能力等自动化水平被不断优化的同时,系统的可靠性也同样成为被研究关注的重点.
2009年国家电网公司正式提出“智能变电站”这一概念,并于2012年将技术建设指导意见重新修订作为正式的国家标准.尽管欧洲国家没有系统提出“智能变电站”这一概念,但是其变电站未来的建设发展趋势同样以IEC 61850标准为指导,向着高效性、安全性、可靠性、可扩展性、易于维护性等多个方面发展[5].
目前,作为包含控制处理终端和数据传输交互两大主要功能模块的计算机控制系统,智能变电站系统可靠性优化策略的制定通常从以上两个方面入手.针对系统控制终端单元的可靠性提升,通过提升工艺水平降低设备故障率的同时,结合冗余配置、优化连接等保护策略,提高功能模块的可靠性,实现对系统可靠性的提升[6].对于系统内通信网络的可靠性提升,则通过优化网络传输策略,设计高可用的通信网络结构,达到提升系统整体可靠性的目的[6].
图1 云架构智能变电站系统架构Fig.1 System architecture of the cloud architecture smart substation
当前的可靠性提升策略单一地从接入冗余设备或提供冗余链路入手,缺乏计算资源共享机制,未能最大化发挥拓展可用资源的效果,在一定程度上造成了闲置资源的浪费.
云架构智能变电站的功能体系结构的设计仍然沿用智能变电站“三层两网”的层次结构,即包括站控层、间隔层、过程层和过程层网络、站控层网络五个部分[5].站控层的主要作用是对站内所有信息进行收集、判断、下发指令,并与远端控制中心交换数据;间隔层汇总本间隔内的过程层实时数据信息,并接收站控层发出的控制信息,起到上传下达的作用;过程层的主要作用是完成模拟量采集、开关量输入/输出等功能.
相较于原有智能变电站的硬件实现方式,在图1中所示的云架构智能变电站的系统架构中,在站控层所部署硬件设施被构成虚拟网络、虚拟服务器、虚拟桌面终端、虚拟存储器为各智能组件提供计算、存储、访问等各项云服务.并将间隔层完全虚拟化,使各智能组件的运行位置由原先的实际硬件设备转为云平台上的各虚拟机,完成对过程层设备的数据采集和指令控制等功能.
在云架构智能变电站系统中,在完成对站控层硬件资源虚拟化的同时,还需设计云平台管理系统负责对整个变电站云平台进行运行监控、资源管理、数据同步以保证平台平稳可靠高效的运行,同时完成汇总上传数据、接收分发控制请求等站控层原有的设计功能.
系统硬件资源的虚拟化采用Xen虚拟化技术实现[6],系统间隔层设备的冗余设置可以直接通过在云平台上对其虚拟机进行备份实现.在虚拟机工作过程中,可能出现系统负载变大导致的服务质量变差甚至宕机的情况.因此,为保证间隔层各智能组件的平稳运行,当出现响应延迟等故障隐患时,将当前工作虚拟机向备份机进行状态迁移实现故障隐患的排除,以提高智能组件的可靠性.
图2 虚拟机动态迁移机制逻辑图Fig.2 Virtual machine dynamic migration mechanism logic diagram
通过引入NFS等共享文件系统机制,避免了由于迁移磁盘存储数据而产生的迁移开销.同时,在原有Xen动态迁移机制的基础上引入了如图2中所示的预测概率模块,降低了内存迁移的时间开销,进一步提高了状态迁移效率.
基于软件定义网络(SDN)能够实现系统中网络资源的动态分配,为设备的灵活接入与拓扑的动态配置提供保证.考虑到智能变电站数据的可靠传输要求,在云平台中网络资源的分配仍采用冗余思想的拓扑设计方式.
文中采用并行冗余协议(PRP)实现网络拓扑的冗余策略[7].该拓扑结构下两个网络相互独立,并且互为冗余,当某一网络中的交换机或链路发生故障时,由于网络结构的独立性,并不会影响另一个网络的数据接收和发送,同时可以实现零延迟的双网切换.由于SDN灵活的网络配置特性,为进一步保证网络结构的可靠性,对于并行冗余协议的两个网络可以根据需要配置除环形拓扑外容错性能更高的网络拓扑结构.
图3中所示的为并行冗余协议中节点冗余的实现方式.其中互为冗余的两个网卡拥有相同的MAC地址和IP地址,而上层应用程序无需为冗余做任何处理.针对冗余网络拓扑结构下出现的重复报文,接收节点基于严格的丢弃窗算法实现对数据帧的接收或者丢弃的决策.
图3 并行冗余协议(PRP)节点冗余逻辑图Fig.3 Parallel redundancy protocol (PRP) node redundancy logic diagram
作为依靠数据通信将各组件节点相互连接构成的网络系统,智能变电站的可靠性评价模型可以采用以数据流轨迹作为评价特征的可靠性评估方式,基于网络的拓扑结构与各节点的可靠性指标,实现对系统的可靠性分析.
作为一种基于系统概率分析的技术,GO法通过图形演绎的形式,以成功为系统导向,将系统原理图、流程图、工程图按照指定的规则转换成GO图[8].GO方法中共定义了17种标准运算符,根据系统中各组件的相互关系,将各组件之间按照相应的运算符进行连接.
使用GO法进行系统可靠性分析需经过如图4所示的分析系统、确定边界、成功准则、建立GO图、输入数据、GO运算、评价系统共七个步骤[9].其中建立GO图和进行GO运算是采用GO方法进行可靠性分析的核心步骤.
图4 GO法分析过程Fig.4 Analysis procedure of GO methodology
在完成GO图构建后,系统可靠性可以通过概率公式法得出,该方法通过推导得出各操作符输出信号流的计算公式,然后按照传递序列依次求解各信号流的概率.对于存在状态0,1,2,…,N-1,N共N+1种状态的信号流,信号流状态值为i的概率为P(i),则对应信号流的状态累计概率A(i)为:
(1)
图5 四类操作符的原理图Fig.5 Analysis procedure of GO methodology
在智能变电站可靠性分析建模过程中,由系统中各智能组件的功能特点可知,需要用到两状态操作符、或操作符、输入操作符、与操作符四种类型的操作符,各操作符的表示符号和输入输出信号的定义如图5所示.则各操作符的累计概率计算公式分别为:
1)两状态操作符
操作符状态概率PC(i),i=1,2;
输出信号概率公式为:
PR(i)=PS(i)·PC(1),i=0,…,N-1
(2)
AR(i)=AS(i)·PC(1),i=0,…,N-1
(3)
2)或操作符
输入信号S1,…,Sn的状态概率及累积概率为:
PS1(i),…,PSN(i);AS1(i),…,ASN(i),i=0,1,2,…,N
输出信号概率公式为:
(4)
3)输入操作符
当有L种状态时,输出信号的状态值记为Ij,则其对应的概率为Pj,其中j=1,2,…,L.
假设各输入信号相互独立,输出信号流状态概率及其累积概率计算公式为:
(5)
(6)
4)与操作符
输入信号S1,…,Sn的状态概率及累积概率为:
PS1(i),…,PSN(i);AS1(i),i=0,1,2,…,N
输出信号概率公式为:
(7)
对于每个操作符,将输入信号的状态概率代入计算公式即可得到对应的输出概率.沿着系统中每一条信号流的传递方向,依次对系统GO图中流经的每一个操作符进行计算即可得到系统最终的输出概率.
本文以220KV的D2-1型配电变电站为例,在保证其原有系统功能架构不变的情况下,对采用云技术架构部署实现后的系统建立GO模型,从而实现对其系统可靠性的评估.该智能变电站共包括2个变压器间隔、1个母线间隔和6个馈线间隔,通信网络的拓扑采用满足并行冗余协议(PRP)的双环形拓扑结构.其详细系统结构如图6所示.
图6 D2-1型变电站系统功能拓扑Fig.6 Functional topology of D2-1 substation system
云架构部署方式下,各智能组件之间的逻辑关系和交互拓扑仍与传统实现架构下相同.其中,站控层的监控主机(HMI)和远动网络(RTU)以及间隔层的保护控制单元(P&C)的功能由云平台中的各虚拟主机实现.交换机(SW)由原先的实际接线设备转换成网络资源云化后的各个逻辑节点,同时,其相互之间的接线方式也可以灵活配置冗余.
图7 变压器间隔模块GO图Fig.7 Transformer interval module GO diagram
在根据系统中各智能组件之间拓扑关系构建GO图时,每个间隔模块可以构建出单独的GO图,由各操作符的相互关系及计算公式可得图7变压器间隔T1的状态概率为:
PS84=PC38PC39PC40PC41PC42PC84PS1PS2PS3PS4PS5
(8)
分别计算各间隔模块的信号流成功率,可获得整个系统的成功率,相同类型间隔模块成功率的计算结果是相同的.
由于环形拓扑存在不多于1条故障链路的冗余,设单条链路的成功率为Pl,则11条环形拓扑链路的成功概率为:
(9)
将各间隔模块的成功率计算结果整合后可以得到操作符1-94处的状态概率PS94:
(10)
为简化系统GO图的构建,图8中仅描述了未加入冗余网络时对系统进行可靠性分析的GO图模型.因此,根据操作符的相互关系和计算公式可以得到当前系统结构下的输出信号流成功率PS101:
PS101=1-(1-PS99)(1-PS100)=PC95PC97PC99PS94+
PC96PC98PC100PS94-PC95PC96PC97PC98PC99PC100PS94
(11)
由于并行冗余协议(PRP)中两个网络的相互独立并能够实现零延迟双网切换.因此在考虑冗余网络后,系统最终的输出信号成功流概率为:
图8 系统整体可靠性GO图Fig.8 GO diagram of system reliability
P=1-(1-PS101)2
(12)
分析云技术架构的冗余切换策略对云平台上部署的各智能组件在可靠性指标上的提升结果,能够得出云技术架构的可靠性优势.将各智能组件不同策略下的可靠性参数代入推导出的GO模型,即可得到对应的可靠性评估结果.
智能变电站元件的可靠性通过平均无故障时间(MTTF)、平均修复时间(MTTR)、可用度(A)、不可用度(q)等参数指标衡量[10].其中有:
(13)
当采用云技术架构实现时,除断路器(CB)、合并单元(MU)以及光纤链路(L)外,部署在云平台虚拟机上的其他智能组件均可以通过冗余备份进一步提高系统的可靠性.各智能组件对应的虚拟主机与其备份主机之间形成并联的关系,因此并联单元的可用度A与各主机可用度Ai之间的关系为:
(14)
对云平台中的各功能主机完成备份主机配置后,各智能组件的不可用度则变为:
(15)
在评价网络的可用度时,对于存在n条链路的网络拓扑结构,且每条链路的可用度为Pl,当网络允许至多有s条链路不可用时,该拓扑结构下网络的可用度为:
(16)
在构建智能变电站可靠性分析GO模型图时,单个网络的各交换机之间采用环形拓扑结构相连,其网络可用度如公式(9)所示.根据公式(16)能够得到在链路可用度Pl固定的前提下,使网络可用度达到最佳时的网络链路数和允许最大的故障链路数,从而获得可靠性最佳的网络拓扑结构,实现基于SDN配置冗余链路提高网络可用度的目的.
表1 智能变电站元件可靠性参数Table 1 Smart substation component reliability parameters
智能变电站系统中的所有节点仅包含可用与不可用两种状态,在对智能变电站系统进行可靠性评估时,GO图中各操作符对应节点的不可用状态概率则为其对应类型单元的不可用度q.因此,在计算不同可靠性保障策略下系统的可靠性时,需要将各节点可用状态的概率rI=1-qI代入所构建的GO模型中,其中I∈{L,SW,MU,CB,P&C,HMI,RTU},计算出整个系统可用状态的概率,即可获得最终的系统可靠性评估结果.
在计算传统PRP硬件冗余策略下的系统可靠性时,根据表1中各类型节点的不可用度qI获得各节点可用状态的概率rI,将其代入公式(8)中即可获得变压器间隔模块T的可用状态概率:
(17)
同理母线间隔模块S与馈线间隔模块F的可用状态概率RS和RF则分别为:
(18)
(19)
将所得的各模块可用状态概率及对应节点单元的可用状态概率代入公式(11)中可得,采用单个网络拓扑结构下系统的可用状态概率为:
RSingle= rSWrLrHMIRring+rSWrLrRTURring
(20)
其中,由公式(10)可得公式(20)中单个环形网络拓扑结构下的可用状态概率Rring为:
(21)
由于所采用的PRP冗余策略中单个网络环形拓扑采用环形网络结构则式(20)中PC94的定义如公式(9)所示.将单个网络拓扑结构下的系统可用状态代入公式(12)中,则得到传统PRP硬件冗余策略下系统的可靠性评估结果.
当采用SDN拓展链路策略时,为系统中环形拓扑结构中的11条链路分别配置1条冗余链路,即网络中包含22条链路,并至多允许2条链路不可用,根据公式(16)重新计算PC94并代入公式,获得可靠性评估结果.
表2 各可靠性策略下的成功概率Table 2 Probability of success for each reliability strategy
由表2中各可靠性实现方式下系统信号流成功概率的计算结果可知.在原有的PRP冗余网络结构的基础上,主机备份策略和SDN配置冗余网络均能够进一步提高智能变电站系统的可靠性.因此,在以上两种策略的共同作用下,本文提出的云架构智能变电站的系统结构具有很高的可靠性.
作为另一种较为成熟常用的可靠性分析模型,故障树模型在评估非串并联系统的的可靠性时,首先通过定性分析,求出故障树的最小割集,并利用最小割集构成的串并联系统等效分析系统的可靠性[14].下面将通过故障树模型对智能变电站系统的可靠性进行评估,以验证所构建的GO模型评估结果的准确性.
将GO图中各相邻串联的两状态操作符进行合并换算获得代表各功能模块故障对应的最小割集,基于文中所构建的GO模型能够构造出如图9所示的故障树模型.因此,系统的可靠性评估则被转换为系统中各最小割集故障事件概率的与或运算,则故障树顶事件如公式(22)所示:
T= (2*(2*TP&C+TMU+2*TCB)+(TP&C+TMU+TCB)
+6*(2*TP&C+TMU+TCB))TRTUTHMI
(22)
将各类元件的不可用度q代入公式(22)中即可求出在传统的可靠性保障策略下,PRP冗余网络结构下单个网络拓扑对应的系统故障概率,将其与公式(11)中的计算结果进行对比,所计算出的系统可用概率结果相同.
图9 智能变电站系统故障树模型Fig.9 Fault tree model of smart substation system
从定量分析和定性分析的结果可知,文中所构建的GO模型与故障树模型所得到的可靠性评估结果完全一致,映证了GO模型分析结果的准确性.相较于故障树模型,GO模型具有建模过程简单、模型提取直观以及易于从系统原理图直接进行提取建模的优势,更加适用于实际的使用.
云计算技术的普及完备,为智能变电站系统架构设计提供了一种灵活高效的解决思路.本文依照智能变电站三层两网的设计标准,提出了智能变电站云架构的实现方式.通过虚拟机冗余备份以及软件定义网络配置冗余链路等方法为系统服务提供可靠性支持.将系统的结构拓扑抽象为GO模型,通过量化的方式进一步论证了云架构智能变电站在具有较高资源利用率的同时,还具有高可靠性的优势.
[1] Zhang Jian-hua,Wu Heng,Zhang Wen-bo,et al.Survey on the core techniques of cloud computing[J].Journal of Chinese Computer Systems,2013,34(11):2417-2424.
[2] Meng Xiang-ping,Zhou Lai,Wang Hui,et al.Applications of cloud computing technology for information processing platform in future smart grid[J].Computer Measurement & Control,2015,23(10):3508-3511.
[3] Zhang Chao-kun,Cui Yong,Tang He-yi,et al.State-of-the-art survey of software-defined networking[J].Journal of Software,2015,26(1):62-81.
[4] Chen Huang-ning,Guo Wen-zhong,Chen Xing.Novel fault-tolerant task scheduling algorithm for cloud computing[J].Journal of Chinese Computer Systems,2016,37(10):2194-2198.
[5] Fan Chen,Ni Yi-min,Shen Hong,et al.Comparative analysis on development of smart substations in China and europe[J].Automation of Electric Power Systems,2015,39(16):1-7.
[6] Wang Tong-wen,Xie Min,Sun Yue-qin,et al.Application of communication network technology in new generation smart substation[J].Electric Power Construction,2016,43(17):45-46.
[7] Pang Ji-wei.Research on communication reliability and real-time performance of smart substation communication network based on cobweb topology[D].Harbin: Harbin Institute of Technology,2016.
[8] Sun Qing-ya,Li Gang,Song Yu.Reliability analysis model for smart substation information flow[J].Computer Measurement & Control,2016,24(2):258-260.
[9] Zhang Bo,Li Xi-wang,Li Guang-ye.Private cloud based on Xen technology[J].Computer Systems & Applications,2016,25(6):75-80.
[10] Li Zhou,Liu Jian,Cheng Zi-jing.Fast network topology discovery method based on parallel redundancy protocol[J].Computer Engineering,2012,38(24):100-104.
[11] Wang Gui-li.System reliability analysis GO methodology and research on the application[D].Harbin: Harbin Institute of Technology,2006.
[12] Yin Zong-run,Mu Xiao-dong.Avionics reliability assessment based on GO methodology[J].Computer Engineering,2009,35(15):272-274.
[13] Hou Wei-hong,Zhang Pei-chao,Hu Yan.Reliability and availability study of the digital substation system[J].Power System Protection and Control,2010,38(14):34-38.
[14] Tao Yong-jian,Dong De-cun,Ren Peng.Uncertainty analysis of system reliability estimate based on fault tree[J].Journal of Tongji University (Natural Science),2010,38(1):141-145.
附中文参考文献:
[1] 张建华,吴 恒,张文博,等.云计算核心技术研究综述[J].小型微型计算机系统,2013,34(11):2417-2424.
[2] 孟祥萍,周 来,王 晖,等.云计算技术在未来智能电网信息处理平台中的应用[J].计算机测量与控制,2015,23(10):3508-3511.
[3] 张朝昆,崔 勇,唐翯祎,等.软件定义网络(SDN)研究进展[J].软件学报,2015,26(1):62-81.
[4] 陈煌宁,郭文忠,陈 星.一种新颖的云计算容错任务调度算法[J].小型微型计算机系统,2016,37(10):2194-2198.
[5] 樊 陈,倪益民,申 洪,等.中欧智能变电站发展的对比分析[J].电力系统自动化,2015,39(16):1-7.
[6] 王同文,谢 民,孙月琴,等.智能变电站继电保护系统可靠性分析[J].电力系统保护与控制,2016, 43(17):45-46.
[7] 庞继伟.基于蛛网拓扑的智能变电站通信可靠性和实时性研究[D].哈尔滨:哈尔滨工业大学,2016.
[8] 孙卿亚,李 刚,宋 雨.面向智能变电站的信息流可靠性分析模型[J].计算机测量与控制,2016,24(2):258-260.
[9] 张 博,李喜旺,李广野.基于Xen的私有云[J].计算机系统应用,2016,25(6):75-80.
[10] 李 周,刘 健,程子敬.基于并行冗余协议的网络拓扑快速发现方法[J].计算机工程,2012,38(24):100-104.
[11] 王桂丽.系统可靠性分析GO法及其应用的研究[D].哈尔滨:哈尔滨工业大学,2006.
[12] 尹宗润,慕晓冬.基于GO法的航空电子设备可靠性评估[J].计算机工程,2009,35(15):272-274.
[13] 侯伟宏,张沛超,胡 炎.数字化变电站系统可靠性与可用性研究[J].电力系统保护与控制,2010,38(14):34-38.
[14] 陶勇剑,董德存,任 鹏.基于故障树的系统可靠性估计不确定性分析[J].同济大学学报(自然科学版),2010, 38(1):141-145.