俞佳莺
(上海电子信息职业技术学院,质量管理处,上海 201411)
智能电网可以促使电网信息数字化,通信平台网络化,帮助电网管理人员管理电网数据信息,降低电网数据管理难度。但是,电网数据在传输过程中,会出现重复传输同一个数据,保留多个相同数据副本等现象,影响电网管理人员及时调整电网运行状态。为此,国内外对数据传输冗余校验进行了研究,例如,郭经红等[1]基于输电设备生产管理已经具备了从数字化,可视化向智能化迈进的基础,结合输电设备状态监测数据传输系统建设的具体需求,研究了适用于输电线路状态监测的传输冗余校验方法,并给出了通信系统的典型设计方案;冷喜武等[2]为了支撑设备监控与运维的数据分析与决策,方便对各级调控主站及厂站数据进行抽取,并及时应对实时、复杂变化的电网运行环境,对数据规范、数据集及混合计算技术进行分析,最后研究出了基于大数据的数据传输冗余校验方法;Lu Qiang等[3]考虑到城市电力数据复杂性和数据量的不断增加使电力管理者对供电形势的理解和分析产生了严重阻碍,为改变这一局面,其设计了一种基于电力数据进行交互式分析系统,以降低了解传输冗余数据的难度。尽管诸多学者都对此进行了研究,但是上述技术存在系统动态校验智能电网数据传输冗余存在较高的误判率,运行速度较为低下的问题,不利于对智能电网数据传输冗余进行分析和处理[4]。
为了解决上述问题,本文将关联分析技术[5-6]引入智能电网数据传输冗余检测领域,利用关联分析技术,分析冗余数据之间的关联性,关联分析技术可以发现存在于大量数据集中的关联性或相关性,从而对一个事物中某些属性同时出现的规律和模式进行描述,具有强大的分析能力,有利于提高数据传输冗余动态校验正确率和速度。设计基于关联分析的智能电网数据传输冗余动态校验系统的软件和硬件,以完成对智能电网数据传输冗余的动态校验。最后经过实验证明本文系统的有效性。
考虑系统动态校验时需要采集智能电网传输的数据,设计此次研究的智能电网数据传输冗余动态校验系统硬件框架,如图1所示。
图1 动态校验系统硬件框架
由图1可以看出,此次设计的系统硬件主要可以分为2个部分:智能电网传输的数据采集模块和数据传输模块。其中数据传输模块为合并单元,主要负责整合数据采集模块中的USB-6211数据采集卡,采集智能电网传输数据,并将整合的数据信息传递给系统软件,以检测冗余数据。
此外,标准源通道指的是对智能电网传输数据采集、传输的硬件通道[7-8]。其可以在系统进行智能电网数据传输之前将数据存入内存中等待软件校验,避免由于干扰,导致在数据传输过程中产生冗余数据校验错误的问题[9-11]。而且从上述分析可以看出,此次设计的系统主要硬件为系统数据采集模块硬件和合并单元模块硬件2部分。
设计系统的数据采集模块利用多个USB-6211数据采集卡以对智能电网数据传输的多个路径进行同步采样[12]。但是,为降低采集到的数据合并难度和数据冗余动态校验难度,多个USB-6211数据采集卡的时钟信号来自同一时钟信号源,其智能电网传输数据同步采集示意图,如图2所示。
图2 智能电网传输数据同步采集
由于设计系统采用了多个USB-6211数据采集卡,极易出现系统本身导致的数据冗余问题,为此,设计合并单元模块,整合多个USB-6211数据采集卡,采集智能电网传输数据,其模块组成如图3所示。
图3 合并单元模块组成
从图3可以看出,此次设计的合并单元模块硬件,能够控制多个USB-6211数据采集卡。该硬件在采集信息时使用同一个电路和时钟,且每秒都会向合并单元发送脉冲时钟信号,以保证数据采集卡同时工作。当合并单元接收到智能电网传输数据时,会将数据传递至系统的网络通信模块,让所有数据按照设定的通信协议组成数据集,传递给系统软件以动态校验数据冗余情况。
在硬件设计的基础上,还需要完成系统软件设计。此次采用关联分析技术确定智能电网数据传输过程中存在的冗余数据规则,并根据智能电网数据IP属性计算并对比所有数据的重要属性,判断数据重要属性的相近度,再设定相近度的值区间,作为数据冗余的判断依据。设计系统将相近度的值区间设定为[0,1]。属性越相近的2个其相近度的值越大[13-14]。其中,0代表2个数据之间完全不相同,不属于冗余数据;1代表2个数据完全相同,属于冗余数据。根据上述分析,智能电网传输数据重要属性相近度规则运算流程如图4所示。
由图4可以确定智能电网传输数据重要属性相近度规则如下。
图4 数据重要属性相近度规则运算流程
1.智能电网传输数据IP地址相近度规则定义。目前智能电网数据IP地址主要由4部分构成,所以需要分别对IP地址的各部分进行计算,从而得到IP地址的总体相似度。为此,假设第i条部分数据的相近度为ai;IP地址中每一部分的相近度为s(ai};IP地址总相近度为s(IP};则有式(1)。
(1)
为证明此次设计系统的有效性,将采用对比实验的方式对不同系统进行对比。此次系统测试实验,选择某区域变电站的智能电网数据作为此次实验的研究对象,选择Windows XP驱动,作为此次软件实验操作环境。并将设计系统,记为A系统;文献[1]、文献[2]中出现的系统记为B系统和C系统,从而对比3组系统的可靠性。
此次实验选择的变电站选择智能电网数据传输方式,具有较高的可靠性、较低的建设费用和较快的传输效率,其原理是多频率搬移、频率分割,促使智能电网实现多路通信。基于此次实验选择的Windows XP实验操作环境,设计实验运行环境,如表1所示。
表1 实验运行环境
利用设置的实验参数进行第一组实验,对比3组系统的数据传输冗余误判率。将此次智能电网传输的数据集合的数据个数,设为10×103、20×103、30×103、40×103、50×103、60×103、70×103、80×103、90×103、10×104,每个数据位组的大小为10×104。采用上述设置的实验数据大小和数据个数,让3组系统分别动态校验智能电网在数据传输过程中产生的数据冗余,并检查3组系统动态校验结果,计算系统动态校验结果误判率E,其计算式如式(2)。
(2)
式中,N表示误判个数,O表示智能电网数据传输个数。采用式(2)计算后,得到的实验结果如图5所示。
图5 智能电网数据传输冗余动态校验误判率
由图5可以看出,初始时,3组系统智能电网数据传输过程中产生的冗余数据动态校验误判率为0。随着数据个数的增加,B系统动态校验智能电网数据传输过程中产生过多冗余数据,效果最差;C系统动态校验智能电网数据传输过程中产生的冗余数据,效果虽然强于B系统,但也出现了一定的误判率,且随着数据个数的增加,动态校验结果的误判率也达到0.13%,误判率较高;只有A系统的误判率并未随着个数的增加出现明显的变化,甚至当数据个数达到10×104时,误判率也仅仅达到0.005。由此可见,此次设计系统具有较低的动态校验误判率。
对比3个系统智能电网出现的数据传输延时。将智能电网数据传输的节点半径设定为100 m、150 m、200 m、250 m 4个档次,分析数据传输冗余校验过程中产生的数据传输延迟时间,对比结果如图6所示。
图6 数据传输延时影响
由图6可以看出,随着传输节点半径的增加,3个系统对智能变电站数据传输延时的影响在逐渐降低。但是C系统对智能变电站数据传输的影响最大,在初始时,就具有较高的延时性,且随着半径的增加,依然存在较大影响;B系统和A系统对智能电网数据传输的影响极为接近,但B系统在动态校验智能电网数据传输冗余时,会影响每一个节点数据传输的距离,从而导致智能电网传输数据时出现较大的延迟。由此可见,此次设计系统动态校验智能电网数据传输冗余时,对智能电网数据传输的影响最小。
进一步对比3组系统动态校验智能电网数据传输冗余稳定速度。基于上述实验设置的动态校验数据和数据传输节点半径,增加第一组测试3组系统的测试轮数,对比3组系统动态校验智能电网数据传输冗余速度,判断系统的最大稳定动态校验速度,从而确定系统的最大稳定速度,对比结果如图7所示。
图7 系统动态校验稳定性
由图7可以看出,在第一轮动态校验测试时,3组系统动态校验智能电网数据传输冗余速度较为一致,但随着测试轮数的增加,3个系统动态校验智能电网数据传输冗余速度逐渐出现差异。可以发现B系统趋于稳定时动态校验速度仅有14 m/s,动态校验速度最慢;C系统虽然强于B系统,但当系统动态校验趋于稳定时,动态校验速度仅有16 m/s,动态校验速度相对较慢;而A系统趋于稳定时动态校验速度已经达到19 m/s,具有较快的稳定运行速度。由此可见,此次设计系统具有较高的动态校验速度,且系统依然处于稳定运行状态。
综上所述,此次设计系统充分利用关联分析技术对数据关系的分析能力,提高了动态校验智能电网数据传输冗余的精确度和速度,动态校验速度可达到19 m/s。但此次设计的智能电网数据传输冗余动态校验系统未考虑智能电网数据传输的复杂度,因此还需要深入研究,以进一步提高智能电网数据传输冗余动态校验系统的实际应用效果。