面向电工装备智能监造的边缘缓存策略

2022-06-02 06:35沈维捷熊汉武蔡冉冉
计算机与现代化 2022年5期
关键词:监造电力公司电工

李 凌,陈 曦,沈维捷,熊汉武,蔡冉冉

(1.国网物资有限公司, 北京 100120; 2.国网信息通信产业集团有限公司, 北京 100052; 3.国网上海市电力公司, 上海 200122;4.国家电网有限公司物资部,北京 100031; 5.华北电力大学电气与电子工程学院, 北京 102206)

0 引 言

工业互联网已逐渐成为制造业领域发展的新趋势[1],并进一步推动了国家电网公司的智能化运营。电工装备智慧物联平台的建设有利于助力企业提升制造品质,为我国通过智能制造加快实现高质量发展奠定更坚实基础。

然而随着电工装备供应商接入数目的增加,基于云中心进行的集中式电工装备数据采集与处理方式无法满足未来电工装备智慧物联业务的发展需求,在海量数据集中上传云中心平台过程中将占用核心网过多的通信带宽资源,进而引起网络拥塞并产生较高通信时延,致使部分时延敏感型业务的通信需求难以得到满足。为了解决上述问题,边缘计算在电工装备智慧物联中的应用研究开始得到关注[2-4],国网公司可以通过租用电信运营商的边缘计算与通信资源,通过将部分业务的计算交由部署在靠近工厂用户侧的边缘服务器执行,有效降低了电工装备数据计算时延[5-7]。然而,电工装备智慧物联的信息分发机制也亟待优化。当工厂用户需要请求信息内容时,由于电力内容分发网络(Content Delivery Network, CDN)或者远端电工装备智慧物联子平台主要部署在省级、地市级的调度中心,并且信息分发依赖核心网,导致请求与下载数据依旧会造成较高通信时延[8-10]。

边缘缓存作为边缘计算技术应用方式之一,通过将部分热门数据缓存在网络边缘,有效减少数据回传时间,实现工厂用户与边缘服务器业务请求数据回传流程的优化[11-12]。目前,对于边缘缓存的研究主要是基于电信运营商服务的角度在满足一定时延要求下,去优化网络服务收益、提升数据缓存命中率[13-20]。针对工厂用户信息请求与内容分发效率优化问题,本文基于电力公司角度,以电力公司服务收益最大化为目标,提出一种面向电工装备智能监造平台的边缘缓存策略。通过综合考虑时延与数据热门度指标,保证部分时延通信需求高而较低热门度数据能够被缓存的同时,实现电力公司提供缓存内容服务收益的最大化。

1 相关工作

为解决由于用户访问量大、热门内容被重复访问等带来的网络拥塞、响应时间长等问题,电力内容分发网络应运而生。电力CDN将代理服务器部署在应用层,将相关内容发送给临近的代理服务器,从而降低传输时延、提高响应速度、节省数据网络骨干网带宽[8]。文献[8]基于现有电力通信系统架构及电力数据传输网络,针对电力通信业务的时延和CDN承载问题,提出了二级网络架构3层存储架构的电力CDN。文献[9]将CDN预取技术进行分类,分析、对比不同分类方式以及各种评价标准的优缺点,提出了融合新型网络与技术的CDN预取的研究方向。文献[10]针对电力系统用户请求的并发流量涌现问题,提出了电力CDN实验平台的逻辑架构、网络架构以及平台部署方案。虽然,电力CDN一定程度上解决了电力通信系统中数据传输时延问题,但内容分发节点部署在少量省、市级数据中心,相对于用户较远,信息分发速率较低,且不具有内容处理的计算能力。

在电工装备供应商接入数目和业务不断增加的背景下,越来越多的时延敏感型业务不断涌现,电力CDN难以满足需求。边缘缓存的出现为其提供了解决思路。目前,针对边缘缓存的研究主要体现在有限缓存容量中数据缓存命中率的提升上。文献[11-15]针对现有中心式网络架构下通信时延或可靠性问题,分别提出了一种基于用户感知的D2D(Device to Device)协同缓存策略。文献[16]针对较小区域内用户信息共享程度不足的问题,基于用户关系提出了一种MEC协作、用户辅助缓存的联合缓存策略。文献[17]在分析工业用户请求分布特点基础上提出了一种考虑用户请求动态变化的缓存替换算法。文献[18-20]分别提出了根据移动用户的历史访问数据和通过隐语义模型获取用户对不同内容的兴趣,去预测未来内容的热门变化情况以决定缓存决策。文献[21-22]则基于缓存内容固定的情况,提出了对应的边缘数据分发策略以实现分发时延最小化。然而,上述工作是基于电信运营商服务的角度去优化网络服务收益,而对基于服务提供商角度的边缘缓存研究较少,并且未考虑服务提供商对边缘缓存决策的需求,电力公司作为边缘缓存的服务提供商时,缓存决策除了需要满足相关业务的通信时延需求,还需要实现自身运营服务收益的最大化。

针对上述问题,本文以优化电力公司的服务收益最大化为目标,提出一种面向电工装备智能监造平台的边缘缓存策略,提高了电工装备热门内容的命中率。

2 面向电工装备智能监造平台的边缘缓存网络架构

2.1 电工装备智能监造数据分发机制分析

基于云中心的集中式数据采集与报告信息分发架构如图1所示。工厂侧数据采集中心采集电工装备生产线实时生产工艺数据及出厂试验数据并经核心网上传到云中心,云中心负责汇聚工厂数据并集中处理与分析,再将分析结果与报告分发至对应工厂用户。基于云中心的集中式数据采集与分发方式所需的网络建设成本低并且计算资源集中,便于电力公司实现管理,但海量采集数据汇聚以及对应的海量结果分发过程占用了电力核心网较多的传输带宽,不利于未来业务扩展;另外,电工装备种类繁多,供应商采集与上传数据规模庞大,电工装备智能监造涉及业务种类复杂且部分业务对时延要求高,如表1所示,若将全部数据同时上传到云中心等待处理,除了会对电力通信网链路增加带宽压力,还会因为网络拥塞造成高通信时延。

图1 集中式设备数据采集与质量报告分发架构

表1 电工装备智能监造业务类型

2.2 基于边缘缓存的智能监造数据分发网络架构

针对智能监造业务数据分发效率问题,本节提出一种基于边缘缓存的智能监造数据分发架构,如图2所示。由电工平台数据中心层、边缘服务器层与工厂用户层组成,各层分别负责不同职能,互相配合为电工装备智能监造提供高效的数据分发服务,优化监造业务的数据处理与分发流程。

图2 基于边缘缓存的电工装备智能监造数据分发架构

1)电工平台数据中心层。由电工装备智慧物联云中心组成,主要负责管理与收集下层工厂侧的生产数据,同时为边缘服务器层与工厂用户层提供协同计算与缓存服务。

2)边缘服务器层。由多个边缘服务器组成,负责采集与上传工厂用户数据,为部分热门数据与服务功能提供缓存支持,并根据相关业务功能的计算与使用需求进行缓存数据与内容的调用,保证业务功能快速进行。边缘服务器在执行计算时,若参与运算的数据未缓存在边缘服务器上,则需要通过向电工装备智慧物联云中心的中央数据库请求并下载获取,这个过程将产生高通信时延,影响部分高时延通信需求业务的有效进行;然而,相比于云中心,边缘服务器缓存容量有限,因此,需要合理规划边缘服务器的数据缓存决策,保证智能监造相关子业务实现低时延处理。

3)工厂用户层。负责采集所属工厂设备生产流程、装备参数规模等相关数据,并上传至边缘服务器以及云中心,并根据云中心以及边缘服务器回传报告结果进行生产整改或生产流程优化。

边缘服务器选择缓存一部分数据在网络边缘,当工厂侧用户需要获取监造报告等业务数据,或者边缘服务器的计算任务需要指定数据时,边缘服务器不需要重新向最上层的云中心平台请求相关计算需要的数据内容,可以直接在缓存空间中调用相关数据完成对应的计算服务或并直接为指定工厂用户分发内容。相比于传统的集中式云中心信息分发模式,基于边缘缓存的电工智能监造数据分发架构缩短了部分热门数据的传输距离,避免了经核心网回传造成较高的通信时延,有利于实时监造或订单监控等高时延需求业务的进行。

基于边缘缓存的电工装备数据分发流程如图2所示,当某时刻服务区域1的边缘服务器收到内容请求时,需要数据块1的工厂有4个,需要数据块2和4的工厂各1个,对于区域1来说,数据块1请求次数较高,可以视为热门数据,并将数据块1缓存在区域1的边缘服务器上,进而能够为多数工厂用户提供低传输时延的内容服务。

然而,边缘设备缓存空间有限,并且电力公司租借电信运营商资源需付出一定开销,为了能够给电力公司提供合理的网络建设规划,同时实现电力公司提供的业务服务收益最大化,本文提出一种面向电工装备智能监造数据的边缘缓存策略。

3 面向电工装备智能监造的边缘缓存网络模型

考虑一个如图2所示的边缘缓存网络场景,由电工平台数据中心层、边缘服务器层与工厂用户层组成,其中电工平台数据中心层包含一个电工装备智能监造云平台,边缘服务器层由k个边缘服务器组成,记边缘服务器集合为S={s1,s2,s3,…,sk},边缘服务器的相关业务需要对应类型数据才能运行,相关数据可以从云平台下载获取,或者从缓存空间中调用。假设现共有M种数据内容,对应边缘服务器可以提供的M种业务服务,其中数据内容集合表示为D={d1,d2,d3,…,dM},其中数据块i的大小由szi表示,单位为Mb。

3.1 设备生产数据请求热门度计算

一般地,边缘服务器是否缓存一个数据内容取决于数据内容在该服务器中的请求热门程度[10]。然而,区别于热门短视频等娱乐内容,电工装备相关采集数据并不一定服从Zipf分布,因此无法基于Zipf分布对生产数据热门程度做出判断。因此本文提出采用PH检验(Page-Hinkley Test, PH Test)技术[17]来计算数据的流行度,通过记录一段时间内的数据访问量,分析某一数据被请求数量的动态变化,从而获取数据的实际请求频度。PH检验广泛用于检测变化的序列分析技术,方法是根据当前值与特定窗口中平均值之间的差计算累积变化值:

(1)

(2)

(3)

另外,若只根据数据的请求热门度进行缓存,可能会出现高时延要求而较低请求热门度的数据块无法被缓存的情况,为了避免这种情况出现,需综合考虑数据块请求热门度与通信时延需求,保证一定规模的高时延要求数据能够被选择缓存。电工装备平台智能监造各项业务时延要求可分为3个等级:ms级,s级和min级。在每个数据块前加入一个时延优先级参数λ,数据块m的时延要求等级对应λm,在计算数据请求热门度之前先对λ进行判断,对λ较大的数据优先缓存。本文假设优先级为ms时级取λ=3,s级取λ=2,min及以上时延等级时取λ=1。则关于数据块m的时延加权PH检验值为:

(4)

(5)

3.2 数据缓存收益模型

假设缓存数据产生的收益与该数据被缓存后在一段时间内的受访问量呈线性关系,而缓存电工装备数据所需的缓存成本与数据块的大小、单位数据块的缓存成本相关,记fk,m表示为在边缘服务器sk上缓存数据块dm的单位数据产生的缓存成本,在边缘服务器sk上缓存数据块dm产生的缓存成本为szm·fk,m。

边缘服务器直接从缓存空间内获取内容时,可以减少从云平台获取内容所需的传输时间,为工厂用户以及相关业务提供低时延数据分发服务,进而为电力公司带来缓存服务收益,记hk,m表示为单位数据块dm给边缘服务器sk带来的缓存收益,在边缘服务器sk上缓存数据块dm产生的缓存服务收益为szm·hk,m。

3.3 问题建立

关于数据m在服务器k的缓存决策变量集合为,其中yk,m∈{0,1}。电工装备智能监造平台可以获取的收益由2个部分组成:

1)缓存热门请求数据并提供给业务服务获取的利润。

2)租用电信运营商的边缘服务器缓存空间所产生的缓存成本。

其中,若边缘服务器未缓存内容导致边缘服务器需要向云中心平台请求并完成数据内容的计算,这个过程因不占用电信运营商资源并不产生缓存成本,而由于无法贴近用户侧提供低时延服务,也无法产生对应的边缘缓存服务收益。

因此,以最大化电力公司缓存收益为目标,建立目标函数为:

(6)

(7)

hk,m.szm.zk,m≥fk,m.yk,m.szm

(8)

公式(7)确保只有当数据dm的流行度达到或超过阈值时才能在边缘服务器sk上缓存。电工平台数据中心可以通过增大或减小阈值从而减少或增加数据缓存量。公式(8)要求电力公司提供缓存服务必须能够获取正收益。公式(6)属于NP-HARD问题,求解复杂度随着变量增多而呈指数上升,需要一种高效算法实现求解。

4 基于改进离散粒子群的边缘缓存决策算法

粒子群算法是一种基于群中个体的相互协作和信息共享来寻找最优解的优化算法,寻优能力强,被广泛应用于优化函数的求解,然而传统粒子群算法容易陷入局部最优[24-25]。针对上述问题,本章提出一种基于改进离散粒子群的缓存决策算法来完成公式(6)的求解。

设某时刻有K个边缘服务器要决定M个数据块是否被缓存,缓存策略矩阵Y大小为K×M,设在矩阵Y每一个位置有G≜{1,2,…,g}个粒子群,粒子包含位置向量和速度向量2个参数,其中xg表示粒子当前位置,vg表示粒子当前飞行速度,pg表示所经历的最好位置,微粒g的当前最好位置由式(9)确定:

(9)

所有粒子经过的最好位置为全局极值pg(t),t为当前迭代次数,粒子速度基于式(10)实现更新:

vg(t+1)=w(t)vg(t)+c1×rand×(gbest(t)-xg(t))+

c2×rand×(zbest(t)-xg(t))

(10)

(11)

其中,ger为迭代总数,ωs为惯性权重ωg的初始值,ωe为惯性权重ωg的终值,c1为自我学习因子,c2为群体学习因子,rand表示独立同分布随机数。由于公式(6)属于整数规划问题,输出的决策矩阵为离散二进制值,对应地,粒子群位置由离散值表示,离散粒子群位置更新公式表示为[24]:

(12)

(13)

其中,式(13)为Sigmoid函数,常用于将连续函数值转化为归一化函数值,并用于判断与选择对应的离散值。算法具体实现流程如图3所示。

图3 基于粒子群算法的边缘缓存策略求解流程

5 仿真分析

基于仿真软件为MatlabR2019a,CPU Intel(R) Core(TM) i7-10700F 2.9 GHz,内存32 GB,64位Win10系统的仿真平台,本章将对所提出的基于改进粒子群的边缘缓存决策算法性能进行验证。设在图2网络场景中有6台边缘服务器,10种类型的数据块,其中单个数据块的数据规模sz服从λsz=2 Mb的泊松分布,设PHT热门度阈值pth取值600,基于某省份电网的电工装备取T=100 h内的10种采集数据历史请求记录进行PH检验,并获取10种数据类型的PH检验值。其余仿真参数如表2所示,表3为改进粒子群算法相关参数设定。

表2 仿真参数设定

表3 改进粒子群算法参数设定

在仿真验证中,本文选择传统粒子群算法、未考虑时延需求的基于改进粒子群的缓存决策算法[24]、随机缓存算法[26]以及CDN网络的LRU(Least Recently Used)、LFU(Least Frequently Used)策略进行对比分析,验证算法收敛性以及数据种类、电信运营商的网络租借成本等网络参数变化对算法性能的影响。

图4为基于改进粒子群的缓存决策算法收敛曲线。当算法迭代次数达到970次后,基于改进粒子群的缓存算法实现收敛,验证了该算法能够实现公式(6)的求解,并获取近似最优值。相比于传统粒子群算法收敛曲线,本文算法能够动态调整惯性权重,加快后半部分迭代次数的学习效率,因此收敛时间较快,有效降低了算法时间复杂度,而传统粒子群算法需要接近1500次迭代才实现算法收敛,并且仅搜索到局部最优解。

图4 算法收敛曲线

电力公司可获取的缓存服务收益与电信运营商提出的通信缓存成本关系如图5所示。在同一缓存开销单价下,考虑时延优先级的缓存决策机制可以获取的服务收益优于其他5种缓存方法,并且随着电信运营商的缓存成本单价的增大,除了随机缓存算法的收益变化随机,LRU与LFU算法的缓存替换能力较慢(一次决策仅进行一个最低访问内容的替换),其他3种算法求解的收益都有一定程度的下跌,其中本文算法下降速率较快,这是由于考虑业务时延需求的情况下,电力公司可以选择牺牲一部分收益,去缓存服务性能的改进,但相比于其他模型,本文算法依旧能够保持较高的服务收益。

图5 服务收益与单位缓存成本变化关系

图6给出了随着数据块种类的变化6种缓存决策算法给电力公司带来的收益变化趋势。除了随机缓存算法,随着数据块种类的增多,其他缓存算法对应的服务收益都有所增加,这是由于可选择的缓存内容种类较多,在不考虑边缘服务器缓存容量限制的情况下,使得电力公司能够提供更多种类的业务服务,进而获取更高收益。

图6 数据块种类变化对服务收益的影响

随着边缘服务器节点数目的增多,图7展示了电力公司服务收益变化情况。从图中可以看出:除了随机缓存算法,其他算法求解的电力公司服务收益随着边缘服务器数目增多而增多,这是由于随着边缘服务器增多,电力公司能够向电信运营商租借更多通信资源用于缓存服务,并带来更多的缓存收益,但传统的LRU和LFU策略仅从最低热门度的内容开始进行置换,更新频率较差;本文算法由于考虑了数据热门程度以及通信需求,能够保证更高服务收益的业务得到缓存,因此获取收益略高于另外2种算法。

图7 边缘服务器数目变化对服务收益的影响

6 结束语

针对集中式的电工装备智慧物联信息分发机制传输时延高,阻碍业务高质服务的问题,本文设计了一种基于边缘缓存的智能监造数据分发网络架构[27-29],并以电力公司服务收益最大化为目标,提出了一种面向电工装备智能监造的边缘缓存策略。仿真结果表明,本文的缓存策略保证了部分时延需求较高的业务能够分配得到缓存资源,并有效提升了电力公司可以获取的缓存收益。尽管本文算法有效提升了电力公司收益,但是在实际场景中该架构仍存在局限性,在今后研究中需要综合考虑经济政策以及隐私安全等因素的影响。

猜你喜欢
监造电力公司电工
国网上海市电力公司圆满完成春节长假保电任务
海阳核电厂设备监造管理实践
电力设备监造管理的分析
巨怪电力公司面试中
特变电工
特变电工
特变电工
糊涂的维修工
对电力设备监造管理的认识与思考
大型电力公司面临的财务风险