一种云存储架构及服务器优化配置方案

2019-03-21 12:53贾晓光郝晓冰薛元铮金顺福
燕山大学学报 2019年1期
关键词:排队时延收费

余 靖,贾晓光,郝晓冰,顾 蕊,薛元铮,金顺福,*

(1.燕山大学 信息科学与工程学院,河北 秦皇岛 066004;2.河北省计算机虚拟技术与系统集成重点实验室,河北 秦皇岛 066004;3.通信网信息传输与分发技术重点实验室,河北 石家庄 050081)

0 引言

随着云计算的迅猛发展和大数据的快速增加,越来越多的用户将数据存入云中[1-2]。然而,不充足的服务会增加用户的时延,导致用户对该云存储服务不满意,过剩的服务又会降低云服务提供商的盈利[3]。因此,发展云存储用户、合理管理云存储资源是亟待解决的关键问题。

为了减少用户的等待时间,给用户提供更好的服务并且获得更多的经济效益,通常将用户进行分类服务。文献[4]将铁路货运公司中的用户分为一般用户和会员用户。会员用户比一般用户的定价高,接受的服务质量也更高。文献[5]研究了一个带有两类顾客的库存服务系统。当第一类顾客到达系统时,如果有第二类正在排队等待,系统会优先满足第一类顾客的订单需求。文献[6]分析了带有两类顾客的重试排队,当第一类顾客到达系统时,如果服务器被占用,该顾客会彻底离开系统,当第二类顾客到达系统时,如果服务器被占用,该顾客会离开服务区进入重试区,一段时间后以概率θ再次进入系统或者以概率1-θ永久离开系统。受以上文献启发,考虑将云存储服务中的用户分为两类。

在实际生活中,经常会遇见这种情况,当排队的队伍过长时,正在排队等待的用户可能会产生不耐烦情绪,从而离开队伍放弃服务。文献[7]研究了一个具有不耐烦顾客的单服务台排队系统。当系统遭受到破坏时,会经历一个修复机制。修复期间内新来的顾客可以进入系统,一段时间内如果系统未修复完成,顾客将离开队列永不返回。文献[8]研究了一个带有不耐烦和工作休假的M/M/1排队系统。当系统中没有顾客时,服务器进入工作休假模式。在工作休假模式下有新顾客到达时,工作休假被中断,服务器以概率q恢复正常工作,以概率1-q继续休假。在休假周期内,排队等待的顾客可能因不耐烦离开系统。文献[9]研究了一个带有不耐烦的M/M/2排队系统。当顾客到达系统时,如果两个服务器全被占用,顾客以概率p排队等待,以概率1-p直接离开系统。如果顾客的等待T时间后未开始服务,顾客将放弃等待离开系统。许多学者研究了带有不耐烦行为的排队系统,但是用户的不耐烦行为在云存储中的研究却很少。

在云存储中考虑同时设立多个免费服务器和多个收费服务器,给出一种新型的云存储架构。潜在用户由免费服务器提供存储服务。潜在用户在排队过程中因为等待时间过长而感到不耐烦时会放弃服务离开系统,坚持等待的潜在用户结束服务后直接离开系统。收费用户由效率更高的服务器提供存储服务。收费用户源有限并且收费用户一旦进入系统就不能离开,直到服务结束才能离开系统。建立一种双队列多服务台排队模型,导出潜在用户和收费用户的平均时延的性能表达式。进行数值实验和仿真实验,揭示系统性能的变化趋势。将混沌方程用于代理的初始化中,改进万有引力寻优算法,以系统成本为目标函数,进行免费和收费服务器速率的联合优化。

1 云存储架构及系统模型

1.1 云存储架构

随着云计算的快速发展和大数据的快速增加,越来越多的用户将数据存入云中,云提供商开始以提供云存储服务盈利。为了吸引更多的用户以获得更大的经济效益,云提供商设立两种速率不同的服务器为不同用户提供服务。潜在用户到达系统时,由速率较小的免费服务器提供存储服务。当潜在用户因等待时间过长而不耐烦时,将离开系统。收费用户由速率较大的收费服务器提供存储服务。由此,给出一个由免费存储服务和收费存储服务共同组成的云存储架构,如图1所示。

1) 当潜在用户到达系统时,如果存在至少一个空闲的免费服务器,则直接接受服务,否则该潜在用户在免费服务排队区域中等待。排队过程中感到不耐烦的潜在用户会停止等待提前离开系统。

2) 当收费用户到达系统时,如果存在至少一个空闲的收费服务器,则该收费用户直接接受服务,否则该收费用户在收费服务排队区域中等待。所有收费用户结束收费服务才会离开系统。

图1 带有免费存储服务和收费存储服务的云存储架构
Fig.1 Architecture of the cloud storage withfree and chargeable storage services

1.2 系统模型

基于融合免费存储服务和收费存储服务的云存储架构,考虑潜在用户的不耐烦行为和收费用户源有限,建立双队列多服务台排队模型。

假设免费存储云中有n(n=1,2,…)个免费服务器。令潜在用户到达免费存储云的时间间隔服从参数为λ1(λ1>0)的指数分布,一个潜在用户在免费服务器上的服务时间服从参数为μ1(μ1>0)的指数分布。潜在用户不耐烦强度为αk=kδ(δ>0),其中k为排队队长,此时,系统中共有(k+n)个潜在用户。假设免费存储云的排队区域的大小无限。免费存储云可以抽象为一个具有不耐烦行为的M/M/n排队系统。

假设收费存储云中有c(c=1,2,…)个收费服务器,收费用户的总数为m(m≥c)。令收费用户发起存储请求的时间间隔服从参数为λ2(λ2>0)的指数分布,一个收费用户在收费服务器上的服务时间服从参数为μ2(μ2>μ1)的指数分布。收费存储云可以抽象为一个M/M/c/m/m排队系统。

综上,本文所提出的云存储架构可以抽象为一个具有不耐烦行为和顾客源有限的双队列多服务台的排队系统。

2 模型分析和性能指标

2.1 模型分析

令ρ1和ρ2分别表示系统中具有不耐烦行为的M/M/n排队系统和M/M/c/m/m排队系统的通信量负载[10]。ρ1和ρ2的表达式分别为

系统稳态的充分必要条件是ρ1<1并且ρ2<1。

令A(t)表示在t时刻免费存储云中潜在用户的个数。具有不耐烦行为的M/M/n排队系统的稳态概率分布π1i表示为

(1)

建立平衡方程

联合归一化条件

可得到具有不耐烦行为的M/M/n排队系统的稳态概率分布为

(2)

其中,

令B(t)表示在t时刻收费存储云中收费用户的个数。M/M/c/m/m排队系统的稳态概率分布π2i表示为

(3)

建立平衡方程

联合归一化条件

可得M/M/c/m/m排队系统的稳态概率分布为

(4)

其中,

2.2 性能指标

定义潜在用户平均时延ω1为潜在用户从到达免费存储云开始到离开系统(因不耐烦提前离开系统或因服务完毕正常离开系统)为止所经历的平均时间长度。如果一个潜在用户在等待过程中没有因为不耐烦离开系统,则该潜在用户的存储服务最终一定成功。排队等候的潜在用户平均数量Lq的表达式为

(5)

正在接受云存储服务的潜在用户平均数量Ls的表达式为

(6)

由Little公式[11]可知,潜在用户平均时延ω1的表达式为

(7)

定义收费用户平均时延ω2为收费用户从到达收费存储云开始到完成服务离开系统止所经历的平均时间长度。稳态下系统中收费用户数量的均值L2的表达式为

(8)

由Little公式[11]可知,收费用户平均时延ω2的表达式为

(9)

3 系统实验

为了揭示不同系统参数,包括潜在用户到达率λ1、免费服务器速率μ1、不耐烦强度系数δ、收费用户到达率λ2、收费服务器速率μ2及收费用户数量m等对云存储系统的性能影响,进行数值实验和仿真实验。

在MyEclipse平台上基于云存储架构进行仿真实验,在MATLAB R2010a上基于式(7)和(9)进行数值实验。计算机操作系统为Windows 10,处理器为Intel Core i7-4790 3.60 GHz,内存为8 GB。从图2和图3中可以看出理论分析结果和仿真结果吻合。

以免费服务器数量n=6为例,图2揭示了潜在用户到达率λ1,免费服务器速率μ1及不耐烦强度系数δ等系统参数对潜在用户平均时延ω1的影响。

图2 潜在用户平均时延的变化趋势
Fig.2 The change trend for the average latency of potential users

固定潜在用户到达率λ1和不耐烦强度系数δ,潜在用户平均时延ω1随着免费服务器速率μ1的增加而减少。免费服务器速率越大,排队等待的潜在用户越少,潜在用户平均时延越少。固定潜在用户到达率λ1和免费服务器速率μ1,当μ1较小(μ1≤5)时,潜在用户平均时延ω1随着不耐烦强度系数δ的增大而减少。不耐烦强度系数越大,潜在用户的不耐烦强度越大,排队等待的潜在用户因为不耐烦提前离开的越多,潜在用户的平均时延越少;当μ1较大(μ1>5)时,潜在用户平均时延ω1随着不耐烦强度系数δ的增加保持不变。当免费服务器速率足够大时,潜在用户几乎不用排队等待就可以接收服务,所以不耐烦强度系数对潜在用户平均时延几乎没有影响。固定不耐烦强度系数δ和免费服务器速率μ1,当μ1较小(μ1≤5)时,潜在用户平均时延ω1随着潜在用户到达率λ1的减小而减少。因为潜在用户到达率越小,排队等待的潜在用户越少,所以潜在用户平均时延越少。当μ1较大(μ1>5)时,潜在用户平均时延ω1随着潜在用户到达率λ1的减小保持不变。当免费服务器速率足够大时,潜在用户几乎不用排队等待就可以接收服务,所以潜在用户到达率对潜在用户平均时延几乎没有影响。

以收费服务器数量c=4为例,图3刻画了收费用户到达率λ2,收费服务器速率μ2及收费用户数量m等系统参数对收费用户平均时延ω2的影响。

图3 收费用户平均时延的变化趋势
Fig.3 The change trend for the average latency of chargeable users

固定收费用户到达率λ2和收费用户数量m,收费用户平均时延ω2随着收费服务器速率μ2的增加而减少。收费服务器速率越大,排队等待的收费用户越少,收费用户平均时延越小。固定收费服务器速率μ2和收费用户数量m,收费用户平均时延ω2随着收费用户到达率λ2的增加而增加。收费用户到达率越大,排队等待的收费用户越多,收费用户平均时延越多。固定收费用户到达率λ2和收费服务器速率μ2,收费用户平均时延ω2随着收费用户数量m的增加而增加。系统中收费用户基数越大,意味着进行存储服务的收费用户增加,造成排队等待的收费用户增加,收费用户的平均时延因此变大。

4 系统优化

一般来讲,服务器的购置费用越高,服务器的服务能力越强。本文关注服务能力中的存储速率。假设β1和β2分别表示用于免费服务器和收费服务器的投入与服务速率相关的系数,云提供商的投资规模近似表示为

当云提供商的投资规模Z固定时,增大免费服务器速率M1,就要降低收费服务器速率M2,反之亦然。另一方面,服务器速率M1和M2越大,潜在用户和收费用户的平均时延ω1和ω2越小,用户对云存储的QoS (Quality of Service)越满意。但是,服务器速率M1和M2的增加势必会使云提供商的投资规模Z加大,这是云提供商不愿意的。显然,不同用户的平均时延之间、用户时延与云提供商的投资规模之间存在折中关系。

为了合理配置服务器速率,均衡潜在用户、收费用户和云提供商三者之间的利益,建立系统的成本函数:

其中,f1、f2和f3分别为潜在用户平均时延、收费用户平均时延和云提供商的投资规模对系统成本的影响因子。

利用数学解析的方法联合优化免费服务器速率和收费服务器速率很困难。智能寻优算法为解决复杂的优化问题提供了新思路。本文利用混沌方程[11]初始化代理位置,改进万有引力智能寻优算法[12],旨在加快优化过程。该算法的主要步骤如下。

Step1初始化代理数量N,最大迭代次数Imax,当前迭代次数I=1,服务器速率上限up,服务器速率下限down。

Step2初始化代理速度V(μ1,μ2)i,i∈{1,2,…,N}:

V(μ1,μ2)i=0。

Step3利用混沌方程设置每个代理的初始位置:

(μ1,μ2)1=rand(2,1),

fori=2∶2N

(μ1,μ2)i=r×(μ1,μ2)i-1×(1-(μ1,μ2)i-1)

end

fori=1∶2N

(μ1,μ2)i=(μ1,μ2)i×(up-down)+dowm

end

%rand(x1,x2)表示生成一个x1×x2矩阵的函数,矩阵元素为0~1之间的随机数%

%r=3.85表示一个混沌因子%。

Step4计算每个代理的系统成本F(μ1,μ2)i,i∈{1,2,…,N}:

F(μ1,μ2)i=f1×ω1(μ1,μ2)i+f2×ω2(μ1,μ2)i+f3×Z(μ1,μ2)i

%ω1(μ1,μ2)i、ω2(μ1,μ2)i和Z(μ1,μ2)i分别表示服务器速率为(μ1,μ2)i时潜在用户平均时延、收费用户平均时延和云提供商的投资规模%。

Step5计算每个代理的惯性质量Mi,i∈{1,2,…,N}:

Step6计算每个代理的重力Hi,i∈{1,2,…,N}:

%G表示万有引力常数%

%rand表示一个0~1之间的随机数%。

Step7计算每个代理的加速度ai,i∈{1,2,…,N}:

Step8计算每个代理的速度V(μ1,μ2)i并且更新其位置(μ1,μ2)i,i∈{1,2,…,N}:

V(μ1,μ2)i=rand(2,N)×V(μ1,μ2)i-1+αi,
(μ1,μ2)i=(μ1,μ2)i+V(μ1,μ2)i。

Step10输出(μ1,μ2)*和F(μ1,μ2)*。

在该智能算法中,代理的质量是一个与系统成本有关的函数。因代理质量而产生的万有引力牵引每个代理的位置移动。经过多次移动,最终定位到最优解的位置(μ1,μ2)*。

令潜在用户到达率λ1=1,收费用户到达率λ2=3,潜在用户不耐烦强度系数δ=0.1。令优化算法中代理个数N=100,最大迭代次数Imax=100,服务器速率下限down=1,服务器速率上限up=9,精度参数ε=10-6。利用改进的万有引力寻优算法,针对不同收费用户数量m分别计算最小系统成本F(μ*1,μ*2),并给出免费服务器和收费服务器速率的优化组合(μ*1,μ*2)。系统优化结果如表1所示。

表1 系统优化数值结果
Tab.1 Numerical results for the system optimization

收费用户数量免费服务器和收费服务器速率的最优组合最小系统成本60(5.3267,6.3369)0.338070(5.3691,6.9649)0.357680(5.5005,7.0257)0.3758

5 结论

提高用户QoS并减小云提供商投资规模,合理分配云存储资源是云存储应用中的一个不容忽视的问题。本文融合免费服务和收费服务提出了一种新型云存储架构。考虑潜在用户的不耐烦行为和收费用户源有限,建立了一个双队列多服务台排队系统,给出了潜在用户平均时延和收费用户平均时延等性能指标。进行数值实验和仿真实验,揭示了不同用户的平均时延、用户时延和云提供商投资规模之间的折中关系。建立系统成本函数,改进万有引力寻优算法,给出了免费服务器速率和收费服务器速率的联合优化方案。

猜你喜欢
排队时延收费
怎样排队
行政法上之不利类推禁止*——以一起登记收费案为例
5G承载网部署满足uRLLC业务时延要求的研究
自由流收费技术解决方案的创新应用
基于GCC-nearest时延估计的室内声源定位
VoLTE呼叫端到端接通时延分布分析
巧排队列
三角龙排队
论高速公路收费服务水平的提高和收费服务设施的完善
Python与Spark集群在收费数据分析中的应用