基于云服务的量化效能评估模型构建方法

2018-06-13 06:51蔡文伟
现代计算机 2018年14期
关键词:存储容量存储空间分析模型

蔡文伟

(肇庆学院计算机科学与软件学院,肇庆 526021)

1 研究背景介绍

尽管,目前业界已经从不同视角对大数据展开了充分的研究,但是,对于如何在成本和获利层面上,对云服务进行评估,该类研究还是少之又少,因此,本文就此方向,提出了一个量化模型,该模型在成本驱动和非线性分析(例如,存储空间的需求波动等)的基础上,对云服务和市面传统高性能数据仓库,两种大数据存储方式,展开了性能对比评估分析。

值得一提的是,本文是通过充分参考Skourletopou⁃los等人从大数据角度上实现的相关研究成果,以此为基础,对其量化模型展开修订,进而提出本文的相关公式模型的。

该公式模型是基于用户租赁的云存储服务的实际存储能力,通过假设用户对存储容量的需求,因为数据的大幅度增长而发生波动的情况下,采取非线性以及非对称的方式展开相关数据分析。在初始阶段,用户对数据仓库还是云服务的选择以及云存储的最大容量,明显对额外的成本产生影响,我们可由此,预测未来是否会产生更多的存储空间需求。可见该评估模型,对于技术层面以及非技术层面都有相当的参考意义[1]。

2 模型公式介绍

充分考虑到云存储的租赁属性,本研究提出的相关计算公式和公式模型,就充分建立在对成本和获利的分析基础上,通过非线性和非对称的方法,能够准确计算出,在存储容量没有充分利用的情况下,还有多少收益无法实现的。

本文假定,在对以L年为周期的预计收益和总投入成本进行充分考虑的情况下,作出了在云服务还是传统数据仓库之间作出选择的。

租期结束后预计的收益,可根据以下表述和假设进行估量:

(1)云存储是基于租赁的,按照L年为周期,每年依据用户对于存储空间的需求波动,按实际情况(比如,以每月10亿字节为单位)收费的。

(2)存储容量的需求波动,在L年为周期的时间段内,可以被预测,在服务质量和用户体验质量需被保障的情况下,该波动将直接影响到整体成本。

(3)当开发该收益模型的时候,充分考虑到云服务的可扩展性和弹性,因此,每年的存储需求的变化所导致的成本变化,应包含,文档(非结构化)存储的成本变化,维修服务成本变化,按需输入/输出成本变化,操作(例如相应服务请求)成本变化以及服务器和技术支持成本变化。

(4)全部的网络成本,包括了带宽的使用成本,网络出口成本以及数据在不同区间传输成本,尤其对于在云端,需始终保持在线状态的移动服务而言,其对网络带宽和数据传输延时要求比较高,为避免延时,需满足对超过实际带宽的网络需求,因此产生额外的网络成本。

(5)当用户从存储区里检索内容的速度比以往要快的时候,数据传输的吞吐量会加大,导致了产生额外的输入/输出成本投入。

(6)额外的服务器成本,包括了额外投入使用的CPU内核的成本,以及出于临时处理事务需要而增加的内存数目[2]。

在这种情况下,针对传统数据仓库应用的成本分析模型,采用以下的公式进行表述,其中Smax是指存储容量的最大值,Scurr是指近期利用的存储容量(涉及使用情况计量以及根据使用情况的收费),由于传统的数据仓库在性能上不具备云计算和云服务在存储上的弹性和可伸缩性,因此,针对传统数据仓库的成本分析模型,没有检测目前使用的存储容量,因此只要满足Scurr≤Smax,是不会发生成本的变化的,也就是说以L年为周期的时间段内,实际获益总是为0,也就是B为0。值得一提的是,一旦出现了Scurr>Smax的情况,增加的存储容量利用系统停机时间,添加到数据仓库存储系统中,由此引起了额外的成本,因为是非正常运作的时间的存储容量增加,也就是说不是实际使用到的,这方面也可以计算费用。

这里:

Cs=Csmax=Cαmax+Cγmax+Cηmax+Cθmax+Cκmax+Cλmax+Cμmax+Cσmax

这里,Cs表示,每年租赁云存储的总成本,Cα表示数据存储成本,Cγ表示文件存储成本,Cη表示维修服务成本,Cθ表示网络成本,Cκ表示按需输入/输出成本,Cλ表示操作成本,Cμ表示服务器成本,Cσ表示技术支持成本。

而针对云存储的成本分析和获利模型的情况恰好相反,模型采用了以下的公式进行表述,然后关于获利的计算过程,在下面的算法1中将详细表述。

CD1=Cs/m*(S max-Scurr)

CDi=12*[Δi-2*(Smax-Bi-2)],i≥2 ,这里:

Cs=Cscurr=Cαcurr+Cγcurr+Cηcurr+Cθcurr+

Cκcurr)+Cλcurr+Cμcurr+Cσcurr

这里,β1是以L为周期,第2年存储空间的需求变化率,βi是以L年为周期,第3年开始直到第L年结束,各年比前一年增长的存储空间需求变化率;B0是以L年为周期第2年存储空间的使用量;Bi以L年为周期第3年开始直到第L年结束,各年存储空间的使用量。

而δ1是因租赁云存储服务,以L为周期,第2年成本变化率;δi是以L年为周期,第3年开始,直到第L年结束,各年比前一年增长的成本变化率;Δ0

Δ0=(1+δ1%)*Scurr

Δi=(1+δi+1%)*Δi-1,i≥1

δi%=αi%+γi%+ηi%+θi%+κi%+λi%+μi%+σi%,i≥1,且:

因此:

Bi以此类推。

算法1.实现获益模型的伪代码:

//在预测存储容量的需求呈直线增长的前提下,该算法计算出云服务模型的获利情况//

1:执行函数BENEFITSCALCULATION(Smax,Scurr,i,Δ%,β%,L,Cs/m,α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)

2:依次输入(α%,γ%,η%,θ%,κ%,λ%,μ%,σ%)

Δ←α%+γ%+η%+θ%+κ%+λ%+μ%+σ%

3:返回Δ%值

4:依次输入( Smax,Scurr,i,Δ%,β%,L,Cs/m)

5:for i=1to L执行循环//从第一年到第L年B【i】← (1+βi+1%)*Bi-1,i≥ 1//得出各年的 B 值

6:结束该循环

7:返回各年的B值

8:结束全部进程

3 性能评估以及数据演算结果

本文提出一个全新的成本/收益分析模型,该模型在假定云存储容量需求发生波动的情况下,对云服务与传统数据仓库之间,孰优孰劣,展开比较评估。从研究角度看,在租赁云存储服务的过程中,对成本和收益的分析就采纳了相对复杂的分析模型,通过添加更多的相关参数,对该模型进行表征,使得该模型具有相对强大的可扩展性,即该模型的公式是用户可根据自身的专业水平进行自定义参数添置的。进一步说,想要充分对云服务与传统高性能数据仓库应用进行比较,还需应用量化工具,作为一种“概念验证”的途径,来真正实现分析模型的公式。从技术角度看,本文所指的云存储是安装在由谷歌App引擎所支持的谷歌云平台上,该存储应用是由Java程序语言开发出来的。

CA1=Cs*Scurr

CD1=Cs*( )

Smax-Scurr CA2=(1+δ1%)*Cs*(1+β1%)*Scurr

CD2=(1+ δ1%)*Cs*[Smax-(1+ β1%]*Scurr][4]

以下是,假设云存储需求呈线型增长,通过两个不同的场景,以4年为周期(L=4),对云服务和传统数据仓库展开的成本和获益比较分析。下面分别给出两个场景相应参数的值。

首先是存储需求变化率β,在场景1,第1年到第2年为5%,第2年到第3年为15%,第3年到第4年为20%,第4年到第5年为23%;在场景2,第1年到第2年为10%,第2年到第3年为22%,第3年到第4年为35%,第4年到第5年为40%;

然后是租赁云存储造成的额外成本增长率δ,在场景1,第1年到第2年为2%,第2年到第3年为5%,第3年到第4年为18%;在场景2,第1年到第2年为5%,第2年到第3年为10%,第3年到第4年为25%;

应用于等式(1)到(4)的变量值分别为 Smax=6/兆兆字节,Scurr=2/兆兆字节,刚开始第一个月租赁云存储的成本为Cs/m=300美元。

然后分别进行计算,得出如表1和表2的评估结果。

表1 场景1中针对云服务的成本和获利分析计算结果

表2 场景2中针对云服务的成本和获利分析计算结果

对比传统数据仓库,重申本文第二部分公式说明处,需指出的,由于其在性能上不具备云计算和云服务在存储上的弹性和可伸缩性,因此,针对传统数据仓库的成本分析模型,没有检测目前使用的存储容量,因此只要满足,是不会发生成本的变化的,也就是说以L年为周期的时间段内,实际获益总是为0,也就是B为0。

4 结语

本文围绕云服务的租赁属性,应用本文提出的量化公式模型,将云服务与传统数据仓库展开成本和获益的分析,结果显示,云服务给使用方带来的持续的获益增长,建议使用者把获益作为存储需求增长所产生的额外成本,从而获得投资收益的最大化。

[1]R.Buyya,C.S.Yeo,S.Venugopal,J.Broberg,I.Brandic.Cloud Computing and Emerging IT Platforms:Vision,Hype,and Reality for Delivering Computing as the 5th Utility.Future Gener.Comput.Syst.,2009,25(6):599-616.

[2]G.Mastorakis,E.Markakis,E.Pallis,C.X.Mavromoustakis,G.Skourletopoulos.Virtual Network Functions Exploitation Through a Prototype Resource Management Framework.in 2014 IEEE 6th International Conference on Telecommunications and Multimedia(TEMU),Heraklion,Crete,Greece,2014:24-28.

[3]P.Neves,J.Bernardino.Big Data Issues.in Proceedings of the 19th International Database Engineering&Applications Symposium,2015:200-201.

[4]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Towards Mobile Cloud Computing in 5G Mobile Networks:Applications,Big Data Services and Future Opportunities.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.

[5]G.Skourletopoulos,C.X.Mavromoustakis,G.Mastorakis,J.M.Batalla,C.Dobre,S.Panagiotakis,E.Pallis.Big Data and Cloud Computing:A Survey of the State-of-the-Art and Research Challenges.in Advances in Mobile Cloud Computing and Big Data in the 5G Era,1st ed.,vol.22,Switzerland:Springer International Publishing AG,2017.

猜你喜欢
存储容量存储空间分析模型
基于多种群协同进化算法的数据并行聚类算法
纤维增强复合材料疲劳寿命预测及损伤分析模型研究进展
苹果订阅捆绑服务Apple One正式上线
用好Windows 10保留的存储空间
基于大规模弹幕数据监听和情感分类的舆情分析模型
全启发式语言分析模型
浅析云盘技术及存储原理
大功率型EPS控制器热分析模型的研究
Buffalo推出四硬盘网络存储器 主打Soho一族