韩秋英 殷秀叶 张少辉
摘要:在云计算环境中,数据中心需要高效且快速的调度算法来满足不同的任务要求。本文主要从分析Map/Reduce框架模型出发,在传统遗传算法的基础上引入QoS用户服务质量度量,考虑不同用户的任务差别,并将其应用至云计算环境中的资源调度。在云仿真器CloudSim上进行仿真,实验结果表明,相对于传统遗传算法,优化的遗传算法能在大量任务的情况下取得更好的优化效果,能使任务快速合理地分配到虚拟资源上。
关键词:云计算; 改进遗传算法; 资源调度
中图分类号:TP393 文献标识码:A文章编号:2095-2163(2014)04-0100-03
Abstract:Data centers need efficient and fast scheduling algorithms to meet the requirements of the different tasks in the cloud computing environment. This paper mainly from the analysis of Map/Reduce frame, introduces QoS in the traditional genetic algorithm, considering the correspon-ding user task difference, and applies it to the resource scheduling in the cloud computing environment. Simulation is realized in the cloud simulator CloudSim, experimental results show that, improved genetic algorithm can get better performance in a large number of tasks, which would make tasks reasonable allocation to virtual resources compared with the traditional genetic algorithm.
Key words:Cloud Computing; Improved Genetic Algorithm; Resource Scheduling
0引言
云计算是现今业界最具研讨价值的课题之一。随着互联网数据中心的容量出现了快速扩充,当下以百万台计算的区域数据中心、云服务中心以及超算中心也随之频频出现,甚至异军突起的4G,都为云计算的加速发展起到了重大的推进作用[1]。
Map/Reduce是一个将大型分布式计算表达为键值对结合、并可进行串行化分布式操作的编程模型。当在云环境中使用时,Map/Reduce集群利用虚拟机可实现动态创建,同时由云提供者实施管理,而且利用特殊的时空权衡即可实现能量感知。在云计算能效和资源调度方面,国内外专家们提出了许多的算法和策略。宋杰等学者提出了能效的概念和度量能效的方法[2];另有部分学者把虚拟机问题抽象为NP难的装箱问题以达到减少数据中心能源消耗的目的[3-4];而文献[5]则是从资源调度角度来发起研究与讨论的。本文即从虚拟机调度策略入手,采用改进的遗传算法针对云计算环境中的资源开展了合理调度的有关研究。
1云计算虚拟机资源调度
1.1Map/Reduce框架模型
Google公司设计研发的Map/Reduce模型,是当今世界最为流行的海量数据处理编程模型,其工作原理是:Map函数将用户提交的任务分解为多个子任务,并将这些子任务按照调度算法分配到虚拟机节点,待子任务执行完毕,再由Reduce函数将产生的中间结果进行汇总处理,图1表示其执行流程。
1.2研究场景
对于Map/Reduce任务,利用适当的调度策略将其分配至对应的虚拟机中,并将这些虚拟机按照一定的算法部署到物理机上,即虚拟机资源调度实际上分为两级,一级调度是云计算中用户任务和虚拟机资源的调度,二级调度是虚拟机和物理机的映射关系[6]。本文主要研究的是在任务调度中,如何快速而高效地获得虚拟机。具体过程是:已经定义的任务(用户程序)开始执行,而且由Map/Reduce库划分为若干份,之后将用户进程拷贝到集群内的其他机器上实现并行处理。
2算法设计与实现
2.1经典遗传算法
由图4可以看出,在迭代的前期,两种算法性能差别不大,但是随着迭代次数的不断增加,优化后的IGA算法明显地占据了优势,而且优化的IGA算法在140~160代之间已经接近于成熟;另外,从GA的图像还可看出该算法具有超常的适应度值,这是由于个别值引导了种群向错误方向进化。而IGA算法在适应度计算方面因为进行了一定的调整,进化结果则更为理想。
4结束语
本文对云环境中的资源调度问题进行了详细的分析,并且构建分析了基于Map/Reduce编程框架的模型,同时依据此框架提出了基于改进遗传算法的任务调度策略。IGA算法充分考虑了不用用户的任务需求,引入了服务质量概念,而且考虑了任务执行时间、带宽、成本和可靠性因素,由此而建立了适应度函数模型。在此基础上,对比原先的GA算法,大量任务的情况下仍能取得良好的优化效果,从而做到了将任务快速合理地分配到对应虚拟资源上。
参考文献:
[1]刘永, 王新华, 邢长明,等. 云计算环境下基于蚁群优化算法的资源调度策略[J].计算机技术与发展,2011, 21(9):20-27.
[2]宋杰, 李甜甜, 闫振兴,等. 一种云计算环境下的能效模型和度量方法[J]. 软件学报,2012,23(2):200-214.
[3]CARDOSA M, SINGH A, PUCHA H, et al. Exploiting spatio-temporal tradeoffs for energy-aware Map/Reduce in the Cloud [J]. IEEE Transaction on Computers, 2012, 12(61):1737-1751.
[4]谭一鸣, 曾国荪, 王伟. 随机任务在云计算平台中能耗的优化管理方法[J].软件学报,2012,23(02):266-278.
[5]刘永.云计算环境下虚拟机资源调度策略研究[D]. 济南:山东师范大学, 2012.
[6]刘愉,赵志文,李小兰,等. 云计算环境中优化遗传算法的资源调度策略[J]. 北京师范大学学报(自然科学版), 2012, 48(4):378-384.
[7]熊聪聪, 冯龙, 陈丽仙, 等. 云计算中基于遗传算法的任务调度算法研究[J]. 华中科技大学学报(自然科学版), 2012,40(1):1-4.