计算资源池中物理服务器的配比

2016-12-19 19:22薛永军崔荣靖
电子技术与软件工程 2016年19期
关键词:虚拟化技术

薛永军++崔荣靖

摘 要

基于云计算中服务器虚拟化技术的重要意义,提出在应用虚拟化技术的物理服务器在内存、CPU、IO上使用的特性,通过企业计算资源池运行数据进行统计、梳理,然后分析得出了物理服务器在使用虚拟化技术后硬件配置比例。服务器虚拟化通过服务器虚拟化完成计算资源池建设,为了使得物理服务器的使用率得到最大化,必须有针对各企业实际情况的物理服务器池化合理物理硬件配置比例。

【关键词】虚拟化技术 计算资源池 硬件配置

计算资源池建设需要具有通过虚拟软件的功能,对服务器当中的各项资源实施抽象化,将传统意义上和服务器及其设备完成绑定的各类资源转变成能进行统一管理的逻辑性资源。都是在现有的物理服务器基础进行资源转化,而现有物理服务器的硬件配置比例基本没有参照硬件池化的实际情况,必然出现物理服务器某一硬件资源使用率饱和时,另一类硬件资源池却处于低使用率的现象,造成资源浪费,违反了虚拟化技术产生初衷。

1 硬件资源配置比研究范围

硬件资源配置比例研究仅限于池化服务器的内存、CPU、以太网IO、存储网络IO。

2 硬件资源配置比算法

对现有计算资源池的服务器、存储、网络的相关实际值、置备值、使用率等运行数据进行收集、汇总。数据收集方法:以一个季度为一个周期,每个月收集14次,分别为每月的1、5、10、15、20、25、30的上午11:00,下午的15:00,收集2个周期,对28次数据进行多次平均,按CPU,内存,网卡及HBA卡进行统计。如表1所示。

从统计数据中就可以发现现有计算资源池中,出现了严重的资源浪费,大量的CPU资源处于极低使用率情况,同时不同的内存、CPU使用率使用着相同的以太网络带宽和存储网络带宽,明显是配置不合理;从采购角度来看,就是因为没有计算资源池物理服务器配比算法做为标准来指导物理服务器的采购。

下面采用大数据算法 Support vector machines进行数据分析,从面对计算资源池物理服务器配比算法进行研究。

支持向量机属于一般化线性分类器。也可以认为是提克洛夫规范化(Tikhonov Regularization)方法的一个特例。这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区。因此支持向量机也被称为最大边缘区分类器。在统计计算中,最大期望(EM)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域。最大期望算法经过两个步骤交替进行计算,第一步是计算期望(E),也就是将隐藏变量象能够观测到的一样包含在内从而计算最大似然的期望值;另外一步是最大化(M),也就是最大化在 E 步上找到的最大似然的期望值从而计算参数的最大似然估计。M 步上找到的参数然后用于另外一个 E 步计算,这个过程不断交替进行。

在学习这种方法时,首先要弄清楚这种方法考虑问题的特点,这就要从线性可分的最简单情况讨论起,在没有弄懂其原理之前,不要急于学习线性不可分等较复杂的情况,支持向量机在设计时,需要用到条件极值问题的求解,因此需用拉格朗日乘子理论,但对多 数人来说,以前学到的或常用的是约束条件为等式表示的方式,但在此要用到以不等式作为必须满足的条件,此时只要了解拉格朗日理论的有关结论就行。

支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平 面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。一个极好的指南是C.J.C Burges的《模式识别支持向量机指南》。van der Walt 和 Barnard 将支持向量机和其他分类器进行了比较。

有很多个分类器(超平面)可以把数据分开,但是只有一个能够达到最大分割。先进行问题定义,如图1所示。

设样本属于两个类,用该样本计算svm得到的最大间隔超平面。在超平面上的样本点也称为支持向量。

考虑以下形式的样本点

{(x1,c1),(x2,c2),...,(xn,cn)}

由于我们要求最大间隔,因此我们需要知道支持向量以及(与最佳超平面)平行的并且离支持向量最近的超平面。我们可以看到这些平行超平面可以由方程族:

w·x-b=1,w·x-b=-1.

如果这些训练数据是线性可分的,那就可以找到这样两个超平面,在它们之间没有任何样本点并且这两个超平面之间的距离也最大.通过几何不难得到这两个超平面之间的距离是 2/| w |,因此我们需要最小化 | w |。同时为了使得样本数据点都在超平面的间隔区以外,我们需要保证对于所有的 i 满足其中的一个条件:

w·xi-b≥1 or w·xi-b≤-1.

这两个式子可以写作:

ci(w·xi-b) ≥1,1≤i≤n. (1)

套用算法,C代表使用率,W、X分别代表内存和CPU和核数,B代表IO带宽,可以得出1G内存至少需要40M的IO带宽。

3 结束语

技术的关键点是不断的抽取计算资源池中虚拟机及物理机运行数据,并根据业务系统的业务特性进行资源评估、统计、分析等CPU、内存、磁盘、网络关系性在;创新点是根据实际资源使用情况,以实际数据为基础在业内首次根据计算资源池提出服务器配置标准。可以解决:

(1)计算资源池服务器配置不统一;

(2)计算资源池服务器资源浪费;

(3)解决物理服务器采购时无标准、无预见性。

参考文献

[1]李刚健.基于虚拟化技术的云计算平台架构研究[J].吉林建筑工程学院学报,2011(01):79-81.

[2]李双权,王燕伟.云计算中服务器虚拟化技术探讨[J].邮电设计技术,2011(10):27-33.

作者单位

云南电网有限公司信息中心 云南省昆明市 650217

猜你喜欢
虚拟化技术
独立学院虚拟网络实验室的研究与建设
基于云平台的计算机开放式实验教学与管理模式研究
虚拟化技术在中职学校校园网服务器中的应用
云计算虚拟化技术在电信领域的应用研究
基于SOP架构的一种轻量级虚拟化防火墙的实现
服务器虚拟化技术在高职机房管理中的应用
探讨虚拟化技术在广电监测台中的应用
云计算实验室建设方案探究
基于云计算与虚拟化技术研究