王泽宇,马 鹏
(武警工程大学,西安 710086)
McCullough等利用随机服务系统理论来实现对虚拟机资源占有的调控以达到目标预期性能[1]。张蓓蓓等人提出了基于BP神经网络对虚拟机的负载部署预测,得到较高的收敛速度和拟合精度[2]。本文基于BP神经网络对特征值进行建模,建立多输入单输出的神经网络模型对性能进行预测并与实际数据进行对比观测模型准确性。
假设:①模型符合线性模型;②自变量:虚拟机内存、VCPU个数、调度算法、核心绑定、虚拟机个数、负载类型、CPU周期权重用来表示;③变量前的参数用表示,得到为线性模型。根据可加性得到:亦为线性模型,对进行一元线性拟合建模,选取一组测试数据如表1所示:
表1 测试数据表
得到测试结果数据并不呈线性分布,甚至还超出了上下边界,故不为线性模型,不为线性模型,不适合用线性模型求解。
设计的模型能够实现对已知配置性能的预测,能根据由训练集得出的经验来评估预测精度与误差。设定训练次数为1万次;学习速率为0.1;误差精度是10(-6),得到以下数据:
图1 学习次数图
图2 训练效果图
图3 训练集拟合度
图4 测试集拟合度
图1表示随着学习次数的增加模型的训练精度越来越接近我们设定的10(-6);图2表示数据点越接近Y=X表示训练精度越高;图3表示与实际虚拟机性能的拟合度;图4表示与实际数据的拟合度。综上可发现模型对于训练集拟合效果很高,但对测试集效果出现过拟合现象,通过改进得到:
图5 学习次数图
图6训练效果图
图7 训练集拟合度
图8 测试集拟合度
通过对图5-8的分析,不难看出改进之后的模型对测试集的拟合效果有了显著的增强,达到了预期的精度要求。
表2列出目标配置、实际与预测应用性能的对比:
表2 性能对比表
通过对样本数据分析提取出了特征参数,设计对不同虚拟机都有良好的适应性。对过拟合现象做出了明确的解释与修正,为后续工作者提供了有力的理论支持。我们虽实现了对物理机资源池的占用,但也有不足:数据均是在同一台物理上采集的,对其他物理机的适应性存在一些差异,可能会影响模型的预测精度,此外模型只能以程序的形式调用。