云终端资源中心的桌面资源优化研究

2015-05-30 16:27邓华王刚鲍娌娜
中国新通信 2015年17期
关键词:优化

邓华 王刚 鲍娌娜

【摘要】 桌面虚拟化技术的发展和应用,极大改变了企业桌面终端的部署方式和使用观念,构建云终端资源中心提供云终端服务是电力行业信息化建设一体化、集约化的必然结果。文章分析了云终端资源中心的系统架构和特点,并从云终端资源中心的桌面资源需求、桌面资源风暴、桌面资源优化等几方面讨论了其大规模集中部署需关注的问题。

【关键词】 云终端 桌面资源 优化

一、 引言

为落实国家电网公司“集约化”管理要求,提高员工终端的管控水平,国网山东省电力公司开展了云终端试点及推广建设工作。云终端采用“集中计算,分布显示”的架构,通过虚拟化技术,将所有办公计算机的运算合为一体,在服务器端进行集中处理,员工采用瘦终端设备,仅负责输入输出与界面显示,不参与任何计算和应用,具有高效、绿色的特点。

二、云终端资源中心

山东省电力公司根据云终端规划数量及基础环境、网络资源、数据安全、运维管理等方面情况,计划构建两个资源中心为云终端提供资源服务。每资源中心承载约6000点访问用户,资源中心包括云终端服务系统、云终端操作行为审计系统、云终端云硬盘服务系统。云终端服务系统由基础架构资源池和多个桌面承载服务器构成。基础架构资源池主要包括AD域控服务器、DHCP服务器、访问站点服务器、数据库服务器、文件共享服务器、云终端控制台、云安全终端设备管理服务端以及桌面控制器;桌面承载服务器可以承载资源型桌面、标准型桌面以及作业型桌面。云终端操作行为审计系统主要用于实时采集员工的办公操作,进行实时审计,并将审计数据集中存储管理,有效的避免违规或违法操作、以及敏感数据泄露。云终端云硬盘服务系统采用PC服务器+云硬盘子系统(软件)替代昂贵的阵列存储,为个人提供按需的存储空间(Z盘),并且提供文件共享、文件备份、数据冗余、通讯录等功能。

三、桌面资源需求分析

桌面承载服务器采用服务器虚拟化技术对外提供CPU、内存、网络等资源服务,虚拟化技术的高可用性、冗余性、动态资源调配、虚拟资源共享等功能,保障了云终端的可靠稳定运行。

资源型桌面:为高权限、高安全、外设需求复杂的用户分配的一对一的专有桌面。每个用户完全占有资源:2个虚拟CPU\4G内存\30G系统数据\10G用户数据\100G云硬盘。

标准型桌面:为多数日常办公用户分配的一对多的共享办公桌面,配置普通用户权限、安装标准的应用软件。按照1:15的比例进行配置,即为15个用户共享资源:16个虚拟CPU\32G内存\50G系统数据\10G用户数据\100G云硬盘。

作业型桌面:为终端配置要求较低、软件需求单一的用户分配的办公资源,不含完整桌面。按照1:25的比例进行配置,即为25个用户共享资源:8个虚拟CPU\16G内存\50G系统数据\10G用户数据\100G云硬盘。

云终端资源中心的存储系统包括集中存储系统和分布式存储系统。

集中存储系统是基于块存储的FC SAN(光纤存储)、ISCSI存储和基于文件系统的NAS存储。桌面虚拟化系统放置在FC存储上,FC存储交换机与服务器采用交叉连接,形成冗余的存储链路网;所有的存储数据都需要从业务交换机通过,当虚拟机启动时会对交换机造成巨大的压力,因此,在iSCSI存储上放置一些用户数据文件;NAS存储能提供大容量的存储空间,且存储成本较低,因此,主要用于存储用户的配置文件和用户数据文件。

分布式存储系统是由应用服务器(集群)、元数据服务器(集群)、智能存储服务器(集群)组成,用于提供云硬盘服务,在客户端以Z盘的形式为员工提供数据存储和交互服务。(图2)

四、桌面资源存在的问题

按资源型桌面1800用户、标准型桌面3000用户、作业型桌面1200用户、网络打印600用户计算,在带宽满足的情况下,云终端资源中心在硬盘数据读写方面是性能瓶颈。硬盘数据读写性能指标是IOPS,即每秒进行读写操作的次数。SSD硬盘可达200000 IOPS,15K转速硬盘150 IOPS,10K转速硬盘110 IOPS,7.2K转速硬盘80 IOPS,5.4K转速硬盘50 IOPS 。根据思杰公司Citrix_Virtual_Desktop_Handbook_7x指导手册,考虑到电力信息内网操作系统上要安装行为监控程序和杀毒软件,在桌面系统启动时需对系统文件进行扫描,如木马、病毒、关键字、安全保密文件、使用习惯等,会对I/O有一定的影响,计算IOPS时要比思杰公司指导手册推荐值要大,因此,资源型桌面设定为30IOPS,标准型桌面为8 IOPS,作业型桌面为5 IOPS 。当大量用户集中爆发式请求时,可能会引起资源冲突:一个典型的Windows 7虚拟桌面部署需要20GB到30GB(或更多)的共享存储容量。此外,每个虚拟桌面的平均IOPS为5到10IOPS,但是在开机启动时大约上升6倍左右,在30 IOPS 到60 IOPS之间。如果在同一时间(上班时间)大量用户集中启动桌面虚拟资源就会造成响应延迟,形成启动风暴。在集中的时间用户集中登录访问系统资源,引起系统资源在集中的时间加载,形成资源冲突,称为登录风暴。在内网部署杀毒软件定期制定扫描策略,在桌面虚拟化集中部署的环境中,对磁盘文件集中扫描会极大增加对共享存储的读写访问,会引起系统运行缓慢,称为杀毒风暴。操作系统或者应用软件通过WSUS或者补丁服务器更新时,产生的连接请求会形成资源冲突,类似杀毒风暴,称为更新风暴。

五、桌面资源优化方案

通过搭建承载50个资源型桌面的实验环境,模拟按顺序启动和同时启动观察系统资源分布在不同磁盘类型上的访问速度和磁盘读写速度进行分析比较。

桌面虚拟服务器:4路8核256G内存2*300GSAS磁盘RAID1,8GBHBA卡,2*千兆网卡。

存储系统:4G缓存,2*300G SSDRAID1磁盘,6*600G SAS15KRAID1磁盘,6*2TBSATA7.2KRAID1磁盘,双控制器,8GBFC接口。

软件:Xenserver6.2,Xendesktop 7.0,桌面系统Windows 7,服务器系统Windows server 2008,SysTrack VDI评测工具。

50用户Win7桌面每用户在启动同时访问存储,启动时候50用户的IOPS=50*30=1500,系统文件存储到SATA磁盘上时,存储的IOPS=(IOPS总量*写的比例)/raid损耗+(IOPS总量*读的比例)=(6*80*80%)/2+(6*80*20%)=288,存储到SAS磁盘上时IOPS=(6*180*80%)/2+(6*180*20%)=540,存储到SSD磁盘上的IOPS=(2*200000*80%)/2+(2*200000*20%)=320000。在实验环境下,如要满足50用户同时登陆,则需要合理分配资源到不同的raid组中才能满足IOPS的需要。如果将资源同时放到一种SAS或SATA类型的磁盘组中就会产生启动风暴,将资源完全放到SAS磁盘组中所有用户启动时间约为15-20分钟。

因此,云终端的存储环境需要仔细规划,以避免启动风暴的产生,即当大量的用户同时登录系统时所造成的系统反应非常缓慢。通过实验我们得出以下几种优化方案:1)增加磁盘数量以提高IOPS;2)使用SSD硬盘以提高整体IOPS;3)通过存储的特有技术实现分层管理整体提升IOPS;4)通过使用管理策略,避免虚拟桌面的同时启动。

增加磁盘数量以提高IOPS的方式在小规模部署环境下是可以的但是在云终端资源中心6000点的部署规模的情况下,考增加磁盘数量提高IOPS的做法不可取,会极大增加硬件投入而且浪费资源空间。我们知道一旦用户系统启动,登录和加载应用之后,存储I/O通常将保持在一个比较低的水平,也就是在某一个特定的时间段内资源会非常紧张。虚拟桌面在启动时和启动之后所产生的IOPS有着天壤之别,导致云终端环境下的存储架构设计极具挑战性。通常,运行Windows 7的虚拟桌面在启动时会产生30到60个IOPS,一旦运行平稳,平均IOPS下降到5-10。因此,为了满足由启动风暴引起的I/O需求,你的存储系统通常需要设计成能满足这种最坏的情况。仅仅为满足启动风暴时的IOPS需求而设计的存储架构将相当昂贵。如果为增加存储系统的IOPS处理能力增加更多的的物理磁盘,是不可取的。

使用SSD固态硬盘,是解决启动、登录、退出风暴的一种比较好的方式,由于SSD 固态硬盘的成本比较高,不可能完全采用SSD硬盘需要根据实际情况结合使用,可以使用大量价格相对较低的SAS和 SATA磁盘来满足磁盘容量的需求,同时少量的SSD磁盘来满足处理高峰期I/O负载的性能需求。将某些文件放在SSD上。比如将虚拟机的母版映像文件和副本放置SSD存储池中。使用Machine Creation Services,母版映像文件作为只读磁盘为所有桌面虚拟机所共享。它是所有部署的桌面操作系统的母盘,然后每个虚拟机将单独保留一份可写的快照以存放所有对于母盘的修改。当桌面虚拟机经历启动过程时,大部分的磁盘活动来自于母版映像,也就是大部分的操作系统文件和应用文件存放的地方。因此,将母版映像和副本存放在SSD存储上可以消除启动风暴。其它所有单独的虚拟机快照磁盘可以存放在较低层级(SAS或SATA)的存储上。 也可以使用SSD作为缓存层将快速的SSD磁盘作为缓存层放置在由SAS和SATA组成的较慢存储池的前端,所有的存储I/O都将通过它到达后端的存储设备。缓存硬件装置可以识别频繁访问的磁盘数据块,并自动将其缓存,这样这些数据块将可以从快速的SSD磁盘读取,而非从较慢的后端存储。通过缓存一些共同的数据如虚拟机母版映像,它可以按需动态调整以满足任何高I/O需求,从而消除启动风暴。

需要注意的是实现这些解决方案的最佳时机是在项目的设计阶段。目前,很多的存储设备都具备存储分层的功能,支持将不同性能特征的磁盘放置在同一存储池里。它们也可以用来解决由启动风暴引起的存储 I/O瓶颈问题。通过加入由少量SSD磁盘组成的存储池,你可以将虚拟机母版映像从较慢的存储层转移到SSD存储层,以处理由启动风暴引起的大量I/O。

云硬盘服务采用分布式存储技术,配置PC服务器加大容量磁盘通过分布式存储软件进行资源的集中管理,为用户提供云硬盘服务,主要存放用户个人文件数据。同时存放行为审计的数据信息。每用户约20IOPS,由于不会集中大规模使用云硬盘服务所以此部分爆发资源风暴的可能性较低,按照IOPS的需求计算方式,在配置RAID级别的时候进行选择RAID1或10的方式,一方面可以提供数据的冗余性,另一方面提高磁盘的IOPS值,以满足用户需求。

同时在管理上要合理分配资源,通过行为审计和用户信息数据的收集,通过大数据分析工具或BI工具对数据进行分析展现,形成用户使用行为分析以辅助资源的调配优化。桌面虚拟化管理工具提供了对用户行为的审计和监控功能,包括用户的资源使用情况,由于用户数量多,产生的数据量大,通过专业的分析工具进行不同维度的分析能够形成指导资源分配的列表。包括那些以用户在某一段时间启动或登录系统的概率以及用户使用系统资源的类型、资源占用情况等都可以进一步挖掘。在大规模集中式部署的情况下,对数据的深入细致的挖掘对提前进行资源的配置,优化可以从另一个层面解决启动、登录、退出风暴的发生。

对于杀毒和更新风暴的解决需要从技术和管理方式两方面考虑。技术架构上采用网关防毒的方式,减少杀毒软件虚拟桌面系统Agent的部署,或者采用API接口集成的无代理的杀毒软件产品。从管理上避免集中全面扫描,通过模板部署的虚拟化桌面对杀毒软件进行重新配置,修改自动扫描、全面扫描、自动更新、手动更新策略,按照时间进行规划只扫描关键文件路径、更新策略按照时间进行规划,关闭开机或重启自动更新防病毒定义的策略。更多的从管理制度上规范内网终端的使用,避免违规外联、USB移动介质、网络共享访问带来的安全风险。

六、结束语

目前没有一种技术能够完全彻底解决云终端的资源风暴问题,但可以通过技术组合、管理等方面的手段去优化从而降低资源风暴的产生概率。桌面云终端系统作为新的解决方案已经开始被企业所接受,必将改变信息化的构建和管理方式。山东电力公司结合实际需求构建集中式云终端资源中心是集约化、一体化的信息建设需要,也是发展的必然趋势。

本文从集中式大规模桌面云终端部署可能产生的资源风暴进行分析,结合山东省电力公司云终端资源中心建设的背景和需求,提出了多种优化方案,旨在指导项目实施,并为资源中心建设提供建议和参考。

参 考 文 献

[1]XenDesktop.[EB/OL].http://www.citrix.com.cn/products/xendesktop/index.aspx.

[2]XenDesktop.[EB/OL]http://support.citrix.com/content/dam/supportWS/kA460000000CoLKCA0/Citrix_Virtual_Desktop_Handbook_(7x).pdf

[3]吴雷雷,李华. 存储对桌面云的影响分析[J]. 中国高新技术企业,2015, (8)

[4]贾宝军,周巍. 桌面云系统中的带宽及网络需求研究[J]. 互联网天地,2013, (3)

[5]何永远. 桌面云终端系统在电力行业中的典型应用[J]. 电力信息通信技术,2014, (12)

猜你喜欢
优化
超限高层建筑结构设计与优化思考
PEMFC流道的多目标优化
民用建筑防烟排烟设计优化探讨
关于优化消防安全告知承诺的一些思考
一道优化题的几何解法
由“形”启“数”优化运算——以2021年解析几何高考题为例
围绕“地、业、人”优化产业扶贫
事业单位中固定资产会计处理的优化
4K HDR性能大幅度优化 JVC DLA-X8 18 BC
几种常见的负载均衡算法的优化