吕 磊 / 新疆维吾尔自治区重要信息系统灾难备份中心
试析数据中心运行管理
吕 磊 / 新疆维吾尔自治区重要信息系统灾难备份中心
进入21世纪以来,我国加快了国民经济与社会信息化建设的步伐,将其作为提升政府执政能力、改善民生、推动社会与经济发展的重要手段。数据中心作为信息化的重要基础建设,是信息处理的枢纽,是信息交流的总汇。
数据中心;运行;管理
随着数据中心建设与应用在国内的蓬勃发展,数据中心运维管理问题越来越得到业内的广泛重视。数据显示,2012年中国数据中心运维市场规模达62亿元,2013年中国数据中心运维市场规模达到77亿元,增长率为24.2%;2014年中国数据中心运维市场规模达到94亿元,增长率为22.1%;预计后续几年,数据中心运维服务的年增长率持续在22%以上。由于用户对数据中心运维管理服务于业务价值的进一步解析,运维管理服务在企业发展生命周期中得到了前所未有的高度重视。为做好数据中心的运维管理工作,探索并奠定科学先进的运维管理理论和技术基础,逐步建立完善高效、规范的数据中心运维管理制度体系,确保数据中心安全、可靠、持续与高效运行,为业务信息系统稳定运行和信息资源综合利用提供坚实的基础支持,本文就数据中心运维管理的主要内容进行了初步研究。
随着互联网基础设施和技术的发展,特别是WEB技术的成熟和应用,应用软件系统从文件/个人桌面体系结构和客户/服务器体系结构发展为浏览器/服务器体系结构。只要网络具有足够的带宽,桌面用户就可以从不需要安装任何前段软件情况下,通过浏览器调用存放在任何地理位置上的服务器中的应用软件系统,这就给应用服务器提供商(ASP)模式的出现奠定了技术基础。
与此同时,互联网时代的IT技术以前所未有的速度快速发展,使得最终用户用于硬件设备、通信线路、操作软件和人员培训上的投资和成本不断增加。各方开始寻求新的经营模式以减轻IT一次性投资压力,降低一次性投资风险及运营成本,建立自己的核心价值,这就使得ASP模式的出现和广泛应用成为必然。在某种程度上,这种模式是由第二个发展时期----Web Hosting时期演化而来。但在主机托管模式中,用户只是将Web页面交由ISP服务商托管,而在ASP模式中,各经济组织则是将基于Web技术的应用交由ASP运营商托管,通常将这个时期称为应用委托时期,这个时期,比较成熟的IDC模式正式出现。其中,1998年以主机托管为主营业务的美国Exodus通信公司的建立标志着IDC模式的正式出现。
而对于普通机构来说,随着信息化应用的不断拓展和深入,对应用系统数据集中的要求也越来越高。目前,数据集中技术已完全成熟,它已经成为应用系统必然的应用模式。伴随着信息技术的不断发展,数据中心的内涵也越发丰富。
新疆发展大数据产业,具有很多优势。一是在国家“一带一路”战略中,新疆是丝绸之路经济带核心区,目前正在打造丝绸之路经济带重要的区域交通枢纽中心、商贸物流中心、金融中心、文化科教中心、医疗服务中心,以及国家大型油气生产加工和储备基地、大型煤炭煤电煤化工基地、大型风电和光伏发电基地,国家能源、交通、通信等综合大通道。这些产业都是数据密集产业,同时也需要进行海量的数据交换,可以为大数据产业发展提供广阔的驰聘空间。二是大数据服务器耗电量大,维护成本高,新疆的能源优势能够为大数据企业提供廉价、稳定的电力资源,降低企业运行成本。
在自治区第八次党代会上,自治区党委明确提出,“加快数据中心基地建设,推进云计算产业发展,加快国际通信建设,提高社会信息化水平,努力构筑向西开放的国际通信和信息传输大通道”。
2011年新疆启动“天山云计划”,计划在未来10年把新疆打造成我国乃至中西南亚的云计算数据之都。通过前期培育、产业集群发展、产业价值升值3个阶段,在2020年建成乌鲁木齐、克拉玛依两个云计算产业基地,两大数据基地投资规模将不少于500亿元,实现云服务产值100亿元以上。
要确保数据中心安全、可靠、持续、低耗与高效地运行,必须做好运行管理工作。要做好运行管理工作,必须尽快建立高效、规范的运维体系。只有将规范和流程引入到混乱的运行环境中,让每个运维技术人员一丝不苟地按规范做,让经常做的事情制度化,让制度化的事情标准化,让标准化的事情规范化,才能构建完善规范的运维体系,提升运维管理水平。在建立健全运维体系的过程中,要不断引入运行管理的新理念、新技术与新方法,实现节能、高效、简化管理的目的,改善系统的运维质量,保证数据中心安全稳定运行。
1.管理的目标、任务和内容。
运行管理的目标就是通过强化与规范运行管理工作,确保数据中心安全稳定运行,为数据中心的IT关键设备运营管理和数据信息安全,提供可持续的有利保障;为实现信息资源存储、保护和应用,以及核心运行提供高可用性、持续可靠的服务支撑。
数据中心进入使用阶段后,主要任务就是对数据中心进行管理和维护,包括对基础设施、业务系统、数据库及业务系统运行状态的监视监测,及时发现与处理问题;对应用系统的运行进行实时控制,记录其运行状态,进行必要的修改与功能扩充,以便使应用系统真正符合管理决策的需要,为管理决策者服务,是数据中心真正发挥作用。
高效的数据中心,如果管理不规范,缺乏科学地组织与管理,数据中心的作用就不能充分发挥,本身也会陷入混乱。管理是多方面的,即包括数据中心日常的规章制度及规章制度的执行程度,还包括对数据中心中各系统运行的可靠管理。
(3)pH条件优化。进行不同pH值条件下(pH值分别为2、3、4、5、6)的小试实验,控制双氧水加药量均为1.5%,反应时间均为1.5 h进行实验,反应完全后调节pH至8~9静置沉淀30 min后取上清液测COD。
在数据中心运维过程中,人员因素应该是首要考虑的因素。无论多么先进的设备和技术,如果没有人进行管理是不能很好发挥作用的。因此数据中心在建设过程中必须考虑运维队伍建设问题,如果等数据中心从“建设期”转入“维护期”才考虑队伍建设,那就不利于提高运行管理效率。
同时,加强应急管理、提高系统可用率。建立完善的运行管理专项应急预案,明确运维人员在技术、管理、业务、安全等方面的职责,把责任落实到岗、落实到人;定期进行预案演练,并根据演练结果及时更新预案;配备核心应用和关键设备的备品备件,以备出现突发事件时尽快更换,及时修复,缩小影响,减少停运事件,提高可用率。
2.数据中心管理制度的建立与实施。
完善的管理制度是数据中心运行管理的保障。数据中心的基本规章制度包括三方面:管理规范、技术规范、操作指南。
管理规范:是从规范管理人员及用户行为出发的各种制度、规定、办法与奖惩措施。
技术规范:是规范运维人员在运行维护过程中各种行为的规定、规范与工作流程,例如《应用服务管理规定》《机房管理规定》《信息系统运行管理规程》《数据备份策略》。
操作指南:指导运行管理人员及用户管理使用各种网络与信息系统的操作指南与用户手册,如《网站简易维护指南》《信息门户使用指南》《OA系统安装使用手册》《生产MIS作业指导书》《服务器安装手册》等。
可以看出,在信息化发展到一定阶段,数据中心的建设重点应该要从系统实施转向以应用运维提升为主,运维质量保障、安全机制变得重要起来,这时除了技术保障外,制度保障显得越发重要。
作为数据中心主管人员,应首先是一位管理专家,其次才是技术专家。由此,建立完善的运维制度是最主要的工作内容。可从以下几个方面,使数据中心运行管理制度化。
①转变运维观念,树立规范化意识。只有树立制度化的IT运维意识,才能在日常繁杂琐碎的工作中有效地区分任务的优先级,将有限的资源投入到最能满足需求的工作中。
②建立事件处理流程,强化规范执行力度。流程是最重要的,因为流程是IT管理的基础,在IT管理的过程中,针对同一问题的具体实施步骤可能不同,但流程是不会改变的。
③设立ITIL服务台,引入优先处理原则。设立服务台以确定服务要求和IT运维目标,ITIL指南要求数据中心管理者定义服务台的关键流程,不仅仅定义流程是什么,还包括它们是如何运作的,并指出每个流程的影响和意义。
对于一个良好运营的数据中心,其生命周期经历了从咨询规划、布局建设、使用维护、升级优化等多个阶段。在这漫长的过程中,“运维”是其中最重要、也是最长久的环节。在运维工程中,安全、架构、自动化、预警、虚拟化、流程、工具、培训等等无不贯穿于其中。因此,做好数据中心运行管理工作,对提高数据中心效率、节能降耗、安全稳定运行具有重要意义。