安 杉
(中国人民大学附属中学 信息中心,北京100080)
人大附中教育信息化建设一直走在全国前列,始终致力于教育信息化的超前探索。2012年6月,人大附中成为教育部教育信息化试点校之一。教育部、北京市和海淀区的领导对人大附中的信息化建设给予了高度评价。
成熟的IT组织中,项目后期的系统运维及服务管理的投入一般占总项目投入的70%,远高于系统建设成本,现在学校教育信息化建设也从早期的硬件建设为主演进为管理能力提升、服务能力提升阶段。人大附中信息中心以为教职员工提供最优质的IT服务,探索最精益化的IT管理水平为工作重心,从管理能力和管理手段上不断创新,不断发展。人大附中于2004年开始尝试采用运维服务外包模式为教职员工提供技术支持服务,不断引入先进的IT服务管理技术和工具提升信息系统管理水平,为学校的教育信息化发展提供了坚实的保障。
人大附中数据中心现有教育教学系统30余个,服务器、网络设备数量已经接近400台,内部数据累计100T、IT支持服务日均30个服务事件。面对越来越多的应用系统、网络设备、主机、数据库、安全设备,运行维护的工作内容和复杂度随之大幅度增加,对信息系统运维保障的质量要求也越来越高。原有运行维护手段的局限性就愈见突出,具体表现为如下几点。
(1)缺少业务系统监控手段,服务响应被动
学校一直未部署系统管理软件,当系统发生故障,工程师需要到达现场连接设备查看运行情况。缺乏对关键设备的监控手段,缺乏集中的主动式故障预警能力。不能全面分析系统运行的性能状况和提前发现系统的潜在隐患。往往是业务中断了很久之后管理员才被通知故障发生,此时已经产生了严重影响。
(2)信息系统的安全性挑战日益增加
IT系统的安全平稳运行不仅关系到学校,而且联系着社会上的多个行业、部门及个人,为此学校网络的运行质量和效率、IT资源的安全性、稳定性显得更加重要和突出。而与之相对应的是IT运维管理工作多年来一直处于手工处理维护的状况,各种服务工作始终处于一种被动的状态之中。
(3)信息技术服务没有统一的服务平台
随着近年来信息化的投入不断增加,越来越多的业务系统上线,信息中心可以为教职员工提供的服务越来越丰富,但是新教师没有一个界面能够全面了解信息服务,用户需要拨打多个电话才能找到一个人,办好一件事,严重影响工作效率,降低了用户的服务体验和满意度。
(4)日常运维工作占用了大量的人力资源
学校现有约30个业务系统,100台服务器,完成对其运行情况和系统日志检查需要10个小时,任务执行起来难度较大。由于缺乏系统化运维手段,需要较多的运维工时才能完成对关键信息系统的运行监控和维护操作,运维人员的数量会随着信息系统的增加而不断增加。
(5)无法有效管理外包服务商
人大附中于2004年开始采用运维服务外包模式为教职员工提供技术支持服务,外包服务团队承担了绝大部分的日常维护和支持工作,现阶段IT服务中心已经入驻多家公司的服务团队,在多年的运维服务外包合作中,信息中心已经摸索出一套针对外包服务商的管理和考核办法,但是依然缺乏工具支撑,如何有效衡量其工作量,准确评价供应商服务效果,及时掌握供应商的服务质量达成情况,避免由于供应商的服务质量而导致运行风险是信息中心服务管理中面临的一项挑战。需要对用户、信息中心教师和服务商工程师的服务过程进行全面且科学的管理。
随着人大附中信息系统的不断丰富,管理复杂度要求不断提高,促使运维服务工作也要从传统技术管理向服务管理转化,结合ITIL和ITSS等国内外先进的运维服务理念,建立了统一的运维服务管理体系。
根据人大附中的业务规模以及人员结构特点,建立包括事件管理、问题管理、配置管理、变更管理在内的运维服务管理流程,通过设置SLA服务级别和标准化服务报告管理,实现服务管理的两个闭环,不断更新和持续改进。通过采用先进的运维服务工具软件实现运维服务的电子化,标准化和体系化。服务管理体系设计如图1所示。
图1服务管理体系
人大附中为全体教职员工提供的信息服务包含信息、电教、图书信息服务,由三个子部门和一个专职的IT服务中心进行交付,其中人大附中信息中心是承担学校教育信息化建设和计算机教学职能的部门,是教学与服务相结合的部门。我们的信息服务组织架构如图2所示。
人大附中IT服务中心是面向教职员工的接口,由外部服务商派驻工程师提供技术支持服务,也就是说用户首先接触的是IT服务中心,IT服务中心判别无法处理或者需要资源申请的事情,升级至信息中心或者电教中心。
图2信息服务组织架构
人大附中电教中心主要承担了各级各类活动现场拍摄、数字化音视频资料采编和管理、现代化教学环境的技术支持服务、学校宣传资料设计制作、大型综合会议与重大活动技术支持与保障工作。
图书馆为读者提供书刊借阅、数字资源查询、图书馆知识培训、阅读指导、教学参考资料等服务。统一服务中心的概念如图3所示。
图3统一服务中心
人大附中IT服务中心通过呼叫中心系统实现类似10086的统一服务热线,通过热线接入自动弹出呼入人员信息,在服务管理系统内进行记录、处理和关闭。通过统一服务中心接入服务申请,科学地分派和升级,极大缩短故障处理时间,提升IT服务台预处理能力和减少现场服务次数。利用搭建起来的呼叫平台进行高效的数据统计、分析和智能预警。
用户也可以通过自助服务平台提交服务请求,当请求被受理和关闭时将自动发送相关活动信息至用户校内邮箱,简化了用户服务请求过程,提高了沟通效率,提升了用户服务体验。通过服务管理系统将故障信息采集和统一处理。即将网络管理、系统管理、机房环境管理等功能整合在一起,实现统一的监控数据采集、一体化的报警数据处理、统一的故障流程处理。
人大附中于2004年开始采用运维服务外包模式,经过多方的合作交流,人大附中信息中心总结出一套供应商支持的合作模式。
信息中心统一供应商的服务管理活动,建立以服务级别达成率为主要依据的评价和考核策略,结合乙方项目考核指标,将供应商的服务过程记录在服务管理平台上,促使多个供应商的服务视角一致。要求供应商按照合同约定定期提交统一格式的运维服务报告。
信息中心定期发起对部门内部员工和外部供应商工程师的服务意识与服务能力培训,在信息中心的倡导下,IT服务中心的绝大部分服务工程师已经通过了ITIL(服务管理方法论)的培训和认证,这也是服务流程可以被很好执行的重要原因。
对乙方的服务质量进行统计和监督,同时信息部门也需要知道自己的信息资产的容量和可用性信息,传统方法是在事件记录表中增加一列用以记录你关注的事件类别的故障次数、无故障时间、故障数量、平均修复时间,单位时间内的可用性是多少,这一列信息就是我们的技术服务目录,作为供应商付款依据,也同时是信息中心所管理的信息资产的可用性监控、资金投入分析决策的数据支撑。
对于全体教职员工来说,谈到信息化的价值一定是以给用户提高了什么、增加了什么、减少了什么为依据的。这时需要有一个目录来列出信息中心可以为用户提供的服务,这些服务是否收费,获取服务的流程,在申请服务后多久可以获得服务,服务的可用性指标怎么承诺的,服务的支持时间是怎样安排的,为用户总结出这样的一份表单就是IT服务目录。通过服务目录的梳理驱动IT组织内部变革,梳理内部服务的流程,梳理信息部门与供应商直接的关系;梳理出清晰的业务服务目录,是未来服务计费等精细化管理的前提条件。通过服务台、自助服务网站有效记录服务目录内服务项的使用频率,使用习惯,不断优化服务目录内容和展现方式。
图4人大附中IT运维管理页面
人大附中的信息服务目录覆盖信息、电教和图书馆等部门共计57项服务,教职员工可以通过目录了解到自己可以享受到那些资源和服务,尤其对于新入职的教职员工价值尤为突出。人大附中IT运维管理页面如图4所示。
通过部署全面的监控管理系统可以实时了解信息资产的使用情况,监控系统覆盖机房温度和湿度等环境信息,管理服务器、网络设备、安全设备、存储设备和业务服务。当监控对象发生故障或者超出设定阈值时将根据策略通过邮件、短信等通知到指定联系人。关键服务中断将直接生成事件记录自动导入到服务管理平台,由服务台工程师按照流程进行处理或上报。服务管控示意如图5所示。
图5服务管控示意
通过监控管理系统规范了运行管理,有序开展系统维护窗口。将管理数据电子化,管理过程规范化。通过监控系统生成性能分析报表、资源统计报表;为运维服务提供分析报表,如统计业务系统的平均无故障运行时间,运行维护的事件、发生故障的原因,技术人员根据报表及时将经常发生的事件上升为问题。通过运维服务管理体系的不断完善和固化。
随着IT系统的发展及内部用户数量的增加,人大附中信息中心通过部署服务管理平台实现了服务台、事件管理、问题管理、知识库管理等运维流程工具并固化流程,使运维工作能够实现标准化、流程化、自动化。量化运行质量和服务水平,提高IT系统的运行效率。
使用规范化的流程管理办法,使以往繁杂无序的运维服务管理工作变得标准有序,实现IT运维服务管理工作从被动管理向主动服务的转化,为信息中心管理人员和IT服务支持人员提供一个灵活、易于量化的管理平台。服务管理平台结构如图6所示。
图6服务管理平台结构
通过服务管理平台与呼叫中心系统和信息监控管理系统接口,实现了从用户自服务申请、电话呼入申请、系统监控事件等多种方式发起了服务请求,对服务范围内事件进行全生命周期的跟踪,监控和报告管理。
人大附中信息系统管理参照ITIL(信息服务管理方法论)管理思想,结合实际情况进行信息系统服务管理流程的设计和执行。服务支持过程包括事件的记录、支持、升级、关闭、变更和知识管理等活动。事件管理流程概览如图7所示。
图7事件管理流程概览
(1)事件记录和初始支持
事件记录和初始支持是事件管理流程的起点。所有教职员用报告或系统监控产生的IT事件都必须从这个步骤开始。该步骤的目的是快速、准确地探测和捕捉所有在IT生产环境中发生的事件,并在其他管理流程中帮助确定问题和解决问题。同时及时将信息通知到相关的部门。在本活动中,将收集创建一个事件单所需要的信息。重点是准确、完整地记录必要的信息。该步骤的一项重要任务是对每个事件进行正确的分类,随即在现存的解决方案中查询与该事件相匹配的方案。
(2)事件调查和诊断
这个步骤阶段的目标是进行深入的调查,以解决事件。各个技术水平的运维工程师将会参与寻找一个解决方案或变通方案。如果还是不能解决事件,可能需要问题管理流程也参与进来进行更加深入的分析研究。
(3)事件解决与升级
这个步骤尝试使用解决方案和变通方法来解决事件。某些情况下,需要升级的二线或者其他部门协调处理。
部分需要投入资源或者设计基础架构变化的操作需要引入变更审批活动,对过程的风险和业务窗口进行批准和评估。对于某些事件,即使得到了解决,仍然需要创建问题单以进一步寻找其根源。
(4)事件关闭
这个步骤确保客户对事件的处理情况感到满意,建议用户在系统内直接填写满意度反馈信息,默认7个工作日满意度自动生效为“满意”。同时需要确认事件单的信息是正确、完整的,以便于以后生成报表。另外,处理过程中的经验认为是有分享价值的需要升级到知识管理流程,以形成可重用的知识。
服务管理项目立项初,会担心监控效果不理想,经实际考察市场已经有很多可以提供IT运维服务管理咨询及其工具的公司,网络监控管理系统经过十几年的发展已经趋于成熟,解决方案提供商数量丰富,有较大选择空间,在学校实施可以先对其监控功能进行测试,满足所需监控和告警功能点后再进行采购。
很多组织针对IT服务管理立项后,项目实施效果不理想,缺少事件记录,或者记录得不详细,无分析价值。针对这种情况在信息中心和IT服务中心组织了多次服务管理及工具的培训,并且要求乙方供应商对员工进行管理考核,通过乙方个人绩效指标与现有ITSM系统指标结合的方式共同推进系统的使用。
要求用户在申请资源类服务时必须进入系统填报信息,不断总结常见问题的解决方法更新到知识库中,系统在受理服务请求和关闭服务请求都会给申请用户发送邮件通知,在用户的使用中慢慢体会到系统的便利性,系统的用户参与度将不断提高。
服务台的建立改变了用户申报服务需求的方式,用户在服务台刚建立之初由于缺乏直接感知,会对服务台的功能和效果提出质疑甚至是抵制,对于此类情况:
首先,加强宣传和引导,使用户了解自助服务台的职能和功能,逐渐提升用户感知。通过知识库的建立,不断完善各种应用系统配置手册和解决办法,系统支持个人服务过程查询,如资源申请的审批情况和进展情况,提高系统的利用率。
其次,采用循序渐进的方式,加强用户服务体验,逐步建立用户与服务台之间的信任关系。当服务台方便、快捷、有效的价值逐渐展现时,有问题找服务台的意识行为将形成用户的一种习惯。
最后,在通过管理规定要求所有用户向自助服务台申报服务需求,将收到较好的效果。通过信息系统发布各种资源,可以在Its.rdfz.cn门户中进行虚拟机申请,账户申请,电教资源申请等活动,不断提高系统的利用率。
通过信息服务系统管理能力的提升,提高了服务工程师的服务意识,提高了IT部门主动服务的能力,从技术手段和管理手段上保证信息系统性能指标的可视性,真正实现统一管理、集中监控,全面提升信息系统管理水平和用户的服务体验。
信息中心可以全面、深入地对数据中心机房IT基础支撑系统(如网络、网络设备、服务器、数据库系统、中间件系统、安全设备等)和业务系统进行全面的了解,实现信息系统综合管理的目标,根据采集的各类数据,集中、形象、快速地展现网络、系统、应用以及业务的状态及变化,并快速地发现、定位网络系统的各种问题、变化和隐患,方便有效地对其进行分析研究,快速地隔离、解决这些问题。从而提高业务系统的可靠性,改善系统性能,提高处理效率。
通过一系列高效深入的监控手段不但能保证各项业务系统的稳定运行,还保证了数据的安全。通过对网络性能进行监控,建立性能处理的基线,定期提供性能报表和趋势表,可以根据趋势分析,提出性能优化的建议,并通过历史性能指标对网络状况和设备运行状况进行分析,及时发现和解决潜在问题,规避风险,优化网络,最终使网络处于良好的运行状态,保障整体网络及应用系统的稳定运行。
改变以往系统管理员手工操作复杂(如查找故障问题、数据统计等),顾此失彼、事倍功半的工作方式,通过建立和规范运行维护流程,建立系统故障处理的工作流,减少出错,不断跟踪流程和充实维护知识经验,提高运行维护的效率。
从被动响应式工作方式转变成主动服务,提高信息中心的工作质量和服务能力,保障包括各项系统在内的各项IT系统的安全、稳定和高效运行,全面提升信息系统的服务质量。
建设统一服务台和热线接收服务申请,避免找不到运维人员的情况发生;同时由服务台负责对用户各种服务需求处理进度进行跟踪和督促,用户通过服务管理平台查询处理进度,减少了沟通成本,提升了服务处理的效率和满意度。
IT服务管理强调IT与业务需求的有效融合,IT服务管理需要针对学校业务和用户真实的可用性需求,对业务系统支持能力进行合理的安排和设计;通过事件管理、问题管理等流程的稳定、规范运行全面支持IT基础架构和学校业务的稳定持续运行,保证IT资源的有效利用和业务系统运行的高可用性和高安全性。
为了保证IT系统稳定、可靠、高效、安全地运行,在充分利用已有资源并持续优化资源配置,全面支撑学校发展规划和需要,最终实现IT和业务目标的统一。
通过对信息服务管理能力地不断探索和实践,人大附中实现了信息服务精细化管理,信息系统管理水平得到显著提高,有效提高业务服务质量,推进服务管理向价值管理逐步靠近,进一步提高信息系统的应用价值,为打造人大附中核心竞争力发挥积极作用。
人大附中信息系统运行维护过程逐步符合最佳实践要求,已经具备通过ISO20000管理体系的认证的要求,人大附中信息中心将从部门文化、服务意识、管理流程等各方面继续提升管理和服务能力。人大附中信息系统管理也将达到全国领先,世界一流的水平。