曹璞,陈锐浩(深圳职业技术学院教育技术与信息中心,深圳 518055)
IT事件跟踪管理提升网络服务质量
曹璞,陈锐浩
(深圳职业技术学院教育技术与信息中心,深圳518055)
随着国家对教育信息化战略的推广实施,建设智慧校园成为高校信息化发展主流发展方向,未来的高校信息网络将是以物联网为基础的智慧化校园工作、学习和生活一体化环境,这个一体化环境以各种应用服务系统为载体,将教学、科研、管理和校园生活进行充分融合。作为智慧校园的基础支撑设施校园网建设也从重硬件设施建设阶段进入到整合应用加强IT运维服务管理为主要特征的运行维护阶段。信息化工作的重心从初期基础设施建设逐渐过渡到软硬件建设的均衡发展,。运维服务质量的好坏成为衡量信息化工作是否成功的关键要素。
大部分校园网建设在网络基础设施、广域网升级、云计算平台、网络安全部署等方面已投入入大量经费,但是在网络运维管理方法、技术支持人员能力配备等方面显得薄弱,在校园网IT运维服务过程中被动式服务和运维效率不高成为主要问题,主要表现在下边几个方面:
(1)对用户请求事件处理过程管理中,缺乏有效地对事件处理监控跟踪的机制,网络运维工作随意性大,不能提供可信的量化服务统计分析报告,运维质量难以监督、考核和评估。
(2)对关键业务和普通业务没有建立事件处理的优先级和解决时限关联,不能保障事件解决的实效性和IT资源的有效利用。
(3)对用户请求的事件处理过程和结果归类总结,缺乏解决方案知识库积累。网络运维知识和经验仅局限在个人范围内而不能有效共享,造成运维人员大量的重复性劳动。
针对上述问题,本文准备从完善IT事件跟踪管理机制,逐步建立事件处理流程,合理处理事件的“轻重缓急”关系,结合IT运维中的问题管理,建立运维知识库方面综合提升运维效率来进行探讨。
网络运维事件管理是以校园网IT服务台为中心,统一入口接受用户服务事件请求,通过对事件问题流程化管理,采取SLA管理约束网络服务质量,选定相应运维人员处理相应的用户的请求并限定运维人员的处理时间期限;记录完整的跟踪用户请求的解决过程。最终在事件管理的基础上积累和总结运维解决方案提取形成IT运维知识库,提升网络服务的质量和效率,具体组成方式如图1。
1.1事件记录
通过IT服务中心,为用户提供统一的技术服务支持接入入口,包括Web,Email和自助站点门户等方式接受用户服务事件请求。服务中心记录用户基本信息和事件详细信息,如姓名工号、地点、联系方式,事件发生时间、现象描述、影响范围等。
根据IT运维的规律,多数事件请求具有重现性,重现的事件根据已有维护经验采取措施就可以很快速地解决。服务中心自动将用户服务请求定向为相对应类别的工单。根据运维技术人员的的职责范围或工作类别,基于轮流或动态负载调度模式,自动合理地匹配工单,保证事件请求能被快速有效地接受处理。
图1 网络运维事件跟踪管理
1.2事件调查
技术支持小组接收事件处理任务,更新事件状态和历史信息。并依据SLA协议和优先级矩阵管理事件时效,当一线支持人员没能在约束时间内解决事件时,二线、三线专家小组介入对事件进行调查和分析。
根据SLA协议重新评价事件影响度和优先级,必要时进行调整;记录过程中所有相关信息,包括解决方案、新增或修改的分类;将所有相关事件的更新、花费的时间以及处理结果反馈给服务中心关闭此类事件。经过服务中心反馈用户的请求事件当前所处的状态,尽快把解决措施提供给技术人员和用户。
1.3事件恢复
在分析调查事件反馈的结果上,技术支持小组根据更新的事件信息,和建议的临时措施或解决方案,解决事件并恢复服务同时更新事件历史状态信息。
1.4事件跟踪监督
服务台负责跟踪和监督事件解决整个过程。为了解决对事件处理过程的全程跟踪评估,通过预先定义设计好的的处理流程,管理和跟踪所有事件。通过创建SLA指定条件并配置相应的响应时间和解决时间,提供多级升级策略,有效地追踪SLA的违规情况,有助于保障每个事件在规定的或者最短的时间内得到解决,确保服务团队的服务质量。
1.5事件关闭
事件关闭阶段主要与用户确认事件解决是否成功,用户是否同意事件解决方案和方案的执行及确认最终结果;详细记录事件控制阶段的所有相关信息,如用户是否满意及满意度,处理事件所累计花费的时间成本,事件终止日期和时间。
问题管理主要目的是为了找出事件发生的根本原因,避免相关事件再次发生;与事件管理最主要的区别是事件管理是被动地解决事件,要求时效性,而问题管理是主动地消除事件的发生,减少事件产生的数量。
问题管理通过分析一个或几个相关事件的发现事件根本原因,提前主动识别和修复问题,降低IT设施内部错误引起的事件产生对业务的不利影响。问题管理具有被动和主动两方面。被动方面表现在发生事件后解决问题,主动问题管理则是在事件发生前识别并解决问题和已知错误。问题管理主要实现:
(1)记录问题的症状并分析问题的影响。提供暂时的规避方法,保证服务可用性。识别未来发生的事件,使影响降低到最低限度。通过有效的错误控制,提高一次性解决率。
(2)允许运维技术员关闭一个问题时,同时自动关闭所有关联的事件。在知识库发布已解决问题的解决方案,用于将来参考。通过直观的报表分析问题的趋势,并找出永久性的解决方法。
(3)发布问题公告,避免用户反复提交类似事件工单。记录已知错误,用户可以通过自助服务门户检索。
(4)为接收的请求记录解决方案,记录的解决方案可以做为知识库。这样接收到请求时,可以参考其记录的解决方案来寻求解决它的方法,从而能够减少解决问题和关闭问题的时间。
(5)知识库是记录和存储常见问题的最佳解决方法。在用户自助门户公开知识库,知识库的积累可有助于推进网络用户的自我维护技能的提高。
提高事件管理时效性的措施根据事件管理的基本流程,可以从流程的每个衔接环节入手主动管理,在实施中应注意以下环节:
(1)减少进入事件管理流程的事件数量。服务台应利用匹配知识库等方法解决所受理的事件,提高事件一线解决率,减少进入事件管理流程的事件数量和非必要的流转,从而提升事件管理效率。
(2)准确评定事件优先级别。按照事件受影响范围以及后果严重性等因素来确定事件的紧急程度,然后根据紧急程度确定事件优先级别,针对不同优先级别事件建立具体的事件处理时效性指标,规范二、三线支持部门在指定时间内完成事件处理,及时向客户反馈处理结果。对于服务已恢复、原因无法确定的事件应及时转至问题管理处理。
(3)监管事件升级管理过程。服务台可以创建事件审计角色,承担跟踪和监控事件处理过程的工作。及时判断事件SLA违反状况,根据已经定义好的事件升级程序进行升级。
(4)避免事件管理问题化。在事件管理过程中通常会出现的偏差是未能分清事件管理同问题管理的区别,在处理事件过程中去关注事件具体原因和解决方法,没有将快速恢复因此中断的服务放在事件管理首要目标。
(5)注重事件管理工具的建设。在事件处理过程中,应尽可能发挥工具的作用,将事件的跟踪管理工作自动化,提高事件处理效率,借此提高各个事件处理的时效性。
IT事件跟踪管理,问题管理及形成的知识库系统,有助于形成网络服务质量改进的良性循环。使用事件跟踪管理生成的知识库中解决方案可以提高服务台第一时间解决事故的成功率。通过对建立事件处理的优先级和解决时限约束,用户对事件处理完成时间和结果满意度上升。
二、三线技术人员可以从大量重复的基础性运维活动中脱身,有更多的时间集中分析深层次问题原因,提前发现问题和解决问题;形成知识库,更好促进服务台的第一时间解决事件成功率。
对用户请求事件处理过程管理中跟踪数据分析,可以提供可信的量化服务指标统计报告,实现对技术支持人员的运维服务质量进行监督、考核和评估。
通过IT运维事件跟踪管理,对记录用户提交的请求事件处理过程的全阶段监督,缩短服务请求解决等候总体时间,提高了网络用户满意度。同时校园网运维服务做可持续循环改进。以IT服务台作为提供网络服务的切入点,部署运维自动化工具,实现网络运维中的变更管理配置管理和发布管理,落实网络运维服务管理流程化,保障校园网络信息系统的稳定运行。
[1]唐琳,李伟.基于用户体验的“主动式”信息运维管理实践.电力信息化,2013.11-3:89~93
[2]刘建锋.部署运维管理平台提高校园网运维水平 技术在线2011(30):94~96
[3]马宇飞.面向IT服务的事故管理系统的研究与实现[D].北京林业大学2008
[4]文必龙,赵晶浩,张璇,赵满.IT系统运维管理研究.计算机系统应用2013(03)1~5
Abstract:
According to the basic situation of College Computer Basis course in music college Internet plus background,studies the current situation of teaching at music college,proposes using the multimedia teaching software,MOOC,micro-lectures and flipped classroom on the Internet platform,uses a variety of mobile Internet platform as another solution.
Keywords:
Internet Plus;College of Music;Computer;Electronic Virtual Classroom;Micro-Lectures
IT Event Tracking Management to Improve the Quality of Network Services
CAO Pu,CHEN Rui-hao
(Educational Technology and Information Center,Shenzhen Polytechnic,Shenzhen 518055)
IT Event Tracking;Problem Management;Solution;Operation and Maintenance Knowledge Database
Research on Computer Basis Courses in Music College under Internet Plus
CHEN Tong,ZHU Zhi-hui,LIN Jie
(Department of Public Foundation,Zhejiang Conservatory of Music,Hangzhou 310024)
1007-1423(2016)18-0055-04
10.3969/j.issn.1007-1423.2016.18.013
曹璞(1973-),男,浙江缙云人,硕士,系统分析师,研究方向为计算机网络、信息安全
2016-04-06
2016-06-15
IT运维事件中被动式服务和运维低效率现状影响校园网信息化实施开展。通过对IT运维事件流程跟踪机制的分析研究,以服务等级协议作为衡量事件解决时效性指标,结合运维问题分析管理和解决方案知识库的建设,使网络运维服务质量得以良性循环改进,从而提升校园网络运维效率和用户满意度。
IT事件跟踪;问题管理;解决方案;运维知识库
陈锐浩(1977-),男,广东潮州人,硕士,高级实验师,研究方向为教育技术、信息安全、WebGL技术
IT operation and maintenance events in the passive service and low efficiency of the current situation impact the implementation of campus network information technology.The tracking of IT operation and maintenance of the event process mechanism analysis,the service level agreement as the measure to resolve the incident time indexes,combined with operation and maintenance management and analysis,solution knowledge base is set up,benign circulation improves the service quality of network operation and maintenance,so as to enhance the campus network operation efficiency and user satisfaction.