王新峰,韩东伟,韩彦福,王小明
(河南中烟工业有限责任公司许昌卷烟厂,河南 许昌 461000)
随着信息化技术的快速发展,各种信息应用广泛普及,信息化运维工作从原来的简单单点维护转变为系统维护,从表面故障处理到深层故障排查,运维工作越来越复杂,难度不断加大。近年来,烟草行业的信息化系统应用提升很多,所以,探索合适的烟草信息化运维工作方法,提升烟草企业效率已迫在眉睫。
烟草信息化内容包括基础设施和应用系统。其中基础设施包括布线、网络、服务器存储、备份、视频会议及机房等;应用系统包括OA(办公自动化)、ERP(企业资源计划)、CRM(客户关系管理)、MES(生产信息化管理系统)、数据采集各业务系统,等等。烟草信息化运维工作内容分为资产型硬件运维、服务型应用系统运维。
资产型硬件运维分为质保期内运维和质保期外运维。服务型应用系统运维是指保障业务应用软件正常运转的运维服务,主要包括日常性维护、纠错性维护、适应性维护和完善性维护等。
①网络优化:IP地址总体规划、IP地址详细规划、IP及VLAN优化、网络路由优化与安全策略优化。②线缆整理:对所有弱电间及弱电井的网络线缆进行整理并保持清洁。③故障处理:厂局域网、互联网边界、广域网边界的技术咨询及故障处理。④链路维护:运营商链路日常监控管理、链路故障处理及预防。⑤设备监控:配置调整,故障处理,定期对网络设备进行漏洞扫描。⑥策略调整:边界安全设备的策略优化调整。⑦网管软件管理:负责对网管软件各模块进行维护管理。⑧监控运行情况:处理突发告警,监控关键线路流量情况,对异常流量进行清理。⑨应急处理:对网络突发事件进行快速应急处理,保证信息网络正常运转。
①服务器、存储设备故障维修及更换;②服务器补丁升级服务、病毒处理、安全策略调整;③服务器、存储及备份系统配置调整优化服务;④定期巡检及设备环境保养;⑤虚拟化软件运行维护;⑥数据备份运行维护以及数据恢复、应急演练;⑦对突发事件进行快速应急处理,保证服务器应用正常运转。
①音响系统、视频会议系统、大屏显示系统等故障检修及更换;②会议设备定期巡检、完好性检查和维护;③会议设备环境维护;④多功能厅大型会议的临时性技术服务。
(1)供配电及电气系统巡检周期及内容。周期:每季度一次。内容:检查配电柜,保证配电柜内电气装置的整齐、牢固、标识清晰、外观良好、内外清洁,保证配电柜内无杂物、盖板整齐严密,保证配电柜上的仪表、指示灯及开关等部件正常,电源盘、柜及其他电气装置的台座与地面固定牢固。
(2)通风系统巡检周期及内容。周期:每季度一次。内容:更换过滤网,检查风机状况,检测电机温度、电流,电路控制部分,检查安全保护装置工作。
(3)弱电系统巡检周期及内容。周期:每季度一次。内容:检查所有设备的外观、显示,检测电源,提供软件升级服务和技术支持。
(4)机房装修巡检周期及内容。周期:每季度一次。内容:检查金属板外观、接口,金属板与龙骨连接,条形板板缝顺直,拼缝严密;检查地板拼接、支架、踢脚线;检查金属饰面、罩面板、饰面板、搭缝、收口、玻璃隔断和墙面;检查机房内的门锁、地弹簧、把手等其他设施及部件;检查机柜内门锁和五金配件。
(5)UPS系统巡检周期及内容。周期:每季度一次。内容:每半年对电池进行一次充放电测试,测试时间应在半个小时以上。
(6)空调系统巡检周期:每月一次,扬絮期每半月一次。
(7)机房环境监控系统巡检周期及内容。周期:每季度一次。内容:检查各监控系统的灵敏性、准确性,报警信息的及时性以及输出报告的完整性。
在以上的检查过程中,如发现有需维修的工作或需更换的备件必须及时更换备件或维修。
每周一次简单保洁,对机房地板进行保洁;每季度一次深度保洁,对机房吊顶、墙面、地板上下、玻璃、机柜及工作台等进行深度保洁,保证上述区域的清洁。
(1)关键系统(供配电系统、UPS系统、空调系统、机房环境监控系统)发生紧急情况(影响机房设备正常运行)时服务提供商工程师应当在10分钟之内提供电话支持,1小时内到达现场,2小时内彻底解决设备故障;关键系统发生非紧急情况(不影响机房设备运行)时服务提供商工程师应当在30分钟之内提供电话支持,2小时内到达现场,4小时内彻底解决设备故障。
(2)其他系统发生紧急情况时服务提供商工程师应当在30分钟之内提供电话支持,2小时内到达现场,4小时内彻底解决设备故障;其他系统发生非紧急情况时服务提供商工程师应当在60分钟之内提供电话支持,2小时内到达现场,6小时内彻底解决设备故障。
以上响应时间均自用户提出需求开始计时。对于由于服务提供商原因导致在服务响应时间内不能修复的故障,用户有权请其他公司解决,所产生的一切费用由服务提供商承担。
服务提供商必须在2个工作日内为用户故障设备及器件提供更换或维修。服务过程中如提供软硬件产品,必须保证用户对该产品拥有合法的使用权。更换的备件必须是原厂的合法备件,不得以其他方式替代。维修产生的相关费用,包括但不限于人工费、设备或配件更换费用等均由服务提供商承担。
针对机房内的标识进行查漏补缺,并定期检查更新,符合厂级6S要求。
根据要求提供技术支持和咨询服务;制订合理的升级/改造、建设、运维方案、故障响应流程、应急预案及演练文档等,并协助实施升级、改造、建设、应急演练等有关工作。
指派专责项目经理和固定的维护工程师,全面负责项目实施与质量控制,保证维护服务的连续性和稳定性。
应用系统的故障主要分为三级:一级故障会造成系统崩溃,用户业务停止,系统无法正常使用;二级故障会对信息安全构成直接威胁,并有转化为一级故障的隐患;三级故障为上述情况之外的其他故障。
应用系统运维过程中的服务类型主要分为常规服务、文档管理和投诉服务,具体服务指标下:
(1)提供7×24小时热线服务,30分钟内响应;
(2)一级故障10分钟内响应,4小时内解决;二级故障30分钟内响应,8小时内做出解决计划;三级故障30分钟内响应,根据需要安排解决计划;
(3)每季度1次远程系统巡检,对关键系统,提供每周现场巡检及备份工作;
(4)重大事项维护结束后,3个工作日内提交问题分析报告;
(5)接到投诉时,1小时响应,3个工作日反馈给投诉人,并抄报相关方。
(1)服务时间:常规巡检,服务商应按用户约定的时间进行;紧急故障状况时,服务商应在0.5小时内响应,4小时内赶到故障现场进行现场技术服务;从服务商工程技术人员进行故障处理开始,到用户方正常应用系统恢复正常所需时间不超过12小时;从服务商工程技术人员进行故障处理开始,到全部故障排除,整个系统完全恢复到故障前的正常状态所需时间不超过48小时。否则用户将自行采取必要的措施,由此产生风险和费用应由服务商承担。
(2)整个维保项目须指定专人或项目技术小组负责处理用户的技术咨询和服务,做到全天候7×24小时响应,确保用户方能及时找到维保项目的指定专人或小组;人员中至少包括一名项目经理、一名资深工程师作为本维保服务项目主要技术负责人,具备三年及以上维保经验,且不能随意更换。
(3)在维保服务期内任何重大系统变更,要求较高的重要事件时,提供现场专人驻守支持服务,如设备搬迁等。
(4)每次维护保养及故障修复后均须出具详细全面的相关书面文档,及时提供用户方有关系统运行的状态报告和运行建议;为设备准备备件,以便出现故障时立即进行更换。
(5)更换的备件的型号和规格应与被更换的产品完全一样或采用更高型号、更高规格的产品。
对运维服务质量执行百分制定期考核,考核达标分数为90分,具体评分标准如下:①针对客户反馈的系统故障问题,按照故障等级及故障排除比例综合评分,对应等级及时间内未按要求排除,酌情扣除1~10分;②针对客户反馈问题,按照等级及要求及时响应并到达现场予以协助解决,如不能按照服务级别要求进行及时响应的,酌情扣除1~5分;③针对服务人员技术水平,根据日常系统报错问题,解决情况酌情扣除1~15分;④针对系统遗留问题,根据最终用户上次报错记录酌情扣除1~15分。
表1 满意度调查表(百分制)
考核项目以“满意度调查表”(见表1)中所列项目为准。
总之,在信息化飞速发展的今天,信息化应用也已成为烟草行业不可或缺的工具,但设备故障、网络威胁、病毒木马等也纷至沓来。这就要求运维人员对烟草信息化运维工作进行不断探索,以保障烟草企业网络强健稳定,应用系统通畅准确运行。