胡 蔷,王月梅
(呼和浩特铁路局 信息技术所,呼和浩特 010057)
铁路网络与信息系统安全风险集中管控平台的研发与应用
胡 蔷,王月梅
(呼和浩特铁路局 信息技术所,呼和浩特 010057)
为确保铁路运输工作的安全稳定,本着“问题在现场、原因在管理、根子在干部”的安全管理理念,设计了实效性安全风险管理系统,发动全员参与提报安全风险隐患、安委会挂牌督办、责任部门限期整改安全风险问题,使铁路网络与信息系统安全风险实现了网络化、流程化、闭环式的集中管控。
网络与信息系统;安全风险;挂牌督办;闭环整改
呼和浩特铁路局(简称:呼和局)把安全风险管理纳入了日常工作与绩效考核中。信息技术所充分利用信息技术编程方法,把信息系统运行维护管理过程中存在的各类安全风险问题,统一纳入到“网络与信息系统安全风险集中管控平台(以下简称平台)”中挂牌督办,使网络与信息系统安全风险得以超前防范、高效整改。
平台针对运输生产信息系统上线及变化等情况,加强安全风险的研判,健全动态研判机制,制定和完善风险管控措施,及时消除和规避安全风险。主要功能是实现从日常运行调度、网络运维、系统运维、运用维护、硬件维修、软件研发、经营管理、计划施工、安全教育等方面,发动全员从各自的工作岗位去发现各类安全风险隐患,通过统一软件窗口实名制录入到集中受理平台库中,再由安全专员定时检查、过滤、分类已录入库中的各类安全风险隐患问题,安委会审定后将以上安全风险隐患问题推送至测评专家组进行安全风险源的初步确认与初步定级,各专家组成员在指定的期限内完成以上工作后,由单位主管领导组织分析研讨会对安全风险源进行最终确定与定级。安全风险源确定以后,按照主管领导批示分类推送至各相关科室进行整改处理,各相关科室在规定期限内对可管控的显性安全风险源制订明确的管控措施、处置方案与应急预案,对可接受的隐性安全风险源进行规避方案、应急预案的制订。同时,把安全生产过程中出现的任何非正常情况,都作为安全风险因素,以网络与信息系统故障和倾向性问题为重点,分系统、分层次、分岗位,建立健全运行维护流程与应急处置办法,纳入工作标准和流程,构建网络与信息系统非正常情况的应急处置体系,做到信息畅通、响应迅速、有效掌控。另外,针对重大安全风险进行专项整治,掌握和研判安全生产中重大设备隐患、惯性故障严重违章等安全风险,及时研究和制定安全风险防范对策,切实消除风险。最后,安委会定期对各科室整改和落实情况进行检查,对不如期完成的科室进行考核落责,对完成优秀科室进行积分奖励。为激励全员主动发现并提报安全风险隐患问题,通过实名制统计报表功能模块进行排名统计,对提报问题精、准、即时的人员进行相应奖励;同时,通过对各专家组成员评审结果精、准、即时量进行排名统计,对各专家组成员的辛勤劳动进行相应奖励。
真正的风险源在于管理的规范、责任的落实、考核的到位,本课题研究的目的主要是通过规范的管理,全面有效地掌控安全风险,使网络与信息系统安全稳定。
安全风险管理区别于传统安全管理,最主要的特点就在于强调超前防范和全员参与,本项目采用从下至上,上下结合的综合治理模式,与在用的“安全2+1系统”相辅相成,强化了传统由上至下、事后考核的安全管理模式,使安全风险管理真正形成预警、预控和360°管控。
“网络与信息系统安全风险集中管控平台”针对网络与信息系统投产及运维情况,加强安全风险的识别,健全动态研判机制,制定和完善风险管控措施,及时消除和规避安全风险。
3.1 设计原理
(1)风险定义:风险是指在某一特定环境和某一特定时间段内,某种损失发生的可能性。风险由风险因素、风险事故和风险损失等要素组成,3者的关系为:风险因素引起或增加风险事故,风险事故造成风险损失。风险的量化涉及到风险频率和风险损失程度两个数值。
(2)风险识别的重要性:风险识别是对网络与信息系统运维管理过程中风险因素进行科学分类,正确认识、研判运维管理过程中所面临的风险种类,为后续制定风险对策提供依据。
3.2 设计原则
(1)科学性:适应网络与信息系统安全风险管理的应用需求。
(2)实用性:界面美观友好,功能实用,操作简便,易于使用和维护。
(3)可靠性:能不间断运行,在发生故障时,能保证数据的完整性。
(4)推广性:为全局性网络与信息系统安全风险管控预留了相应接口,包括站、段、车间、班组都能利用该系统实现网络与信息系统的安全风险管控,应用前景广泛。
3.3 技术方法
(1)采用B/S体系结构:主要分为3个部分:Web应用、Web服务和数据库。应用层由客户浏览器调用,用以实现数据查询、统计、编辑,业务逻辑构成。为了便于维护、升级和实现分布式应用,在实现过程中,将业务逻辑层和数据访问层分离开,客户应用程序不直接调用数据访问层,而是通过业务逻辑层调用数据库。
(2)统一窗口登录:在铁路内网中的本单位网站上,所有应用系统都通过统一登录窗口实现一次登录后,使用本页面中所链接的所有应用系统 ,为用户减轻了重复登录的繁琐和用户名、密码不易记忆的烦恼。
(3)安全保障:以既有的铁路内网为基础,综合运用防火墙、流量监控等安全设备和技术,进一步增强网络与信息系统安全风险集中管控平台的安全防范能力、防攻击、防渗透、进行数据加密、合法用户认证、访问控制等,构建一个可靠的内网系统。
(4)三层架构体系:软件体系架构设计中三层架构就是将整个业务应用划分为:表现层(UI)、业务逻辑层(BLL)、数据访问层(DAL)。区分层次的目的即为了“高内聚,低耦合”的思想。
(5)系统采用微软的Windows Server 2010R2+IIS7.5架构的Web应用服务器平台,功能强大,配置灵活,支持目前流行的多种服务器端开发技术,开发成本低、周期短、维护相对简单。系统开发软件,采用目前流行的基于.NET Framework的Web动态设计技术ASP.NET。
按照“逐级负责、专业负责、分工负责、岗位负责”,分层次建立网络与信息系统安全风险源集中受理平台。流程如图1所示。
图1 网络与信息系统安全风险源集中受理流程图
主要功能是实现从日常运行调度、网络运维、系统运维、运用维护、硬件维修、软件研发、计划施工、安全教育等方面发动全员从各自的工作岗位去发现安全风险隐患,通过专家动态网络评估、计算机仿真统计分析对安全风险流程化管控。
网络与信息系统安全风险集中管控平台共有:风险列表、风险管理、风险整改、安委会意见、统计分析、风险分类、专家信息、其它8大模块,如图2所示。
6.1 制定操作流程与作业标准
科学制定操作程序。管理层要通过反复深入细致的研究实验工作,为操作者提供简洁、明晰、容易掌握的操作程序和作业标准,员工坚持把“规定动作”做到位,不走样,就能够优质高效地完成任务。
图2 铁路网络与信息系统安全风险集中管控平台模块划分
制定操作程序,完善作业标准,是规范安全管理最重要的基础工作,也是一项比较复杂、难度很大的工作。该管控平台把制定操作程序、完善作业标准作为专业管理、技术管理工作的重中之重来抓,做到严谨、简洁、实用、有效,既防止了过于粗放、笼统,操作者不容易准确把握和操作的问题,也避免了简单问题复杂化,增加职工负担的问题;使影响安全的因素得到了有效地控制。
把实施流程管理作为加强过程控制、保证安全生产最基本的措施,一以贯之、不折不扣地抓好落实。每个组织者,都要熟悉掌握作业程序,了解作业标准,做到按程序组织,按标准管理;每个操作者,都要清楚自己的岗位职责、作业标准,做到按标准作业,履行好岗位职责。专业干部、监察人员到一线,要严格按照程序和标准去检查,既要检查操作程序、作业标准的落实情况,也要检查了解程序、标准本身是否存在问题,对程序、标准存在的不合理、不严谨的问题,要及时反馈,由有关部门认真研究论证后,修改完善,贯彻实施。
6.2 安委会对安全风险源集中研讨挂牌督办
安委会成员定期对“安全风险隐患问题库”进行检查、过滤和分类,对安全风险隐患问题进行初审,加强对安全风险隐患问题的分析,提高风险管控针对性。把安全风险隐患问题分2大类:(1)真性安全风险隐患问题,入库到流转模块库中,待专家组评审。(2)假性安全风险隐患问题,出库到建议模块库中待日后借鉴。
坚持逐级负责的原则,实现管理的有序和高效。逐级负责是科学管理的重要原则之一,其要义就是管理要按照层级来实施,自上而下一级抓一级,自下而上一级对一级负责,不能越级指挥。据了解,有些干部受传统管理思维的影响,抓安全习惯于越级指挥,“一竿子插到底”,搞得一线干部职工无所适从。这样的做法,容易导致管理秩序的混乱,产生不良结果。从规范管理的角度,应该强调坚持逐级负责,上级下达指令、布置任务要沿着指挥线逐级进行,防止越级指挥,保持管理的有序、有效。
安委会分类初审后的安全风险隐患问题,入库到流转模块库中,由主管安全工作的处领导根据分类批示到各专家组成员进行评审,并限定评审期限。专家组成员由本所不同科室中的技术拔尖人才和技术骨干组成,所内根据各专家组成员的工作业绩和突出表现每年对专家组成员进行一次审核,多方面条件合格者方可进入专家组成员库中。各专家组成员接到评审通知后,在规定的期限内对指定的安全风险隐患问题进行全面评审,评审结果包括:问题的严重程度、定性定级程度、整改责任科室、建议及待讨论问题等。安全风险隐患处理流程及审核方案界面如图3所示。
图3 安全风险隐患处理流程及审核方案界面
6.3 主管领导审批流转
各专家组成员对安全隐患问题评审完成后,初步对安全风险源定性定级,再由安委会组织专家组及相关人员采取分析研讨会的形式对安全风险源进行最终定性与定级,最后由主管安全工作的处领导根据安全风险源分类批示流转到各科室主管处领导落实,再由各科室主管处领导批示到相关责任科室进行限期整改。
6.4 责任科室限期整改
相关责任科室在接到任务后,根据安全风险源问题落实到具体维护人员,在规定期限内对可管控的显性安全风险源制订明确的管控措施、处置方案与应急预案,对可接受的隐性安全风险源进行规避方案、应急预案的制订。同时,把安全生产过程中出现的任何非正常情况,都作为安全风险因素,以网络与信息系统故障和倾向性问题为重点,分系统、分层次、分岗位,建立健全运维流程与应急处置办法,纳入工作标准和流程,构建网络与信息系统非正常情况的应急处置体系,做到信息畅通、响应迅速、有效掌控。另外,针对重大安全风险进行专项整治,掌握和研判安全生产中重大设备隐患、惯性故障严重违章等安全风险,及时研究和制定安全风险防范对策,切实消除风险。各项整改方案经过科室研讨和主管处领导确认后,返回到“已整改安全风险源库”中。
6.5 安委会定责考核
安委会定期对各专家组成员评审结果和各科室整改落实情况进行检查与抽查,对各专家组成员评审结果即时、精准量进行考核和奖励;对不如期完成的科室进行考核落责,对完成优秀科室进行积分奖励。另外,安委会加强对共性问题、惯性问题和倾向性问题的检查分析,动态掌握生产一线部门安全态势和状况,及时提出改进管理工作的要求,有针对性地指导现场应急处置,完善安全措施,促进安全基础管理,跟踪落实问题整改情况,形成闭环管理。
对各种非正常情况的应急处置办法和预案,必须进行定期培训和实战演练,并纳入常态管理,使每个干部职工都掌握非正常情况下的应急处置的措施办法和程序。对重大安全风险采取安全专项整治的方法,坚持领导负责,实行综合治理,集中人力、物力、财力,严格落实整治方案、责任、时限、措施和资金,从作业行为上有效规避,从安全措施上加强防范,从管理源头上加以根治。
6.6 制定奖励机制
为激励全员主动发现并提报安全风险隐患问题,通过实名制统计报表功能模块进行统计排名,对提报问题即时、精、准的人员进行相应奖励。
定期对奖励情况进行网络公开,以便达到更好的激励效果。
6.7 预警预控提高故障分析水平
每一起故障都是一本很好的“教科书”。很多事例说明,每一起故障都会暴露出安全管理方面存在的不严密、不科学、不落实的多个问题。如果把这些深层次问题及原因找出来,从完善制度措施、规范基础管理的角度,认真进行整改和解决,就能够吸取教训,防止类似故障重复发生,这样,发生事故所付出的代价才没有白费。
(1)端正对待故障的态度。出了故障要勇于面对,敢于担当。处理事故,不仅仅是要追究责任、给予惩处,更重要的是要搞清原因,吸取教训,防止后患。
(2)深入剖析管理方面存在的问题。防止故障再度发生,根本要解决管理存在的问题,堵塞管理漏洞。故障分析一定要追根溯源,透过现象看本质,把管理方面存在的问题查清楚。
(3)搞好故障案例教育。以故障为案例,对干部职工进行安全风险教育,更生动、更直观、更能够打动人心。对那些具有典型意义的故障,要在深入分析的基础上,整理出详细的事故案例,在广大干部职工中普遍进行警示教育,使尽可能多的人受到教育,真正变故障为“财富”。
呼和浩特铁路局信息技术所针对该系统制定了相应的管理法办,建立了激励与奖惩制度,每月按时集中收集整理各科室上报的安全风险隐患问题,专管员经过审查后将有效安全风险源流转至专家组进行网络评估,利用月度安全生产例会将重要风险源进行挂牌督办,令责任科室限期整改完成。截止到2013年底,共完成了102条安全风险源的闭环整改管理工作,有效实现了问题的超前防范与管控。此外,系统也为全局性网络与信息系统安全风险管控预留了相应接口,包括站、段、车间、班组都能利用该系统实现网络与信息系统的安全风险管控,因此,应用前景广泛。
[1]范道津,陈伟珂.风险管理理论与工具[M].天津:天津大学出版社,2010.
[2]宋守信.铁路安全风险管理核心理论与关键技术[M].北京:北京交通大学出版社, 2013.
[3]董立霞,刘志明.安全风险管理员工安全风险意识教育读本[M].北京:中国言实出版社,2013.
[4]杜育根.软件工程教程:IBM RUP方法实践[M].北京:机械工业出版社,2013.
[5]贝 克.解析极限编程:拥抱变化[M].雷剑文,译.北京:机械工业出版社,2013.
责任编辑 方 圆
Research and application of centralized control platform of Network and Information System for security risk
HU Qiang, WANG Yuemei
( Institute of Information Technology, Hohhot Railways Administration, Hohhot 010057, China )
To ensure security of railway transportation, the paper designed an effective Security Risk Management System. The System was based on the concept of problem from scene, reason from management, source from cadre. All stuff should report hidden danger, security committee supervise, relevant departments correct in a def i nite time. This System implemented networked, process and closed-loop centralized control management.
Network and Information System; security risk; supervise; closed-loop correction
U285.5∶TP39
:A
1005-8451(2014)06-0035 -05
2013-12-24
胡 蔷,高级工程师;王月梅,工程师。