钟 涛
摘要:本文通过分析IT基础设施在运行维护管理过程中存在的风险以及针对这些风险采取对IT基础设施运行环境进行集中的在线的监控、远程集中的管理、运维审计相结合的方式来确保lT基础设施在运行维护管理过程中的安全。
关键词:lT基础设施环境监控集中管控运维审计
1发电企业作为资金和技术都高度密集的企业。通过信息化来提高企业的管理水平是必然的选择
而事实上发电企业的信息化一直在发展,尤其近年来取得迅速的发展,企业的生产管理对信息系统的依赖程度越来越高,因此企业在对信息系统在功能上要求越来越高的同时对其的安全性要求也越来越高。作为信息系统最基础同时也是最核心的部分中心机房和设备等IT基础设施的安全也就显得非常重要,不可想象如果一套信息系统的基础设施都无法保证安全信息系统的安全还如何保证。本文笔者结合自身的项目经验谈一下企业的信息系统的基础设施在运维过程中的安全问题谈一下浅见。
2发电企业的信息系统基础设施面对的安全风险分析
2.1中心机房环境给基础设施带来的风险。信息系统的基础设施包括服务器、网络设备等硬件都有相对严格的运行环境要求,如湿度、湿度、电源等,如何保证IT基础设施的运行环境是最基础也是最重要的要求;
2.2人员物理接接触带来的风险。技术或非技术人员进入机房时因作业时因失误或意外对lT基础设施造成物理上的风险;
2.3系统运行过程中IT管理人员对IT基础设施进行操作作业时给系统带来风险。
3lT基础设施运行、维护的集中监控及管理系统的构成分析
针对分电企业的IT基础设施存在的主要风险,IT基础实施集中监控系统必须实现对IT基础设施的运行环境在线监控,在出现异常时必须有多种方式的报警、实现对IT基础设施的远程集中管理以减少运维过程中对其的物理接触、实现对lT基础设施的运行操作进行集中管理、记录、审计。
3.1构筑运行环境监控系统实现对机房等lT设备的运行环境进行在线监控,系统能对环境进行监控,根据设定的各种环境参数要求,在出现异常时能自动按事先设定的各种方式进行报警,系统结构图1。
3.1.1机房视频监控:监视机房中人员的出入、活动情况。在机房出入口或设备通道处安装网络摄像机,监视记录人员出入及活动情况,并可设置移动侦测报警,警讯可以通过电子邮件、声音、短信、MSN、Skvpe、SNMP、SNPP等多种方式发送。图像可以同Web浏览器远程监视、设置。
3.1.2机房整体环境监控,实现对机房温度、湿度、漏水、电源、门禁的集中监控,可通过网路浏览传感器状态,修改设置,自定义报警阈值、报警方式、报警流程,实现对机房环境的远程集中监控。
3.1.3机柜微环境监控。通过在机柜中安装无线微环境监控模块实现对机柜微环境进行监控。系统实时显示记录环境参数。随时生成曲线并记录相关数据。管理人员可对每个环境传感器进行报警值的设置,定义不同级别的报警方式。
3.1.4lT设备监控。服务器、交换机、防火墙、路由器、操作系统、数据库、磁盘等IT设备运行状态监控。
3.1.5机房动力监控,可以实现对机房的UPS、空调、新风系统等的运行状态进行监控。对于UPS等设备在管理卡的支持下,通过通过SNMP协议即可将UPS等设备的参数读出来并对其进行报警阈值设置,然后实现对系统运行状态的监控。
3.1.6系统支持多种预警方式。根据设定的预警策略系统可实现声光报警、(主机音箱)声音、短信(需要MODEM)、电子邮件、MSN、Skype、SNMP、Ftp、Http、SNPP等多种方式发送警讯。
3.1.7系统需具备完善、科学、灵活的预警功能。有灵活的预警定制机制,包括科学的报警临界值的设置:多途径预警方式;多层次灵活的报警流程;并可触发摄像以及其他系统的动作。
3.1.8系统管理功能:在基于B/S架构的软件系统的支持下,可以实现对机房环境及IT设备的集中监控、远程集中管理、数据的统计分析等功能。具体包括:①用户的认证及授权管理;②监控项目的配置管理。包括需监控的设备、监控的参数、预警策略的定制等;③系统运行状态的实时查询、监控i④系统运行的历史数据的查询、统计和分析并自动形成报表等。⑤远程集中管理。系统可以实现对机房内所有监控设备的远程集中管理。
3.2集中远程管控系统。利用成熟的KVM技术,通过由软件和硬件组成系统可以实现对中心机房的所有服务器、中心交换机等网络设备、防火墙、存储系统、UPS等关键的设备进行集中的、远程的管理,并且自身有很好的安全性。
3.2.1通过管理控系统在本地实现对机房内的lT设备的集中管理,实现无人机房。通过该系统可以实现“人机分离”,减少系统管理、维护人员频繁进入机房,物理接触设备,保证设备的物理安全;
3.2.2系统支持对设备的远程、多用户的、远程、协同的管控。即系统支持多个系统管理及技术支持人员从不同的地点通过不同的通信路径远程对所管控的系统(设备)进行协同的管理维护,极大提高系统管理和维护工作的效率;
3.2.3能支持多种不同管理路径的选择,即有带内和带外的情况下都能实现对所有列入管控范围的设备进行集中的、远程管理,即系统管理人员可以通过IP网,电话拨号网络和本地口带外管理专网等多种途径对系统进行管控,避免管理路径的单点故障:
3.2.4能管理多种平台、类型设备与目标设备的内核系统无关,能支持目前主流的多种类型的平台、设备,如UNIX,AIX、WINTEL,LIN-UX,SOLARIS;与设备的接口无关(KVM,RJ-45,DB9,DB25等。
3.2.5管理终端。系统提供单一的登陆界面和简单的安装操作平台。所有目标设备可以集中管理到单一界面上来,系统安装做到即插即用,操作界面友好简单,要求是基于B/S架构的软件系统,无须安装客户端软件。
3.2.6系统自身的安全性。鉴于通过该系统可以实现对信息系统的所有核心设备的集中管理,该系统本身的安全性就什分重要。要求系统自身要有安全性的设计和功能:包括严格的认证机制;操作授权管理机制;安全日志记录和审计;系统物理设备的安全:传输维护管理信息的安全。
3.3通过安全运维审计系统实现对服务器、网络设备、安全设备IT基础设施在运维过程中的操作进行安全、有效、直观的操作审计,对策略配置、系统维护、内部访问等进行详细的记录,提供细粒度的审计,并支持操作过程的全程回放。实现操作内容的审计,并将身份认证、授权、审计有机地结合,保证只有合法用户才能使用其拥有运维权限的关键资源。为IT操作风险控制、内控安全和合规性等方面提供一套完善、有效的审计手段。
3.3.1实现对基于TELNET、FTP、SFTP、SSH、RDP、VNC等协议进行审计,支持IBM AIX、Digital UNIX、HP UNIX、SUN Solaris、SCO UNIX、LINUX、WINDOWS等各种主流操作系统环境。
3.3.2系统具有完整的身份管理和认证功能。为了确保合法用户才能访问其拥有权限的后台资源,解决IT系统中普遍存在的交叉运维而无法定位到具体人的问题,满足审计系统“谁做的”要求。系统必须具有完整的身份管理和认证功能,并能结合第三方的安全认证方式,实现静态口令、动态口令、证书KEY和第三方的令牌认证方式的安全认证管理,实现密码强度、密码效期、口令尝试死锁、用户激活等安全管理功能。
3.3.3灵活、细粒度的授权功能,系统提供基于用户、运维协议、目标主机、运维时间段(年、月、日、周、时间)、会话时长、运维客户端IP等组合的授权功能,实现细粒度授权功能,满足用户实际授权的需求。
3.3.4后台资源自动登陆功能,后台资源自动登陆功能是运维人员通过系统认证和授权后,系统根据配置策略实现后台资源的自动登录。此功能提供了运维人员到后台资源账户的一种可控对应,同时实现了对后台资源帐户的口令统一保护。针对不同操作系统和设备的特性,可以提供托管和只托不管两种方式实现运维用户自动登录后台资源。
3.3.5实时监控功能:监控正在运维的会话,信息包括运维用户、运维客户端地址、资源地址、协议、开始时间等;监控后台资源被访问情况;提供在线运维的操作的实时监控功能。针对命令交互性协议可以图像方式实时监控正在运维的各种操作,其信息与运维客户端所见完全一致。
3.3.6违规操作实时告警与阻断功能:针对运维过程中可能存在潜在操作风险,系统根据用户配置的安全策略实施运维过程中的违规操作检测,对违规操作提供实时告警和阻断,从而达到降低操作风险及提高安全管理与控制的能力。
3.3.7完整记录网络会话过程功能:系统提供运维协议Telnet、FTP、SSH、SF-rP、RDP(Windows Termihal)、AS400等网络会话的完整会话记录,完全满足内容审计中信息百分百不丢失的要求:会话信息包括运维用户、运维地址、后台资源地址、资源名、协议、起始时间、终止时间、流量大小信息;会话信息包括运维过程中所有进出后台资源的数据。
3.3.8详尽的会话审计与回放功能。运维操作审计以会话为单位,提供当日和条件查询定位。条件查询支持按运维用户、运维地址、后台资源地址、协议、起始时间、结束时间和操作内容中关键字等组合方式。
3.3.9完备的审计报表功能,能根据需要智能定制各种报表。
4结语
IT基础设施在运行维护过程中的安全是信息系统安全的基础中的基础,而它安全受运行环境、运行人员的操作水平等物理、人文等因素的影响,本文通过分析lT基础设备在运行维护管理中存在的风险以及如何针对这些风险采取相关的对策控制和规避这些风险,具体就是加强对lT运行环境的监控及管理以保证运行环境满足lT基础设施的运行需要、通过对IT基础设施的远程集中控制提高设备的物理安全、通过对lT基础设施的运行审计从而提高其在维护管理过程中的安全性,提出了一个发电企业管理信息系统的lT基础设施的集中管控的解决方案。