董赛赛,杨 阳,才 璐,王光辉
(中国人民解放军联勤保障部队第九八八医院 河南 郑州 450007)
现如今社会的信息化水平在不断提高,在社会生产中信息系统的作用越发明显,再加上信息系统的整体框架正向着分布式和云化的不断前进,所以目前的信息系统在运维过程中对质量有了更高的要求。目前在运维管理系统中亟待解决的主要问题是如何通过提高运维效率进一步提高客户的感知能力。在大数据运维背景下,可以通过构建大数据的分析平台,利用运维管理系统,对已有的数据进行进一步的分析和挖掘,通过智能化的提高,加快故障定位的速度,从而达到辅助决策的目的,这也能够有效提高信息系统在运营过程中的服务质量。
运维主要是指对互联网信息系统的运行与维护,一般技术部门会通过对信息的研发和测试去进行系统的管理,这可以有效支撑信息系统在大数据背景下依然能够安全稳定的运行,发挥信息系统的最大工作效能。运维数据的分类是依据运维对象的。首先是基础设施数据,比如机房的承重参数、整个机房环境的温度与湿度、UPS延时时间以及功率都要进行详细的记录。其次是硬件设备所产生的数据,一般包括设备使用日期花费记录、在保修期内的维修记录等。第三是安全设备产生的数据,如安全设备中各项日志、所有数据使用的流量以及安全设备是如何部署的。第四是基础软件数据,主要包括系统内所有基础软件的版本以及升级的记录,在使用软件时的日期以及针对基础软件的防病毒有效期限。第五是互联网络产生的数据,如域名、系统备案时附带的信息、宽带等。第六是信息系统软件所产生的数据,如信息系统各个软件的版本、历史版本以及升级时的记录、在升级和运行过程中产生的各个数据和备份数据、在系统中每个用户的数量、在线观看的人数等。第七是系统信息参与人员以及使用这一系统用户的数据,比如系统管理人员、系统维护人员、用户等在系统过程中的使用时间。最后则是整个系统知识库所产生的数据。基本上所有运维管理制度都会有详细的文档数据。总而言之,大数据运维下信息系统的维护数据非常之多,不仅有文件还有图片和影像,每个数据之间又有着紧密的联系,只有摸清每类数据之间的关系,才能够提高运维工作的效率和质量[1]。
在大数据运维下目前信息系统整体架构和运营方式都有了革命性的改变,正向着能力分散化、管理集中化的方向而发展,作为核心的虚拟化技术,在信息系统的运行过程中带给传统的系统维护更多的挑战。如基础设施,软硬件平台是呈几何式增加,所以传统的监控形式以及分析数据的方法,无法满足目前运维的要求。首先,监控形式过于被动,在传统的监控流程中,一般是在发现问题之后通知运维人员进行解决,但是一旦在通知之后就意味着这些问题已经发生,无法防范于未然,对于信息系统的维护工作也不太方便。另一方面对于维护人员的素质要求也较高,因为问题发生的比较急,如果无法在短时间内解决问题,那么后果是非常严重的,而这些对运维人员心理与专业能力的要求较高。其次,传统的运维手段在目前已经无法适应,因为运维数据是十分多的,如果还是沿用传统的运维手段,很容易形成多个死角,运维质量也无法得到保障。大数据运维下可以利用大数据工具进行多视角、多维度的分析,运维人员可以使用这些数据来进行分析工作,但是工具的使用并不简单。总之,目前迫切需要改变运维方式和手段,要基于大数据技术来提高信息系统维护的水平,减轻参与维护人员的压力,进一步提高运行和维护的质量[2]。
在信息系统运行和维护的过程中,要站在客户的角度,因为数据信息的安全是运行和维护的首要前提,必须要保护客户的隐私。在这之前必须要分析信息系统在运行过程中获得的所有数据,尽可能地减少客户财产损失以及信息系统本身的安全损失。所以在信息系统运行和维护过程中,必须要清理违规操作,要严禁不法分子进行信息盗用,最好是能够及时阻止,这样才能够有效保护客户的隐私与安全。而在整理信息系统内部信息的过程中,必须要通过平台进行数据采集,在经过一系列的分析和处理之后,进行危险数据的阻止。除此之外,在整理信息系统外部信息的过程中,是存在外部接口的,所以也要进行有效的安全管控,将风险牢牢控制住。
在管理设备这一方面,网管软件不仅可以深入检测服务器,而且还能够系统地进行应用管理。要想更加安全的管理,可以在使用界面进行远程操作,通过对一些软件的归纳和整理来支撑信息系统的运行[3]。目前在一些比较流行的网管软件中,已经不再引用传统的代理模式,所以操作起来十分简单,对于后期的维护工作也非常便利,所以客户在工作时的效率有了明显的提高。但是在网络的关键应用中,网管软件必须要做到全面的检测,这样管理人员就能够根据已经出现的问题进行详细的分析,让定位更加准确,确保信息系统的正常运行。如果信息系统出现故障,网管软件可以通过运行来提供有关的故障图,工作人员再根据流程进行监测,只要观察颜色变化,就能够发现是否出现故障和及时定位。网管系统还具有主动式的发展方向,由于其具有强大的预警功能,所以一旦发生问题可以自动恢复,并且在最大程度上降低风险或者是故障发生的可能性。总之,网管系统对于信息系统的运行和维护有进一步的优化作用,也能够为信息系统的运行和维护提供有效的指导,所以在网络管理过程中起到的作用是非常重要的,尤其是大数据运维背景下,可以通过技术的创新,将大数据可视化工具运用的得心应手,从海量的数据中找到彼此的联系,确保信息系统能够高效正常的运行。
大数据运维平台可以将一些先进的技术和理念引入到信息系统的运维工作中,能够加强各个平台数据信息的共享,交互满足目前运维工作中的多样化业务需求,不仅能够提高数据应用的水平和运维工作效率,同时也能够提高运维团队在故障响应过程中的分析能力[4]。首先,要进行数据适配,这是原业务数据和大数据运维平台的桥梁,这样才能够统一数据模型和规范。其次,要进行数据建模,要根据业务的类型建立标准的数据模型,并标明每个模型之间的关系。第三,要规范数据的格式,这样在发送和接收的过程中才会更加流畅,不需要调整数据格式。第四,访问入口要统一,主要是为了避免不同层面的需求出现交叉,毕竟数据模型具有多样性和不一致性。
首先,要遵循稳定性的原则,必须要考虑每个系统之间的关联性和影响程度,在信息系统的设计阶段,必须要减少时已有系统的改造,而在信息系统运行的过程中,也要减少其他业务系统对其的影响,确保信息系统能够正常运行。其次,要遵循安全性的原则,这主要是根据用户需求的不同来分配不同的权限,大数据运维平台和信息系统间的数据传输必须要用安全认证机制,提高数据的安全性。第三,必须要遵循兼容性的原则,大数据运维平台在建设过程中,必须要确保已有平台和新建平台之间的平滑对接。第四,必须要遵循易操作性的原则,用户在使用信息系统过程中,必须要与系统具有良好的交互性,整个系统界面要友好,对于用户来说操作简单更易理解,这样才会让用户具有较好的体验,在运行过程中也会有较高的质量,而在维修过程中也会更方便。第五,要遵循规范性的原则,大数据运维平台和所有外部系统在交互过程中所使用的接口要规范,要符合相应的要求[5]。
综上所述,在研究大数据运维信息系统运行与维护过程中,基础设施、硬件设备数据等其他数据都要进行一定的分析,还需要利用网管软件进行进一步优化,这样才能够提高信息系统维护的效率。毕竟大数据属于流行趋势,只有进行深入的研究,才能够保证国家和人民的隐私安全。