数字地质资料馆平台智慧运维体系探索

2018-01-31 20:34孔昭煜齐钒宇贾丽琼高学正苏志强李海龙
中国矿业 2018年10期
关键词:资料馆运维监控

孔昭煜,齐钒宇,贾丽琼,高学正,苏志强,李海龙

(1.中国地质调查局发展研究中心,北京 100037;2.全国地质资料馆,北京 100037)

0 前 言

在物联网、大数据、云计算等新兴信息技术不断发展的当下,地质调查工作从传统工作方式已向全业务信息化转变。同时,在20世纪90年代后随着信息化技术的普及和在地质调查行业中的推广和应用,其产生的地质调查成果数据爆发式增长。这些地质调查成果数据不仅具有资料、档案和科研价值,还具有重复开展、成本投入高和人力投入大等特点,同时开展这些地质调查工作的经费,绝大多数为国家财政投入的经费,根据要求须向国家、相关行业和社会公众提供基础地质调查成果数据社会化服务[1-2]。

全国地质资料馆依据国务院颁布的《地质资料管理条例》中有关要求,对已接收的地质调查成果进行社会化服务。近年来随着信息技术的发展,原有的到馆服务存在着诸如服务效率低、利用率低等问题,制约了社会公众对地质调查成果的开发和利用。因此,建设数字地质资料馆是地质资料工作在新时代的转型,也是在新时代下推动地质资料工作全面信息化转变的契机。数字地质资料馆平台实现了为社会公众提供即时、有效、专业、准确和权威的地质调查成果数据服务,同时有效地提高了地质调查成果数据的利用率和信息产品服务质量[3]。

全国地质资料馆汇聚了多种应用平台的核心功能,开展并完成了数字地质资料馆建设。同时为保障数字地质资料馆平台高效稳定运行,通过现有技术和软件产品,参照ITIL国际标准,对智能运维体系进行了探索。本文通过对数字地质资料馆智能运维体系研究和实践的经验进行总结,以相关国内外标准为依据,利用成熟的商业软件平台,结合实际业务需求,以最低的成本投入,构建数字地质资料馆平台智能运维体系,并提出完整有效的指导建议,切实带动和提高地质资料信息化建设管理支撑能力[3-4]。

1 数字地质资料馆智慧运维体系建设原则与意义

1.1 智慧运维体系建设原则

从数字地质资料馆平台来看,智慧运维体系是根据需求提供规范的信息系统服务平台,对与数字资料馆平台相关的各项信息系统进行系统地组织、计划、监控、管理和维护,是综合信息系统平台运行维护管理工作的总称。智慧运维体系是数字资料馆各平台的生命周期的最后环节,是展现系统建设所取得的经济价值中最重要的环节,也是存在时间最长的阶段。在该阶段智慧运维体系主要依托数字地质资料馆平台交付的基础设施软件、硬件环境,开展规范、科学的运维管理,保障数字地质资料馆的安全、高效、稳定的可持续服务,满足地质资料数据通过社会化服务展现经济价值。智慧运维体系的核心目标就是规范的利用好、管理好已投入使用的数字地质资料馆平台,其建设过程中需要遵循的原则主要包括规范性、合理性、先进性和经济性四个方面[5]。

1) 规范性。智慧运维管理过程中须严格遵守相关法律、法规、国家标准、行业标准和技术规范等。在进行运维管理体系的总体架构设计与执行过程中,须依据有关文件的要求进行架构设计,在执行全部过程中须严格依据标准进行操作,同时建立规范化的操作记录机制,通过开展智慧运维体系规范的管理体系建设,实现智慧运维体系达到国际一流水平。

2) 合理性。智慧运维管理的核心目标是保障数字地质资料馆平台的各功能组件的运行能力,在满足安全、稳定运行的基础上,达到系统平台设计的既定运行能力。在智慧运维管理过程中需精准的掌握相关系统平台的功能模块,熟悉该功能模块的运行能力,结合其特点合理的规范设计各功能组件的性能监控指标,主动的进行性能监控和分析,最大程度保障数字地质资料馆各平台的安全、稳定、高效运行。

3) 先进性。智慧运维体系需要高效便捷的对数字资料馆各平台开展运行监控和维护工作,从技术层面需要利用最新的成熟技术开展运维管理和监控,从管理层面需要参考国际ITIL标准和有关国家标准执行。以先进技术和先进管理理念,建设完备的监控、管理和服务的流程,实现高效、精准、便捷的运维管理工作。

4) 经济性。智慧运维体系作为辅助管理平台,在其建设时期需要严格制定预期效果和人力、财力、物力的投入目标,同时作为数字地质资料馆的建设管理的延续,需要建立稳定的运行维护工作经费保障机制。在建设过程中所需设施选型须遵循成熟稳定产品优选选择,避免单独开发,有效减少建设经费的投入。同时,在规范的运维记录数据分析下,进一步合理规划设施增加和更新所需的经费投入,从而更加合理的进行数字地质资料馆建设与运维费用的分摊,实现成本与使用管理相对平衡[3]。

1.2 运智慧维体系建设意义

数字地质资料馆平台在建设过程中,投入了大量的人力和物力,同时开展并完成了大规模的IT基础设施软、硬件环境建设。利用这些基础设施有效的保障了地质调查成果资料的社会化服务,切实为国家经济建设和科研学术研究提供了专业、权威、真实、精准的地学信息服务产品。通过开展智慧运维体系探索和实践,利用现有的技术手段进行自动化的基础环境运行性能、IT基础设施运行状态和各系统平台服务的运行状态监控,开展监控和运行数据自动采集,实现对数字地质资料馆各平台的运行进行全方位监控,为其升级、更新和改造提供精准的基础运行数据支撑,同时自动报警和自动修复实现对IT基础设施进行全方位保障。

通过开展数字地质资料馆智慧运维体系的探索和实践,在利用成熟的监控软件对基础硬件、基础软件、服务支撑系统平台等不同层级的运维管理,所采集的数据对软件、硬件厂商在地质资料行业研发过程中,根据其特点开展具有一定针对性的改进、完善和优化。在运维过程中产生的标准和规范,有助于行业内相关单位开展类似建设工作时提供一定的参考和借鉴,同时也培养和带动了地质资料信息化建设队伍的能力建设,有效推动从业人员的实际工作经验积累和技术储备[5-7]。

2 智慧运维体系

2.1 物理环境实时监测

物理环境实时监测是智能运维体系中对基础物理环境进行运行监控,主要为保障数字地质资料馆各平台所使用的全部IT基础设施的正常运行,利用信息技术重点开展空间、电力资源、环境温度和消防等基础环境资源的监控。这部分设备需要纳入到智慧运维管理体系之中。由于传统数运维体系主要依靠人工,进行基础环境中的风火水电人工巡检和监控,因此为提升整体基础环境运维能力,特建立智能自动巡检、监控架构实现自动化运维监控,提高基础设施环境整体的运维能力。物理环境实施监控部分的主要监控内容如下:供电系统运维、空调系统运维、安防系统运维和消防系统运维[7-8]。

2.2 IT基础设施运行性能监测

IT基础设施运行性能监控系统,一方面可以对基础支撑的服务器及其应用系统进行实时监控,另一方面也可以为系统管理人员提供完善的监测和报警平台。据相关要求服务器及其应用能7×24 h持续正常、稳定的运行,根据客户需求的不同,提供5×8 h、7×12 h的分级服务。IT基础设施运维体系主要涵盖两类三方面,两类即硬件类和软件类;三方面即基础底层硬件运行方面、基础系统运行方面和应用系统运行方面[2-3]。

2.3 网络环境运行监测

网络环境作为数字地质资料馆各平台重要的基础设施资源,在运维管理过程中需制定相关流程予以控制。网络环境运维建设主要包括以下内容:网络拓扑结构运维、网络的访问管理、网络系统日常维护流程、维护网络IP地址表和网络系统巡检[3]。

2.4 存储效率与备份性能监测

数字地质资料馆核心的组成部分之一就是存储系统,核心数据和服务数据是数字地质资料馆的核心内容,因此存储子系统的运行压力尤为重要。存储系统和备份系统运维的主要对象是物理环境、供电和线路、硬件设备维护等方面。

存储系统维护包括:供电巡检、设备巡检、定期查看存储系统和存储系统用户信息维护等[8,10]。

备份系统运维包括:空白介质与有数据介质保存方式的规定、应制定统一的介质编号、建立介质管理员制度、数据介质控制、定期对带库设备进行除尘处理等[8-11]。

2.5 安全智能管控

安全智能管控的运维对象是系统与数据,系统主要包括操作系统、数据库、中间件、应用程序等系统资源;数据包括核心数据、配置文件、日志等各类数据资源。这类管理对象虽然不像传统管理对象那样“看得见、摸得着”,但却是IT服务的逻辑载体。安全智能管控运维体系主要分成2个方面进行。其中,系统安全管理主要由安全监测、安全防护和安全审计组成,结合运维管理平台实现将技术、流程和人三者有机结合;防病安全管理主要包括防病毒软件运维管理和病毒资讯告知机制[11-13]。

3 结 语

数字地质资料馆平台智慧运维体系探索与实践,是地质资料信息化工作者的长期面临的运行压力和重点工作之一,同时也是为建设国家地质资料数据中心奠定准确权威的建设规划参考依据。在新时代下新兴的信息技术不断更新和发展,在此基础上开发了各类的应用系统和平台,实现即时、全面、准确、高效的为社会公众提供准确、权威的地学信息服务产品。这不仅满足了科研使用,也是重要的国家基础数据资源。因此,地质资料信息化工作需要面临的不仅仅是如何更高效、安全、稳定可信的提供社会化服务所需的业务平台,更重要的是如何通过信息技术运行和维护好已投入使用的各类服务业务系统平台。既要满足服务业务平台安全、稳定、高效的同时,更需要保障其性能始终达到高效、安全和稳定,同时能够为更新系统平台提供必要的基础运行数据支撑。通过智能运维体系的探索和实践不断的开展运行和完善,切实保障现有业务平台运行安全稳定可靠的基础上,积累丰富的运行维护经验和系统架构规划基础理论数据,为地质资料信息化长远发展奠定必备的基础运行数据积累,更精准的开展相关规划和建设[13-14]。

在智慧运维体系探索与实践的过程中,完善和规范了地质资料信息化的运行维护操作规程,对基础环境、IT基础设施、网络环境、存储备份体系和安全管控体系等工作积累了丰富的实际运行维护经验,也是对软件、硬件厂商提供了真实准确的运行数据收集,便于精准的对现有系统和硬件设备升级和完善。智慧运维体系是数字地质资料馆运行的重要基本保障工作,也是地质资料信息化工作者的核心职责之一,更是依法对全民所有的基础地质信息数据接收、保管、服务等工作的重要技术保障[12-16]。

猜你喜欢
资料馆运维监控
The Great Barrier Reef shows coral comeback
法国电影资料馆举办贾樟柯作品回顾展
运维技术研发决策中ITSS运维成熟度模型应用初探
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
风电运维困局
杂乱无章的光伏运维 百亿市场如何成长
配电线路的运维管理探讨
PDCA循环法在多重耐药菌感染监控中的应用
2012年北京国资联年会日程表