游乐设施大数据中心的建设与应用

2024-04-17 06:14马超宇张金利谢印国
中国特种设备安全 2024年3期
关键词:游乐特种设备数据中心

马超宇 黄 羽 张金利 孟 洁 谢印国

(北京中冶设备研究设计总院有限公司 北京 100029)

大型游乐设施被称为“特种设备中的特种设备”,其典型特点是结构型式多样,参与人数多,以青少年儿童为主,发生故障或事故社会影响大,其安全状况直接决定了游客的生命安全,影响社会稳定[1]。GB 8408—2018《大型游乐设施安全规范》对大型游乐设施设计、生产、运行的各个环节都进行了规定,重点是大型游乐设施的安全风险评估,对大型游乐设施的安全提出了严格要求[2]。原质检总局印发的《特种设备安全与节能事业发展“十三五”规划》明确提出:“开展基于互联网和大数据的特种设备智能检验、检测技术研究,开展自动快速检测与安全诊断技术研究及设备研制,开展故障诊断、智能维修、风险评估、完整性管理、剩余寿命评估等技术研究,开展节能环保在线监测技术研究,提升在用特种设备风险监测与维护保障技术水平”[3]。而在《2023 年特种设备安全监察工作要点》中提出要推进智慧监管,强化数据归集治理,完善数据核验机制,提升特种设备归集数据质量,推动信息技术与检验检测技术深度融合,推动智慧管理平台建设,开展智慧监管[4]。

随着云计算、人工智能、大数据的迅猛发展,特种设备相关人员开始研究新时代下特种设备的智慧监管。张胜杰针对基层特种设备监察工作中存在的问题,提出了一个特种设备智慧监察系统,实现特种设备日常监管的无纸化,提升监管效能[5]。李恒等提出了基于大数据的电梯安全风险监管模式,它应用电梯静态数据和动态数据,根据设备风险存在的可能性以及造成的后果严重程度,划定安全风险等级,基于大数据风险监管模式,有效管控风险,提高电梯安全监管的效率和精准度[6]。伍冠桦提出了一个基于云平台的特种设备信息管理应用系统,该系统基于云平台,实现电梯生产参数、监督检验、定期检验和日常维护保养数据采集到云平台,对采集来的数据进行分类、整合、处理与分析,以便对电梯的使用过程进行有效跟踪,为监督监察部门提供有效的监察数据,提升特种设备使用安全水平[7]。张宏亮等提出针对特种设备信息化数据进行分析,充分挖掘与数据建模,实现特种设备的智能化与可视化,将大数据和智慧监管结合,构建特种设备安全社会共治体系[8]。

在大数据、云计算和人工智能的发展背景下,特种设备的信息化、智能化也是发展的必然趋势。而游乐设施作为关系生命安全的特种设备,将其信息化和智能化是必须要完成的一项任务,信息化和智能化的基础是大数据中心,大数据中心能够支撑游乐设备的智能化,提升其安全管理水平。

1 大数据中心建设目标和内容

为实现自身设计生产的所有游乐设备的全生命周期管理,以提升游乐设备的信息化和智能化,因此基于大数据的游乐设施全生命周期管理与服务平台应运而生,该平台包括“一个中心、六个系统、一个平台”,一个中心是一个大数据中心,六个系统是游乐设施健康评估系统、备品备件智能补货系统、游乐设施安全追溯系统、游乐企业评级服务系统、定向客户服务系统、应用支撑管理系统,还有一个可视化综合展示平台。它围绕游乐设施安全管理和游乐产业能级提升目标,采用云计算、大数据、互联网、物联网等现代信息技术,与业务应用深度融合,形成以“基础设施层、数据层、支撑层、业务层和用户层”为主要内容的建设体系。

大数据中心是该平台的基础和核心,它聚焦游乐设施全生命周期数据,打破数据壁垒、消除数据孤岛,实现数据互联互通。大数据中心完成数据采集、数据处理、数据管理、数据分析、数据服务、数据共享交换、大数据存储与计算套件等功能,支撑游乐设施实时运行状况监控、实时健康评估、实时报警等功能,以便及时发现安全问题,提前预防,避免事故的发生。大数据中心还支持游乐设施的智能化,为机器学习和深度学习提供数据支撑,使游乐设施越来越智能。

大数据中心的建设目标是使游乐设施行业设备供应商、运营商和相关监管部门严格按照行业标准规范设计、开发、运营和监管设备运行状况和设备健康状况,提高游乐设施安全水平,同时也可以为运营商降低设备运营成本,使监管机构实时了解游乐设施运行状况,提高行业整体安全管理水平。

大数据中心对下要采集游乐设施的各类数据,对上要支撑不同用户的使用,用户不同,使用的数据不同,访问权限也不同。目前对于各类企业,数据是企业的核心资产,数据不应随意被获取,而应按需获取。如对于游乐设备,其用户有乐园经营者、供应商、监管部门、检验机构、行业协会等多种不同类的用户,而每类用户针对游乐设施所关注的数据和内容是不同的,因此根据整个平台的需求,大数据中心建设内容如图1 所示。

图1 大数据中心内容建设示意图

如图1 所示,从下往上看,大数据中心建设的第一步是资源建设,即计算资源、网络资源、存储资源,数据是大数据中心的核心,数据需要采集、传输和存储,然后才能用于计算,支撑这些应用是基础设施,没有基础设施就没有大数据中心,因此基础设施建设包括网络资源建设、存储资源建设、计算资源建设以及安全策略制定,保证数据被安全使用。

大数据中心的基础设施是由庞大的设备群支撑,因此需要对各种软硬件资源进行管理,即资源监控、资源分配、安全管理等多项内容,资源监控和资源分配是大数据中心的重要工作之一,要保证资源被充分利用,不浪费资源,同时也要保证各项资源不被过度使用,导致平台其他业务功能不好用。

大数据中心的数据体系是它的基础,这里定义了该数据中存储了什么样的数据,并以什么样的形式进行存储,其物理含义是什么。打通游乐产业研发设计、生产制造、安装、运行、维护保养、检修等各环节间的数据壁垒,建立跨企业大数据融合机制,并提供大数据的采集、处理、存储和治理等技术支撑,以数据应用优化游乐设施运营管理模式、安全保障模式,提升产业服务能力,推动游乐产业持续升级。大数据中心针对结构化、半结构化和非结构化数据提供大数据的采集、处理、存储和治理等技术服务,数据汇聚至大数据资源中心。

数据治理是大数据中心的重点工作,首先它要采集各类数据,如每个游乐设施上的实时监控数据,每个游乐设施的维修数据,以及每个游乐设施当时所处环境的环境数据等内容;其次要对数据进行清洗,去掉一些异常数据,或者补充一些丢失数据,将数据根据业务需求进行整理、清理,形成可用的数据集存储进数据仓库,供后续各业务系统使用;数据目前也是各企业的重要资产,其安全性也很重要,在这里根据数据的安全性需要进行数据权限控制。

数据模型是建立业务模型和存储领域知识,游乐设施有多种,每种设备都有其特征,如表征设备运行良好的特征向量不同,判定每类设备故障的标准不同,因此在此需要将设备的运行数据获取并存储下来,后续才能使游乐设施智能化,实现设施的智能。因此数据模型针对不同的设备、不同的故障建立不同的数据模型,供后续设备诊断和评价使用。

数据决策部分集成了多种机器学习、深度学习算法,这些算法为不同的游乐设备建立不同的学习模型,解决各自的问题。

数据应用层就是依据不同类用户的需求构建的应用系统,但这些应用系统都需要使用大数据中心提供的各种数据或者服务,来为它们的用户提供服务。数据应用是该平台对外提供服务的接口,针对不同的应用系统、不同的用户,需要提供不同的服务,但是不同的系统、不同的用户可能需要查看的数据是同一组数据,如游乐设备的运行数据,游乐设施的经营者、供应商甚至监管部门都需要查看,这样大数据中心就做到了数据共享,打通了各系统、各用户之间的数据壁垒,提高了数据的使用效率。

大数据中心的建设好坏决定了企业对外提供服务的能力好坏,笔者单位针对游乐设施大数据中心的建设,可有效提升设施的信息化、智能化和安全性,同时提升管理效率。

2 大数据中心技术架构

大数据中心是所有应用的支撑,连接了所有的游乐设施和各类工作人员,而游乐设施和工作人员分布在全国的各个地方,因此大数据中心采用分布式体系结构,应用阿帕奇(Apache)基金会所开发的分布式系统基础架构(Hadoop)实现分布式计算和分布式存储,进行数据采集、数据处理、数据存储,供上层应用。大数据中心采用云原生技术,使用开放源代码的J2EE(Java 2 Platform Enterprise Edition)应用程序框架SpringBoot 和开源的微服务框架SpringCloud 管理各个微服务的应用,以保证系统的快速、稳定运行,同时便于维护,支持便捷的应用模块接入方式,便于系统的扩展。其技术架构示意图如图2 所示。

图2 大数据中心技术架构示意图

从图2 可知,大数据中心分成七个主要部分,分别为数据源、数据采集、数据存储、数据处理、资源调度、系统管理、数据应用。

数据源主要是来源于各个游乐设施、各个应用系统以及外部系统的数据,该部分主要根据每个设备不一样,采用不同的协议进行通讯,获取不同类型的源数据,如结构化数据、半结构化数据、图片、视频、文本等类型的数据。

数据采集是将各种数据采集进大数据平台,在该部分用到的组件有分布式消息队列(Kafka),高可用的和高可靠的分布式的海量日志采集、聚合和传输的系统(Flume),大数据传输工具(Sqoop),高性能数据同步系统(Canal)等,Kafka 主要是做数据同步和缓冲,所有采集来的数据先进入Kafka,然后Kafka 将数据同步到各个数据库,Sqoop 是在Hadoop和关系型数据库之间进行大容量数据的传输,Flume采集、聚合海量的日志数据,Canal 也可实现数据同步。

数据存储是大数据中心的主要工作,所有平台使用的数据全部存储在此,而数据存储根据应用场景不同,使用的存储方式不同,在该数据中心支持分布式文件系统HDFS(Hadoop Distributed File System)存储、列数据库存储、行数据库存储和时序数据库(Influxdb)存储,如游乐设备的监测数据是1 s 采集1 次,因此这些设备实时采集的数据采用时序数据库进行存储;而各类应用系统的数据依然采用关系型数据库(MySQL)存储,因此支持行数据库存储;但对于大量的实时数据处理,需要使用列数据存储结构或者分布式文件系统,所以使用HDFS 和列数据库进行该类数据的存储。

数据处理是针对数据应用对数据进行不同的处理,如为了支撑健康评估系统,需要根据实时采集的游乐设施数据进行实时故障诊断和健康评估,以便及时发现问题,因此在这里使用在线资源管理工具STORM(School Tools for Online Resource Management)实时计算每个设备的运行状态。而对于AI(Artificial Intelligence,人工智能)应用,需要根据不停增加的数据,进行学习和优化,因此在该部分包括了行业算法库和分布式计算框架MapReduce(Map 是映射,Reduce 是归约),以便进行健康模型、预测模型等模型的学习与优化,提高模型的准确率和效率。数据仓库是将各种数据根据应用场景不同进行组织和管理,以支持数据应用,如设备的历史数据查询、安全追溯查询等功能。在该部分,提供一个算法集,它包含数据分析、机器学习、深度学习等算法,辅助领域专家进行数据分析和数据建模。

数据应用就是根据不同的用户建立不同的数据展示页面,如针对管理层,通过数据可视化可对所有游乐设施的运行状态、商户状态等进行展示。对于设备维护人员或游乐设施经营人员可通过实时监测模块查看每个设备的实时状态。AI/BI(Business Intelligence,商业智能)应用可供领域专家进行数据分析以及模型建立和训练,以便更好地优化各模型,而在此数据应用包括游乐设施健康评估系统、备品备件智能补货系统、游乐设施安全追溯系统、游乐企业评级服务系统、定向客户服务系统、应用支撑管理系统和可视化综合展示平台,这是目前为止大数据中心支撑的应用,后续也会按需扩展。

资源调度主要是管理分布式环境下的网络、计算、存储等资源,这部分采用经典的资源管理组件YARN(Yet Another Resource Negotiator,另一种资源协调者)、ZooKeeper(分布式应用程序协调服务)等,以提高资源的使用效率,保证资源不被闲置,但也不被过度使用,资源能够支撑上层应用。

系统管理包括配置管理、部署管理、监控管理等内容,是为系统管理员提供方便易用的管理工具,可通过该部分简单、快速、有效地进行配置、部署等工作,保证系统能够安全、有效、准确运行。

3 总结

目前,该数据中心由笔者单位实施建设,通过该大数据中心可对全国各地各游乐设施进行实时监控,游乐园管理者可实时查看各游乐设施的健康状态,是否需要检修,是否需要更换部件等,如果某个游乐设施需要更换零部件,相应的供货商会收到通知并提供服务。而监管部门或平台管理者可随时查看每个游乐设施的运行状态,可以查看游乐园经营者是否在安全情况下使用各项游乐设施,如果有问题可及时提醒或警告相关人员,保证了游乐设施的安全性。

该数据中心从内部系统、外部获取海量数据,采用分布式技术和海量数据挖掘算法,实现海量数据的运算和挖掘,实现PB(PetaByte,千万亿字节)级数据查询秒级响应。支持多用户的同时访问,系统响应时间小于2 s。

笔者单位的游乐设施大数据中心的建设有效地保证了笔者单位提出的游乐设施全生命周期管理平台的建设,以数据为核心,将设备、人等各种资源集成为一个整体,集体对外提供服务,有效地提高了企业的服务能力。目前,高空秋千、悬崖过山车、中三环过山车等多套设备数据已成功接入大数据中心,为设备制造商和游乐园管理者提供实时设备信息,此外还有丘比特过山车、103 m 摩天轮等多套设备正在接入中。随着大数据中心的逐步使用,积累的数据越来越多,在设施的故障诊断、故障预测等方面还可进一步加强和提升,以保证游乐设施越来越安全、越来越智能。

猜你喜欢
游乐特种设备数据中心
严把“三关” 强化疫情期间特种设备安全监管
酒泉云计算大数据中心
新形势下的特种设备网络安全防护探讨
冬奥游乐会
更正启事
动物游乐汇
西部特种设备网
民航绿色云数据中心PUE控制
景观文化展示森林公园游乐魅力
音乐游戏玩起来
——新春游乐汇