谷锋超+苏长虹
摘 要:通过介绍工业大数据的意义,对工业大数据的需求进行分析,从而提出对工业大数据的总体设计目标、设计原则及总体逻辑架构,实现总体的目标
关键词:工业大数据;数据挖掘与建模;物联网
1 大数据
对于“大数据”(Big data)研究机构Gartner给出了这样的定义。“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。
麦肯锡全球研究所给出定义:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
2 工业大数据的意义
随着信息技术的广泛应用,数据增长速度越来越快,数据类型越来越丰富,数据已经成为像黄金和石油一样的重要战略资源。通过对数据大量收集和分析,获取信息,进一步转化为知识、应用和价值,从信息时代迈入智能时代。各种工业数据的采集和解析将比其他行业更为复杂,工业大数据的分析和可视化也要符合工业生产的具体要求,工业大数据的安全事关生产质量和安全生产,显得更为重要。总之,无论从应用和技术角度看,工业大数据集成应用将成为两化深度融合的重点任务。
3 需求分析
3.1 系统涉众分析
3.2 业务需求
通过工业经济运行信息采集、传递、存储、分析以及预测,辅助行业管理决策。包括以下几个方面的业务需求:
1.重点企业信息分析
掌握重点企业的发展战略和市场动态,动态把握本地重点企业的盈利、投资、重点产业发展状况,并前瞻性的对重点企业的生存发展状况进行分析,同时对经济运行决策形成支撑。
2.市县产业布局分析
动态监测各市县产业发展情况,通过分析地方产业重点产业销售收入情况、主要产品情况、重点企业情况、重点产业基地建设情况、进出口情况等方面的发展情况,准确把握产业空间布局和产业转移态势,为合理布局产业及指导地方产业发展提供支撑。
3.行业信息分析与预测
对重点细分产业的生产、消费、投资等主要经济运行数据和相关信息进行常规性的分析与预测,对重点细分产业的发展现状、波动情况和发展趋势等做出相应的分析和判断。
4.经济运行决策支持
从产业、行业、企业等多个细分维度进行分析和预测,对整个产业的经济运行作出总体分析和前瞻性判断,对产业经济运行整体状况形成全面和准确的评估。
5.政策法规服务
提供政策法规支持辅助研究分析,为用户获取产业政策法规资源提供最大便利。建立产业政策法规知识库,包含产业经济运行调控目标、现有产业政策、相关法规等内容。
6.规划辅助支撑
提供相关规划支持辅助研究分析,并为用户了解相关规划资源提供最大便利,辅助其决策行为,提升决策科学性。
4 总体设计
构建工业大数据平台的“顶层设计”,涵盖信息化基础设施、大数据应用支撑平台以及面向不同层面使用者的功能展现。从而为未来工业大数据平台深化扩展、平滑演进打下基础,建成一个开放、统一、信息共享的工业大数据综合管理与应用平台。
5 总体逻辑架构设计
根据工业大数据平台的建设目标和需求,工业大数据平台总体建设框架如下:
6 总体目标
工业大数据平台总体框架包括大数据平台、大数据应用、标准规范体系、安全保障体系、运维管理体系等方面。
工业大数据平台是一个大型复杂的信息化建设工程,因此,考虑按照总体目标分两期进行建设,第一期建设着眼于以“最小系统”方式尽快形成平台应用和数据采集、整合、分析功能;第二期建设着眼于业务应用的扩展和深化。
一期:搭建平台架构,实现最小系统
一期作为重点建设着力先把基础平台架构搭建起来,实现从工业数据采集、传输、存储与处理到数据应用展现的完整平台基础架构,并在此基础上整合在建的运行监测和能耗监测系统,同时推进园区管理与项目管理的相关业务应用功能部署。
二期:深化业务应用,辅助决策支持
二期完善基础信息资源库建设,实现宏观经济及微观经济基础数据库;提升综合管理应用,实现对领导决策的辅助支持;开展以工业大数据应用为主导的信息服务模式的探索和应用,在政府以及工业企业大数据应用逐步推进的基础上,面向企业和社会提供工业相关数据服务,如为中小制造企业提供精准营销、互联网金融等生产性服务。
7.结论
在综合考虑平台系统如何集成网络、硬件以及软件平台的“顶层设计”基础上,重点围绕软件平台的不同使用对象的功能需求进行设计,以突出“用户为中心”。并解决了以下问题:
建设开放的应用集成平台:通过建设基于SOA架构的应用支撑平台,实现业务应用系统的模块化部署,并且使用统一身份认证通过数据交换与共享,实现跨部门不同使用者在统一门户下的“开放式”访问;
解决工业基础数据来源问题:通过部署面向工业企业的统一界面访问的数据直报系统,实现按照数据采集业务流程对运行监测数据、节能监测数据、在建项目数据等的直接报送,辅以物联网试点实现视频、定位等实时数据采集。
解决工业数据真实性问题:使用特有的流数据平台进行实时的数据比对、动态展现和告警。通过设置特定的特征索引并设定特定的比对规则,并将该特征索引和实时监控数据进行实时匹配,找出符合目标特征的数据并进行实时预警和展现,找出数据异常、比对不符以及数据异常变化等情况。
解决区域、行业数据采集分析问题:通过开放的工业大数据应用支撑平台的数据采集与共享,实现按市县地域、园区、行业分别建库,分别建立监测体系,用细分的数据进行结构化分析,并面向不同层面的用户提供个性化展现。
解决分析指标的模型工具问题:通过开放的工业大数据应用支撑平台的工具引擎,如数据挖掘与建模,结合工业经济监测指标,建立面向工业大数据分析的信息接入规则和知识模型,并通过业务应用系统对各项管理指标能够设置预警,实现主要指标数据预测功能。
解决既有系统融合问题:通过建设开放的应用集成平台,可以实现原有分散应用系统整合和未来新建系统的“模块化”部署。
作者简介
谷锋超,男,中国普天信息产业北京通信规划设计院,工程师,研究方向:大数据平台建设。
苏长虹,男,中国普天信息产业北京通信规划设计院,高级工程师,研究方向:大数据平台建设。