工业数据质量对钢铁工业生产及大数据分析的支撑

2019-12-19 12:31:14孙晓晨李兆宇赵维娜
商品与质量 2019年24期

孙晓晨 李兆宇 赵维娜

河钢集团唐钢公司 河北唐山 063000

随着信息化建设的不断推进,特别是自动控制系统已经成为钢铁企业进行管理,创造价值的重要手段。企业生产经营过程中有大量的数据积累,这些数据是企业的宝贵财富。但是,如何有效利用这些数据,让数据创造更多价值,这是钢铁企业值得思考的问题。

1 工业数据及其数据质量管理

不管是工业自动化,还是工业智能化(工业4.0),或者是工业互联网概念,它们的基础都是工业数据。从企业经营的视角来看,工业数据可以按照数据的用途分成三类:第一类是经营性数据,比如财务、资产、人事、供应商等基础信息数据,这些数据在企业信息化建设过程中不断积累起来,表现了一个工业企业的经营要素和成果。第二类是生产性数据,这部分是围绕企业生产过程中积累的数据,包括原材料、研发、生产工艺、半成品、成品、售后服务等。随着数字机床、自动化生产线、SCADA系统(数据采集与监视控制系统)的建设,这些数据也被企业大量记录下来。这些数据是工业生产过程中价值增值的体现,是决定企业差异性的核心所在。第三类是环境类数据,包括布置在机床的设备诊断系统,库房、车间的温湿度数据,能耗数据,废水废气的排放等数据。这些数据对工业生产过程中起到约束作用。从目前的数据采用情况看,经营类数据利用率与生产性数据和环境类数据相比差距比较大。从未来数据数量级来说,生产性数据在工业企业数据中的占比将越来越大,环境类数据也将越来越多样化。随着信息系统的广泛应用,人们在获得海量信息的同时,越来越被数据的质量问题所困扰[1]。数据质量问题及其研究由来已久,特别是伴随着计算机为主的信息技术的发展,数据质量逐渐成为被广泛关注的研究热点。虽然如此,至今业界仍然没有就数据质量的概念达成共识,在不同时期,数据质量有着不同的概念和标准。上世纪80年代以来,国际上对数据质量的标准基本上是以提高数据准确性为出发点。但随着质量含义的不断延伸,对数据质量的概念也从狭义向广义转变,准确性不再是衡量数据质量的惟一标准。上世纪90年代美国麻省理工学院(MIT)开展的全面数据质量管理(TDQM)活动,借鉴了物理产品质量管理体系的成功经验,提出基于信息生产系统生产的数据产品的质量管理体系。它提出应理解用户的信息需求,将数据作为具有生命周期的产品进行管理,要设置数据产品管理员管理数据生产过程和结果。在数据生产过程中形成的质量,如精度、一致性、完整性等,成为基本要求,对数据用户要求的满意程度也成为衡量数据质量的重要指标。如有的研究人员认为高质量数据就是指那些适合用户使用的数据,有的研究人员认为数据质量就是“反映出数据对特定应用的满足程度”。数据,如同形形色色的其他各种产品一样,是为了满足人们的特定需求。在智能制造系统中,数据是应用程序的初始原料和最终产品,并经过应用程序的组织,提供给用户。同样的一组数据,面对不同的应用要求,可能表现出不同的数据质量。数据质量概念认识主要包括以下两个方面:一是注重从面向实践方面来衡量数据质量,即从用户角度来判定,强调用户的满意度,还有就是从数据生产者和管理者来考虑;二是注重从面向系统的角度来评价,认为数据质量是一个综合性概念,是一个多维度的概念,包括数据本身也是多维度的。需要从多角度来衡量其基本质量要素,如适用性、准确性、适时性、完整性、一致性和可比性等多角度来评价数据质量的好坏。

2 大数据技术在钢铁企业中的应用

大数据技术在钢铁行业中得到了众多的应用,如APS生产排程系统、协同办公平台系统、ERP系统、成本分析平台等信息化系统,这些系统都是大数据技术在钢铁行业中的应用。大数据的基础分为:用户数据、成本数据、生产制造数据和物流数据。企业的成本从两个领域来,第一个领域是提供服务给大众数据的应用,就例如物联网行业。第二个领域是应用大数据,这就需要企业自主地发现数据之中的价值。大数据技术的应用能够给钢铁企业解决众多的难题,钢铁企业要想合理地应用数据化技术,可以通过以下的方式。

2.1 建立自己在互联网上的平台

钢铁行业可以在互联网上建立属于自己的一个平台。目前有众多的钢铁行业在互联网上有平台,就像唐钢集团就有属于自己的电子商务平台,会通过自己的电子商务平台采购需要的物品材料,观看企业在线交易情况,可以对客户进行服务,还可以收集用户的信息,看到网络平台有如此的优点,众多的钢铁企业也纷纷模仿起来[2]。唐钢集团这几年来一直在改善服务平台,开发了公司的微信平台,让员工通过微信快速获取公司战略决策、界动态和消息通知等,为公司的管理提供更有效的数据信息。

2.2 与大数据分析和挖掘公司合作

钢铁行业可以与一些大公司合作,共同发展大数据的分析。现如今市场中的一些公司就具备有分析大量数据的能力,按照我国目前大部分的钢铁企业都没有分析大量数据的能力,所以这些企业可以选择和其他的公司合作,唐钢近年来积极地和其他公司进行技术交流和合作,对一些数据信息进行分析,近几年来还不断发展创新,打造产线上的机器学习模型,时时刻刻分析产品的质量、原燃料投入等,提高产线产能和产品质量[3]。

工业数据质量问题对于我国智能制造是一个至关重要的问题。数据质量的提高涉及到技术、设计、业务流程、员工和企业的基础设施等多个方面。对工业数据质量开展研究,进而提出改善工业数据质量的方法和对策,保障工业数据质量,具有非常重大的意义。