◆陈 刚 / 文
大数据时代的质量管理
◆陈 刚 / 文
编者按
在第18届中国国际工业博览会质量创新论坛暨第十一届上海国际质量研讨会上,上海开源大数据研究院院长陈刚作了题为“大数据时代的质量管理”的演讲。他指出:大数据带给人们一种数据驱动的思维模式,这种思维模式是可以落地的,正在为质量管理带来美好的前景。
大数据研究院成立于2015年11月16日,它致力于大数据共性的研究,成员主要来自NTO组织的研究员、上海市数据方面的企业、投资人以及其他利国利民的行业投资者。今年6月份,我们投资四亿成立了中云开源技术公司,它是一家面向工业大数据尤其重装备业的储存、分析一体化的服务型公司。
本人基于自身的研究体会和经验,借助项目对标公司的案例,按照大数据的内涵和外延、质量管理、案例分析的次序,与大家分享一些共性技术方面的内容。
大数据为何物?仁者见仁智者见智。我认为大数据恰如原油,之所以做此番比喻,不仅仅是从数据本身的积累过程而言,更关键的是当前人们对大数据的态度与一百年前人们对原油的态度很像。一百年前,原油的主要产品煤油用来取暖,而汽油被视为不安全的副产品被冷落一旁。因此,那时的很多公司、个人都热衷于囤积原油从而提炼出煤油。反观当今,大家,不可能将自己公司的数据存到别处,尤其是国企,会储存在自己公司的数据库里,不会在乎几台服务器的钱。
大数据像原油,更主要的是和原油一样大数据也有助于进行科学研究、工程研究、技术的应用。
数据是对客观世界的描述,语言是记载数据的一种方式。大数据源与原来计算机统计有根本性的差别。语言包括语法、语意、语用等层级,我们可以从这三个层级来理解数据。
大数据像原油,意味着它不仅能生产出一系列的产品,还应具备一系列的功能。在此我们借用了人类科研史上早已出现的模型:AKW模型。大数据可以变成一系列新的数据产品,继而变成信息,再变成知识,最后变成智慧,这些数据产品具备相应的四类功能:一是对过去事情的描述,二是对过去发生事情的诊断,三是客观的预测未来发生的事情,四是人为干预未发生的事情朝着有利于我们的方向发展。
大数据作为原材料,既然它具备相应的功能,那么一定需要相关的设备和工艺才能把材料变成产品。图1是大数据平台的参考架构,它是各行各业建立大数据平台的标准形式。图的下面是它的工业流程,亦即把数据源变成相应的产品并具有相应功能的最终结果。
设备的关键点在于多元异构。数据来源包括文本文件、传感性文件、图像、人的五官获取的信息。不同的结构显示意味着原来的所谓数据库不再能完好地储存数据。多元异构的数据变成相应的产品,主要经过数据的获取、数据的储存、数据的分析这三个环节。这是数据变成产品的工艺流程。
如果想要深入地理解大数据,有三点需要了解清楚:
第一是大数据和统计的区别。这也是当今谈论质量管理必须要理解的,因为包括六西格玛在内,过去很多质量分析的软件都基于统计。大数定论是统计的理论基础,而大数据恰好挑战了这一点。
图1
第二是大数据和超算的区别。大数据的定义,直白点说,大数据是用计算机对物理或社会进行描述。物理、社会和计算机系统构在一起是CPS(信息物理系统)。谈到大数据很多资料都会用若干个V,如volume(数量)、velocity(效率)、variety(多样性)、value(价值)、volatility(易变性),等最多的时候有8个V。如果要想抓住大数据和传统数据的区别,就看它是不是很好的抓住这几个V。
第三是大数据最核心之处在于它不仅是一种科学、工程、技术,更代表着一种可以落地的新思维模式,亦即数据驱动的思维模式。毕竟只有改变了人们观念的工艺才能够放在时代前面定义。谈到思维模式,严格意义上讲,汉语和英语分别对应着思维方式和笛卡尔思维。西医是还原论,中医是系统论,前者是局部思维,认为局部好了总体一定会好;后者是系统性思维。思维范式下具体的推理方式主要有逻辑、统计、启发、概率。譬如,2013年通用汽车要召回一批有瑕疵的车,结果只召回了四辆车就解决了此问题。要解决这件事用传统的概率、逻辑、推理肯定无法实现,只能靠对过去的数据、原材料、语音数据进行系统性的分析。
关于数据驱动,还有一种说法叫第四范式,它由微软公司一位获得图灵奖的技术家提出。所谓第四范式就是把人类对科研的做法进行统计,从实验观测到理论推导、再到模拟仿真、最后到数据驱动。这是六西格玛最基本的原理,也就是说,拿一个产品进行质量管理,先建立一个Y=F(X),然后进行大量的实验,仅保留吻合的数据。然而这种做法是有缺陷的。首先,建立模型意味着我们知道自己知道的,而不知道自己不知道的,这个模型就会有问题;其次,将不吻合的数据全扔掉,也许扔掉的数据中会有新的重要发现。这就是第四范式或者新的数据驱动的魅力所在。
大数据时代的基础是数字化。在互联网时代,一定要有一个数据去跟踪一个物体在整个生命周期的走线,同时还要对应一个Digital Twin(数字映射),以及数字化的载体CPS,这三者的融合形成闭环,演化为数据闭环之后再进行全面的数据分析。
许多工业4.0的数据图都会提及到CPS。工业4.0实质创导的理念不是具体的技术,也不是规范,而是倡导一种新的思维模式和解决问题的方式。我认为,工业4.0更准确来说是产业4.0,它对各个产业均有相应的指导意义,其中最核心的是它强调了三个集成:一是制造业,它强调的是端到端的数字化,每一点都要有对应的数字化,继而形成主线,最后形成推理;二是垂直的,将生产线和管理数据融合起来;三是端到端,将供应商和销售出去的数据融合起来。在还原论做好局部优化的基础上进行整体思维的管理和决策,最终将这三者整合,进而实现整体的思维和做法。
再来看大数据与质量管理体系。质量管理体系的目标永远是满足客户的需求,让顾客满意。具体内容包括质量控制、质量规划等。质量管理体系要常新,一方面满足质量管理和技术管理要常新,另一方面人们对质量的要求也要常新。技术是逐步演进的,譬如今年九月出来的ISO18404,它面向数据,把精益、制造、六西格玛分开。
虽然质量管理的方法不断创新,但是那些不可逾越的难题依然存在,譬如,六西格玛也有数据采集不到位的问题。大数据给传统的质量管理带来了机遇和挑战。
这种挑战不仅来自于技术,更来自于企业的决策者对大数据的重视程度。虽然有一系列成熟的模型可用于分析企业是否适合用大数据,但关键取决于决策者对数据重要性的认识程度。
在质量管理技术总体演进的过程中,把生产视为整个系统,这种思想在当时不仅完全正确而且很超前,但是因数据的采集手段不到位,所以很难落地。
区块链作为一个分布式的数据库新技术,对大型设备的制造商而言具有十分重要的意义,它有助于降低卖出产品的保修成本、维护设备的相关信息。这里最关键的一点是一定要实现整个产品线数据流的闭环,设计阶段、生产阶段到售后都是如此。数据流采用某种技术手段,要实现两个关键点:一是实时,二是按需。只要实现这两个关键点的循环,质量管理就能提升到非常高的程度。
包括通用、陶氏化学等一系列知名企业,均是我们的对标对象。我相信,通过自身坚持不懈的努力,以及向优秀企业孜孜不倦的学习,我们一定会在大数据共性研究与服务方面创造更大的价值!
(本文根据演讲速记整理)