◆ 胡本立 / 文
数据驱动与以人为本的统一
——关于质量管理上的几点思考
◆ 胡本立 / 文
我们经常听到谈论“数据驱动”,又听到谈论“以人为本”。在这里想简单谈一下这两个话题能不能统一、怎么统一,尤其是关于质量管理上的几点思考。
大家都是质量管理的专家,一直都在跟数据打交道,那么在大数据时代的今天,讨论的数据与以前的有什么区别呢?这里讨论的是“数据”的广义化,不单单是数字,一部分是属于软数据,硬数据是物理可测的。可以分为几个层次,一个是概念;一个是关系,概念之间的相关性;是不是可以量化;是不是可测。对数据深层次的反思,可以说数据是一个符号,是人发明的语言符号,怎么组织符号的内涵和符号的外延,怎么关联起来,怎么结构化、非结构化,在大数据讨论当中经常会用到。
数据的几种分类方法。数据讲到底两大范畴,一是自然界的,如光、热、天气,不以人们意志为转移客观产生的。但是在大数据时代,很多的数据都是人产生的。其一是人的思维产生的,像词汇语言,以前大家觉得这不是数据,但现在从互联网的发展和人工智能,从数据挖掘来看,都已经变成了数据,这是一个广义化的过程。其二,设计制造设备产生的,归根到底设计设备的还是人。数据驱动后面还有人的因素,以人为本的基础还是在的,但是人们往往忘了人在里面和数据互动的过程。
结构化和非结构化。结构化往往是数据库。还有一些非结构化的主要是语言,非结构化是目前大数据主要要处理好的问题。这里一个主要的难点就是涉及到不是结构还有内涵方面的挑战。
人与数据的互动和循环。从数据的生命周期来看,小孩生出来就由视觉、听觉、嗅觉等等接触到一些原始数据,即一生下来就在数据的环境下,就要储存在大脑里。现在的很多研究和讨论,尤其是认知过程中产生的意识和概念,体现的是人与数据的互动及循环。概念和怎么表达这个概念是两回事。一个是脑子的结构,而怎么表达,就是词汇和语言,又回到感官了。我现在讲,你们看、你们听,又到听和视觉了。
所谓的数据驱动是整个过程的一部分,是词汇、语言再转一个圈又被抽象储存,是一个循环过程。讲了很多的数据驱动,不能忘了后面还是人。人跟数据是怎么互动的,是大家很关注的一个方面。
新一代质量管理的挑战也是新一代数据管理的挑战。我看到一些文章跟我们讨论数据质量很类似,很多的流程,开始是客户,最后也是客户,开始对需求怎么能够表达的清楚,最后客户的满意度又回到客户那里。什么叫做满意,有硬的指标还有软的指标,从客户到客户,满意和需求对我们来说都是数据。
信息化时代中传统产品、服务质量管理与数据质量管理的关系。在技术行业有一个CMMI,最近发展的比较快的又有了DMI,从某种意义来说是一件事的两个方面,对我们来说ISO和其他一系列的标准就是数据,就是一个非结构数据,非结构数据里面怎么提炼成半结构化,再到计算机,再变成结构化的过程,需要更多的讨论和认识,来提高质量的管理水平,另外也提高数据质量管理的水平。它们之间都是相关的。
(作者系国际数据管理协会副主席;本文根据作者在第九届上海国际质量研讨会上演讲速记整理)