刘宗长
我们发现当初预见的未来正在变成现实。我们聚焦的现代工业系统是怎样的?未来智能工业系统会怎样?目前,主要表现在零部件级、设备级、生产系统这三个维度上。
2016年人工智能悄然出现并逐渐发展,直到现在,仍处在人工智能的序曲阶段。这是为什么呢?AlphaGo事件中人工智能首次戰胜人类棋手,引发了许多思考。同时,越来越多的公司也开始把人工智能技术引向工业的应用领域。
·柯洁在大战之前说,从AlphaGo当中我们学到了很多东西,这对整个人类认识新的知识有很大的益处。
·特斯拉首席执行官埃隆·马斯克(Elon Musk)曾联合100多位人工智能学者向联合国提出倡议,我们应该去关注人工智能给人类带来的威胁。
·麦肯锡曾经指出:“可能到2035年,我们一半的工作将被人工智能所取代。”
·GE前总裁Jeff Emmelt曾提出:“一觉醒来惊奇地发现,GE已经变成了一家互联网公司。”
·德国Fraunhofer研究中心指出:“人工智能可以将生产率每年提高0.8%~1.4%。”
这些都预示着人工智能时代来临了。可是为什么我们需要人工智能?举个例子,在一辆汽车内设置了移动终端,实现对路面信息、交通状况、预计到达时间以及周围商圈等情况的信息收集,这样人们出行时能够享受更多的便利和更好的服务。可以看到,人工智能带来的并不是汽车的改变,而是用新的方式提供了更便利的信息服务。
未来工业智能系统会怎样?
在工业界也是如此,原本的设备没有改变,在机器端对数据进行采集与分析,会呈现出很多关于设备的洞察,包括目前的运行状态与健康程度,跟其他设备与历史状态进行比较,可以自主预测未来设备的状态。最终,这些信息汇集之后传输回设备端,实现自我的维护和调整,这正是智能化技术体现在工业界当中巨大的优势。那么,目前工业中有哪些不足?如何运用人工智能来弥补?
过去我们关注两个方面。第一个是可制造性,运用多种建模手段,如冲压制程等,通过对物理指标的仿真考察规格是否合格,但无论怎样仿真,有些问题还是难以被发现和关注,最终导致仿真中优秀的模型到实际生产中仍可能会产生次品。
第二个是生产系统设计,即对于设备综合效率(OEE)的管理和设计以及整个制造系统当中的设计管理,大多数企业会用到仿真软件,但无论怎样设计生产线,都很难保持设备的不间断运行。最主要的原因是设备会产生衰退,衰退到一定程度后会发生停机,进而导致生产线停止运行,最后导致过去的数据模型失效。
所以我们会发现,设计建模与实际的生产制造中间存在很大的差距。在过去的生产线中,目标是实现work reduction(怎样减少工作)以及waste reduction(怎么减少浪费),现在worry reduction(零忧虑)成为新的目标,即如何把生产过程中原本不可见的东西变得可见,从而去管理这些由于未知所造成的忧虑。将设备中所有造成停机、浪费、次品的风险全部加以控制,最终实现三个零:零停机、零次品、零浪费,消除生产过程中的忧虑。
美国IMS中心在2000年成立时,曾提出“未来智能工业系统”的概念。当时发现每个产品或者系统中都会有上百个维度的数据,但那时数据并不像现在这么容易被提取出来。
我们的想法是,基于嵌入式的智能终端,并结合有效的分析方法,用Watchdog Agent分析引擎,在边缘端处理信息之后,传输出当前状态和健康相关的信息,再跟运营系统相连,最终通过可视化的服务传递回设备端,传递时间既不过早也不过晚(Just-in-time),从而实现近零停机(near-zero downtime),即任何一次停机都处在预料之中。如此可以对机器进行主动维护,实现对设备的改善,最终实现信息的闭环。这就是我们当初提出来的设想。通过这个设想,我们发现当初预见的未来正在变成现实。我们聚焦的现代工业系统是怎样的?未来智能工业系统会怎样?目前,主要表现在零部件级、设备级、生产系统这三个维度上。
从零部件级看,现在关注的是精密性,以及如何通过更加精密的传感器实现更加精密的动作,那么未来呢?需要具备自预测性和自省性,设备需要精密,但外部原因或者自身衰退都会造成精密性发生变化,这时零部件可以将设备的状态和造成的后果反馈给操作者。
从设备级看,现在关注的是性能和能否连续生产质量达标的产品,未来将更加关注设备的自比较性。麦肯锡在数字化制造的战略当中,提出了自比较性这个概念,它既包括设备与自身历史最优状态的对标,也包括在不同的环境下,集群内与其他设备之间的对标。这样可以清晰地了解设备目前状态的好坏与否,如果设备状态不好,还可以进一步了解故障在哪里发生,以及是哪种原因造成的。
从生产系统层面看,是怎样实现最大的生产性来提升设备综合效率(OEE)。现在我们主要关注的是系统中各个设备、工序之间怎样配合。配合的概念是指当上游产生了质量误差时,及时发现并在下游进行补偿。在这个过程中,如果有设备出现质量问题,能用其他的途径进行改善,这就实现了具有强韧性的系统(resilience system),即系统内部可以通过协同性的优化,把问题的影响降到最小。
以上从零部件、装备到系统的不同层级的角度,为大家展示了未来我们希望的工业智能系统的状态。
工业智能发展的五个阶段
在实现工业智能的过程中,需要经历五个阶段。第一个阶段是过去大家一直在做的,即TPS全员生产系统的标准化,提升整体的生产文化的管理。
第二个阶段是精益化和数字化。精益化和数字化的概念是以数据为驱动,使整个系统当中的配合性能够达到最大化,用数字化的方式把当前的状态实时地表示出来,这样就可以了解设备将会出现的问题以及可能带来的影响。
第三个阶段,在我们知道了当前状况的时候,如果能够通过预测性的手段,或者通过数据驱动建模的分析方式,寻找到问题产生的隐性原因,这就是将隐性问题显性化的阶段。要实现这一目标,需要基于大数据,或者人工智能的建模技术。
第四个阶段,当知道设备出现问题的原因时,可以通过结合具体场景,预测对设备的运营或决策会产生什么后果,来实现以预测性为基础的有效性运营和决策优化。
第五个阶段,在以上基础上,把感知、分析、优化和执行连接起来,实现在赛博空间管理整个实体空间中所有设备的系统,形成了赛博空间与实体空间的镜像,最终实现CPS的工业智能系统。
目前,大多数企业还处在第三个阶段,前两个阶段做得很好,但建模的能力还没有形成,问题出现时不了解故障原因。
用GE倡导的工业互联网概念再来描绘一下未来工业智能的技术图景,包含了很多的技术,数据输出后,运用基于机器的算法(machine-based algorithms),如嵌入式智能和边缘计算技术以及在云端的智能分析、数据可视化等,运用数据产生最优化的决策,传递到不同的组织,最终反馈到设备当中进行执行。这既包括IT与OT之间的相结合,又包括很多的云计算、边缘计算等最新的信息技术,甚至包括像大数据分析,人工智能建模等最新的技术研究方向。实现智能设备、智能分析、智能决策,最终形成自发自动的循环。
工业智能化转型的三个路径
那么对于目前的工业企业而言,如何运用工业智能技术和大数据来实现转型?可以运用这个模型分成三条路径。
转型的第一条路径是避免不可见的问题。从数据的角度,将问题产生的过程用数据分析、建模来了解发生的原因。并在上述基础上,通过预测性方式进一步改善,来避免可见问题的发生。
第二条路径是把不可见问题变得可见。不可见的问题是指设备衰退或者生产过程中会出现残次品,设备背后的关联性和关系性模型存在的问题是不可见的,从数据的角度能够挖掘到关联性,把不可见问题变得可见,更加高效地解决问题,会用到PHM、机器学习还有知识挖掘等核心技术。
第三个路径是建立知识的模型,把相关性挖掘出来后,变成知识进行沉淀。沉淀后在赛博空间建立对称管理,通过实体空间中所有装备镜像的模型,实时产生所需的最优决策,用到的核心方法是建模技术(Twin Model)、信息物理系统(CPS)等。
工业智能化案例
下面介绍几个案例,来帮助大家更加清晰地理解工业智能的这三个转型路径或方向是怎样完成的。
第一个案例是通过阿尔斯通的轨道交通智能管理系统解析如何利用数据分析问题发生的过程,并且避免可见问题的发生。阿尔斯通是全球非常先进的轨道交通解决方案供应商,不仅基础设施庞大而且维护费用也高,所以阿尔斯通2006年推出智能管理系統Health Hub,实现从车辆级到基础设施级的智能管理。在感知系统方面通过Train Tracer、Track Tracer、Train Scanner等产品,实现将运行过程当中的实时状态数据传递到HealthHub中进行分析,实时评估关键部件的健康状态,预测未来的风险,并且用预测性的方式进行排程优化。
整个系统运用了典型的CPS技术框架,包括设备中数据的智能连接、实时的数据分析流、云端实现建模过程等,经过大数据分析之后,对这些问题进行预测,最终将决策运用到所有的相关部门中。这套系统支撑起了阿尔斯通向服务型制造的转型。目前阿尔斯通已经有超过35%的收入、50%的利润来源于已经卖出设备的服务型管理。其中的价值在于,车辆卖给使用者之后,通过智能的分析、预测与优化排程,帮助用户节省维护成本,这是生产价值模式的转变。
2010年IMS中心与阿尔斯通进行合作,提供了很多分析模型的核心算法,包括像高铁集群的监控、车辆内部的牵引系统、轴承系统、轨道的转辙器、车载的轨道监测系统等。在模型的底层上,将传统的不可见的问题显性化。
目前,天泽智云也在跟国内某高铁制造商合作,开发基于CPS技术的高铁PHM(预诊断与健康管理)平台,通过对高铁进行大量的实验将关键部件的镜像模型建立出来,包括失效模式和失效的状态,以及过去探测到具有隐性失效特征的算法,等等。
第二个案例是高圣智能带锯机床,通过从数据中挖掘隐性问题的线索,实现对不可见问题的管理。传统的不可见的问题,包括设备衰退、质量过程参数产生偏差等,如何进行预测和管理是我们在制造系统当中最常见的问题。带锯机床通常用来做材料的粗切割,如将块状材料切割成不同的形状。锯带是一个耗材,如果在使用过程当中出现了断裂等问题,会造成质量参数的缺失以及大量成本的增加。
传统的方式是通过有经验的操作工人,在现场用耳朵去听设备的声音,判断当前的锯带是否正常。如果觉得噪音变大,就更换锯带,有时可能把好的锯带换掉,造成成本浪费,也会因没有及时发现问题而造成锯带断裂,如果切削的是极其昂贵的航空材料,这块材料可能就会报废,造成极大的浪费。
后来项目团队把人的经验和生产过程当中的参数固化为模型来预测锯带的状态。通过试验传感器的部署,把知识、故障模式、切割参数等信息集成到模型里,同时运用PHM算法工具,包括信号处理、健康评估、故障预测等,实现了在不同的工况下,通过状态参数进行自动识别,提取不同健康状态下的特征聚类,再运用特征识别等模型方法判断当前的状况。
最终,实现了将锯带从完全健康到镀层磨损,再到内部实际的磨损,最后到断裂的整个过程的建模。把不同时期的模型建立起来,这样就能把过去不可见的问题显性化。这些实时的数据,包括锯带的衰退状态、核心部件的运转模式等,通过模型加以分析,通过手机端或者Web端进行访问,实时决策,优化管理。过去可能一个人管理最多10台机床,现在一个人可以管理更多机床,实现了从人员的使用效率到成本维护的整体优化。这个产品在2014年美国芝加哥国际制造技术展览会(IMTS)上第一次展出,2016年正式商业化,目前已在全球超过一百多家的项目工程上部署了。
第三个案例是通过智慧风场系统解析,如何利用知识建模在赛博空间里产生对实体的管理镜像,实现对不可见问题的避免。风场大多在相对偏远的地方且风机成本昂贵,这对生产管理、健康管理以及运维管理层面带来很大的挑战。对于一台风机,生产管理方面要实现对设备衰退状态的监测,并预测当前的环境;健康管理方面,主要针对风机内部的核心部件的管理;运维管理方面,通过预测的方法实现对设备故障的避免以最大化降低运维成本。
通过研究发现,要把以上的忧虑解决掉,需要三个步骤。
第一步进行状态评估,即了解风机的实时状态,无论是性能的衰退或健康的风险,都要进行精确的量化。
第二步是场景化预测,比如整体维护排程的优化,采用不同的排程规划,会产生不同的生产和维护成本,结果也有所不同,因此需要将所有可能的成本结果都量化出来,从上亿种可能性中搜索最优的一个结果。
第三步是优化和避免,一台风机中可能有上百个维度的参数,运用模式识别的方法可以清晰地识别出正常状态下的风机。当新的数据输入进来时,实时地跟正常模式进行比较,当风机发生逐渐偏离健康的状态时,设备就会产生新的风险。实现这一系统后,对大型的部件如传动链可以做到提前至少30天预测到潜在故障。当了解到设备的故障后,就要对故障进行排除。这涉及维护的问题,要考虑多成本要素的综合建模,包括机会成本、固定成本、动态成本,实现全部建模后,基于建模进行有效预测,比如在某一时刻,将有几十个排程的任务,不同排程组合造成的成本是多少,这可能有上亿种不同的组合途径。
如何在这些途径中搜索最优的结果,我们运用了遗传算法的优化模型求解过程。遗传算法针对于风场排程的问题,实现了多层的优化求解器,比传统的线性规划提升上千倍的效率,比单层的遗传算法提升数十倍的效率。对于一个风场来讲,如果要排程几十个维护任务,可以在一分钟之内找到最優的结果。
目前,这个WindInsight系统是我们与微软Azure合作,实现部署的一个海上风场。风场在实时运行的时候,整个风场的风机运行状态是否有潜在的故障或者风险发生等,都可以在这个系统上进行远程判断。
当某个风机出现潜在故障时,我们可以对它进行最优化的排程。优化排程中考虑的因素包括当前人员使用率、整个风场的风资源情况、风机的发电能力情况、故障衰退情况等,也包括对每台风机进行对标,与整个风场内的其他风机相比发电能力如何?与历史相比,发电能力如何?在对风场管理时,对当前风场未来72小时的风资源进行预测,包括风向和风力的情况。在维护的过程当中,要尽量选择风小的时候进行停机维护,在风大的时候进行发电,如此经过多成本的综合考虑后,产生新的智能优化的模型,对这些模型进行在线评估。这样的过程实现了对风场从设备的管理到生产管理再到维护管理的全栈式解决方案。
关于CPS信息物理系统
以上三个案例的实现,是基于融合边缘计算和云计算的CPS技术架构。CPS这项技术在国外研究的人非常多,2011年,GE第一次提出工业互联网概念的时候,就提到CPS将会是未来的核心技术,而德国的工业4.0也提出CPS的概念。在我国,CPS也是工信部推广的一项重要的技术架构,《信息物理系统白皮书(2017)》将CPS定义为支撑工业和信息化深度融合的一套综合技术体系,对于推进我国工业产业的价值转型与升级具有重大的意义。
在李杰教授的《CPS新一代工业智能》书中,定义了CPS的5C技术体系架构,即Connection智能连接层、Conversion智能分析层、Cyber智能网络层、Cognition智能认知层、Configuration智能配置与执行层。
实现这五层的CPS架构,需要融合DT数据处理技术、AT分析软件技术、PT平台接口技术和OT运营技术,对工业大数据进行连接、挖掘、分析、预测和优化,将工业生产制造当中的知识转换成高价值生产力。