张瑞东
摘 要:工业大数据是大数据与智能制造的交叉点。推动大数据进入工业领域的因素很多。传感器和通信技术的发展降低了数据采集的成本。云计算、GPU等技术逐渐能够满足工业数据实时处理的需求。制造活动的复杂性使得人们的经验判断具有一定的局限性。
关键词:工业大数据;生产管控;智能制造;物联网;
为了推进智能制造中工业大数据的应用,对相关研究进行了综述.从工业大数据的内涵及架构出发,结合工业生产管控需求,从数据动态感知与采集、数据统一存储与建模、数据分析与决策支持几个层次分析了工业大数据的关键技术,介绍了工业大数据在质量管理、故障诊断预测、供应链优化等典型场景中的应用,并综合分析其发展现状,展望未来的应用趋势。
一、工业大数据的优势
1.第一个优势是“不纠结于因果”。本这种提法区别于互联网领域的“是相关,不是因果”,以及工业工程师强调的“必须是因果”。其具体含义是:从大数据中提炼的工业知识,要以因果关系存在为基础;但应用知识时,不必按照科学机理的逻辑去计算。这个逻辑并不奇怪:工业界常用的试验结果符合因果关系,但试验的具体数值却不是按照因果逻辑计算得到的。同样,通过规范数据分析逻辑,可以让工业大数据像“试验数据”一样有用。“不纠结于因果”让知识获取变得简单,也能让知识获取的范畴拓展到“感性知识”和“经验知识”。
2.第二个优势是“样本=全体”。具有这个优势时,当前发生的问题,可以从历史中找到答案,只要找到并模仿过去成功的做法就可以了,而不必建立复杂的模型。故而,大数据背景下,简单的算法可以解决复杂的问题。从应用的角度看,大数据的优势不在“大”,而在“全”。“大”会增加计算机处理的复杂性,而“全”则保证了知识的存在性。
3.第三个优势是“混杂性”。可靠性是工业界追求的一个重要目标。具体到建模过程中,就是对“泛化性”的要求高。数据的“混杂性”强时,可以找到多个角度的印证逻辑,提高分析结果的可靠性,也为“不纠结于因果”提供了条件。当前,做到这一点的前提,是前面提到的数据完整性。由此可见,以上三个优势都体现在知识获取。而这个优势的价值,又进一步体现在对智能化的推动。然而,大数据的这些优势并不是天生存在,而是要人去创造。“世界上没有两片完全一样的叶子”。世界上每个具体问题都是独特的。谈到“样本=全体”时,必然涉及到个性与共性的关系。所以,要借鉴过往的经验,前提是要进行抽象、归纳、总结。但这往往是人类才能做的事情,至少需要人类告诉计算机怎么做。从这个角度讲,大数据的应用也需要人机界面的创新。大数据记录的数据毕竟属于过去,未来可能是不同的。具体应用时,不能过度依赖于“样本=全体”的假设。在可靠度要求较高的场景,业务系统有后备的办法来应对新问题。总之,要发挥大数据的优势,又要避免可能带来的风险。另外,大量工业数据常常来自个别的“工作点”附近。数据量虽然很大,但相似度大、信息含量低而噪聲干扰相对大。要解决这个问题,不仅要综合分析各个工作点的特点,而且还要把生产数据和试验数据结合起来,而不局限于生产数据本身。
二、工业大数据的应用研究
1.生产排程及调度。基于智能感知技术动态监测物料短缺、设备故障、紧急插单等异常事件,利用大数据分析方法预测完工期、刀具剩余寿命等过程参数,发现实际生产与计划的偏差,并考虑工序约束、加工能力约束、物料人员约束、生产成本约束,从生产过程数据中挖掘或筛选调度规则,启用遗传算法等智能优化算法,主动调整生产计划与排程,保证任务的按期交付.某集团的COSMOPlat工业大数据平台利用物联感知、云平台、智能决策等技术,对设备状态、工艺变量、资源使用情况及效率进行在线监测,同时通过对产能、库存的分析预测,给出最佳的生产排程及资源调整方案,有效地优化资源配置,提升生产效率.
2.故障诊断与预测。传统的设备故障诊断与预测,主要通过即时报警,后根据专家经验判断故障类型、定位故障位置,其时效性不高.基于大数据的诊断与预测,将根据传感器获得设备的负载、振动、速度等参数,通过异常检测算法、决策树、滑动窗口频率模式树、机器学习算法等数据挖掘方法,也可结合知识库,对目标系统建立实时准确的诊断和预警.通用电气公司对其飞机发动机生产线上的机器数据、警报数据和维护历史数据进行采集、建模与分析,帮助工厂人员实时了解机器运行状况,并通过压力、温度、电流等参数识别问题位置,同时对可能的设备故障进行预测,自动提供维护建议.某公司构建装备工况大数据平台,接入将近23万台设备(6万台活跃设备),实时监测并可视化显示设备运行情况,应用大数据分析工具对大型机械装备进行故障分析,及时排除故障.
3.质量管理。传统的质量管理基于质量检验、统计过程控制(SPC)、次品率等概念,往往依赖手工测量工具及数理统计分析,受经验影响大,且无法适应日益复杂的生产工艺.而大数据质量管理,一方面通过对重要参数进行分析评估,基于时间序列预测关键指标,探究过程能力指数之间的关联性,能够较全面地掌握产品总体质量性能。另一方面,将数据驱动的质量模式识别模型与知识驱动的专家系统结合起来,形成在线质量诊断系统,快速智能地追溯质量问题。电气为了解决断路器在生产过程中频频返工的问题,集成相关业务数据,利用Spark,ETL,HDFS等大数据工具,以及分类、聚类、趋势预测等分析模型,展开质量问题影响因素分析、追溯分析、质量知识库、质量异常反馈及质量信息可视化等应用,最终使生产线上断路器产品的不良品率降低约10%。数字化工厂绝大多数制造环节由机器自动完成,在基于大数据分析的质量管理及不断的反馈改进下,最终达到100万次加工过程中出现仅12次差错。
4. 供应链分析和优化。RFID电子标识、物联网等技术构建了完整的供应链大数据湖,利用这些数据能够:预测物料供需量,在控制库存的前提下避免缺货;优化供应链网络,包括运输车位置、运输路径、物流中心选址优化等;对某些产品的运输行为进行聚类分析,挖掘潜在的运输风险并提前防范.大数据在供应链领域的应用将极大地提升仓储、配送效率并降低成本。公司开发HANA大数据平台,并利用其在企业信息化方面的优势推出供应链解决方案,在供应链上下游快速预测并传播供需变化,及时发现供需失衡问题,并模拟备选方案;同时对库存、订单等数据进行实时分析,确定原材料、在制品、成品的最佳库存目标,降低供应链运营成本。
三、未来的应用发展趋势
1.工业大数据驱动的全行业整合。工业大数据促进数据资源的融汇贯通,纵向打通各个环节信息链路,横向连接各个行业的跨域数据,形成全方位的数据闭环,完善价值链,整合产业链,实现制造业从要素驱动向创新驱动转型。
2.人工智能在工业大数据中的深化:工业大数据的深度应用离不开深度学习、计算机视觉等人工智能技术,而人工智能的基础又是数据.随着人工智能的进一步深化,智能车间、智能工厂将实现向智慧车间、智慧工厂的飞跃。
总之,大数据技术对于工业企业的转型升级甚至智能制造的实现是不可或缺的;工业大数据的应用还处于初级阶段,架构和方法基本明确,但产业落地难,且相关研究常着眼于点,系统性不够;工业大数据的应用场景及细分行业的覆盖度目前还比较有限,更多类型的行业解决方案亟待被发掘。
参考文献:
[1]郑文生,工业大数据架构与应用.2018.
[2]张新宇,浅谈面向生产管控的工业大数据研究及应用.2019.