李琼
在过去几年中,美林一直为大型工业企业提供数据应用的管理、分析和相关的技术服务,主要涉及电力和军工装备制造等。我们怎样为客户提供服务?首先我们要明确一个目标,要解决什么问题,是解决产品的品质,或是某个场景的业务预测,还是精准营销等,最终决定采集什么样的数据。当我们开始进行定向数据采集时,如果发现数据不够,则需要增加其他的数据采集手段来完善数据。虽然我们一直在强调数据分析,根据我們自己的实操经验来看,在数据采集方面会消耗大量的时间,这也是客观存在的现实。
所以我们会选择使用存储管理计算平台,由于我们主要服务的是大型工业企业,这些企业在处理数据时所采用的是私有云方式,但是现在这种状况正在逐渐改变。我认为改变的原因是技术的成熟,另外则是大家理念和观念的转变,现在有越来越多的客户,会要求我们把部分应用部署在公有云。然后通过算法和分析技术的选择,将数据应用不断进行修正、迭代和完善。
应用场景数据样本和算法模型,是数据应用过程的核心之一。虽然美林擅长数据分析,但我个人认为,一个成熟的数据应用项目,应用场景和数据样本起到关键作用。在传统的大数据应用模式下,我们所面向企业级的服务是以项目的方式呈现,软件与数据模型应用成耦合关系,如果换一个应用场景,可能会导致重复性工作,这就会给数据应用的开放性和扩展性带来问题。
过去我们基本上给客户提供的是产品种类,这就需要耗费大量的时间帮客户打造数据基础,包括数据治理,主数据、数据仓库等。在中间环节我们会强调数据分析,无论是BI类的统计分析,还是AI类的挖掘分析,都是为上层数据应用在特定的工业场景下提供支撑。
工业互联网平台这一概念成为当下热点,美林该如何发展工业互联网平台?我们认为在工业互联网平台的建设初期,我们应强调对于设备数据、机器数据的采集,同时我们会搭建一个工程数据中心,来区别以往从各项工业管理软件系统当中采集到的数据,如果将管理数据和机器类数据放在一起,我们认为会构成更加广义、全面和完善的工业大数据基础。
在改善传统的信息化方面,在产品研发、制造和交付创新的能力需要提升外,工业互联网平台更加看重外部的增值服务,当然无论是对内还是对外,我们最终的核心还是促进主营业务的快速健康发展。工业互联网平台的功能架构可分为:
第一层边缘层。主要强调的是连接,无论是设备数据、产品数据、业务系统数据还是人的数据形成数据汇集。第二层是平台。我们希望通过一个平台来营造开发环境,为更多的平台拥有者和第三方开发人员,以及服务商提供灵活、开放、便捷的开发工具。我认为在工业互联网平台架构下,不同的企业所提供的能力也不尽相同。包括数据采集、数据安全等部分,应当按照平台的需要进行。
现今云计算云服务商的能力在不断提高,IaaS和PaaS级服务,都应该由云服务商提供。那么美林为工业互联网PaaS层提供哪些能力?我们积累了以前为企业提供单点项目的经验和能力,第一我们开发了一款名为Tempo Data的软件,这款软件包含了数据管理、数据编码、数据清洗、数据监控等,能够为企业和平台打造数据资产地图。同时我们开发了一款新型的数据资产图谱平台,来完成数据资源管理工作。该平台更强调逆向数据治理,在进行传统的数据治理时,我们需要定义数据标准,然后进行编码和定义规则,以人工干预的方式来完成数据治理工作。当这项工作运行一段时间后,数据就会出现互通互联等问题,可以通过逆向工程的方式,从历史数据当中去发现数据存储的结构关系,最终解决业务与数据之间的关联。当不同业务系统中的数据发生变化时,该平台可以自动发现原因,并提醒数据管理人员进行相应操作。
在数据分析方面,我们的Tempo AI平台更强调数据挖掘能力。我们可以利用简单的模型,就可以建立挖掘算法建模,同时该平台已经集成了较丰富的算法和模型。此外该平台还具备智能算法的选择,以及全面洞察分析的能力,来帮助模型和算法的搭建。
当然如果为工业互联网平台PaaS层提供工序,那么Tempo AI也具备开放的可拓展能力,让平台的使用者来定义自己所需的算法节点。当完成AI分析以后,我们打造BI部分与市场中的工序十分相似。都是依靠个性化拖拽方式,使用户自定义图形组建。所以无论是在数据资源管理方面,还是数据分析应用的工具软件,我们都可以为工业互联网平台的PaaS层,提供工具和可扩展的开放能力。
我们认为工业互联网平台的应用还处于发展的初级阶段,而工业互联网平台的未来,则需要设备物联和系统互联全面打通。所以我们将会持续加强工具和能力方面的投入,在数据管理和分析应用方面为工业互联网平台赋能,也会针对特定的细分行业和工业场景开发工业App。
(根据演讲内容整理,未经本人审核)