石菲
要问现在最火的技术是什么?肯定是人工智能!
作为“智能+”时代的新动能,人工智能正在对我们的未来产生影响。
IBM云与认知软件高级副总裁Arvind Kirshna在2019美国Think大会上曾这样表示,“如今人工智能就像‘电一样存在,并且在彻底改变商业社会。”
植物生长需要养分,汽车奔跑需要动力,未来商业社会最重要的能源就是人工智能。纵然人工智能已经成为新时代的“必需品”,但企业要应用好人工智能绝非易事,换句话说,人工智能不是你想上,想上就能上。
还记得董明珠在宁波“闯红灯”被抓吗?其实是在过马路时由于公交广告上董小姐的“大头照”太过明显,被闯红灯人脸识别系统捕捉到,误以为是真人。如果说这个乌龙属于规则制定的不完善,如果数据出了问题则会直接导致人工智能应用的失败。
2018年世界杯期间有研究机构试图用人工智能预测比赛结果,但大多数预测结果都是完全错误的,原因只有一个:“无论你的模型有多好,它们都只是和你的数据一样好……最近的足球数据还不足以预测世界杯的表现。”
数据是人工智能的基础,没有足够高质量的数据,人工智能就会产生偏差。
那么,应该怎么做才能获得人工智能所需要的高质量数据呢?
目前全世界最快的计算机是Summit和Sierra,由于其上运行着大量数据分析和人工智能应用,Summit和Sierra采取了和之前不同的整体存储架构,不仅可以达到每秒2.5TB的带宽,每秒钟还可以在一个目录里创造5万个小文件。正是基于高可用的存储平台,才能够支撑全球最庞大的人工智能系统顺利运行。
这背后的秘密武器就是能够快速、高效提供人工智能所需要数据的信息架构。
简单地说,在人工智能应用需求逐步增大和日益复杂的多云环境下,企业需要通过一个统一、高效的平台实现对数据的高效利用。
有数据显示,尽管83% 的企业将 AI 视为战略机会。但大部分企业领导者并不了解 AI 究竟需要什么样的数据。即便他们了解AI所需要的数据,仍然有80% 的数据无法访问、不可信或者无法分析。
所以企业需要一种具备合理结构的全面方法为人工智能应用打好基础。简而言之,要想高效应用人工智能,必须要有一个高效的信息架构。
近期,IBM总结并提出了人工智能阶梯概念,帮助企业实现数据资产的现代化,加速人工智能之旅。具体来说,人工智能阶梯是一种整合方法,可以帮助企业借助规范性方式加速人工智能的应用。
人工智能阶梯分为四个部分。
第一阶段收集数据。用于奠定稳固的数据基础,确保数据简单、可用。
第二阶段组织数据。创建一个能够为人工智能提供可靠数据且随时可用的业务分析基础。
第三阶段分析数据。确保人工智能可以随时使用数据,并为高级分析应用和建立人工智能模型做好准备。
最后一个阶段是融合数据。在经历过前三个阶段后,企业已经具备了利用人工智能模型实现更高商业价值的基础,这时候就可以将 AI 融合到企业的整个业务运营当中。
下面,我们就来具体看看这四个阶段分别应该如何操作。
首先,企业应该如何收集数据?
数据分布在企业运营的方方面面,快速、灵活地收集不同类型、不同位置、不同数据源的数据可不是一件简单的事情。
有一家太阳能面板制造企业,当产品生产出来后,会对每件产品拍摄一张照片,一方面可以对产品质量进行定级,另一方面为了方便以后进行质量追溯。由于生产制造环节遍布在全球十几间工厂,加上产品的生命周期较长,这些数据需要存储数十年甚至更长时间,数据的存储成为难题。IBM为这家企业搭建了全球共享的数据资源池,并且用软件定义存储的方式将每一间工厂超过一定保留时间的数据自动存放在磁带中,邮寄到总部,存入带库。不管数据源来自哪里,全球所有工厂都可以用同样的方式进行访问。在打好数据收集基础之后,这家企业下一步计划用图像识别的方法对产品自动进行分级评定。
做好数据收集,让数据变得简单并易于访问之后,下一步是组织数据。
许多企业其实低估了不良数据可能带来的潜在风险。如果企业无法确保数据的可信性、完善性和一致性,他们就无法确信自己能够实现数据的全部价值。更令人担忧的是,如果一家企业并不知道自己掌握了哪些数据,也不知道如何使用數据,那么,这家企业可能因违规而面临监管方面的挑战。所以,组织数据就是要求企业对所有数据进行梳理,构建一个可信的、面向业务的数据基础。
经历了收集数据、组织数据,数据已经变得可以信任并易于访问,可以随时用于业务分析,企业的人工智能之旅就可以进入下一阶段,让数据产生价值。
通过分析数据可以为企业提供快速扩展的洞察力。比如某大型国际机场就利用AI视觉深度学习技术提高了安全性和管理效率,同时改善了客户体验。当发现无人行李或者尾随人员时可及时作出反应,还可以进行人流分析,及时发现排队情况并进行疏导,智能商圈管理还可以让机场的商业设施更加符合旅客的需求。
最近IBM宣布与小罐茶合作的AI自动除杂生产线也是分析数据的典型案例,小罐茶是近两年迅速崛起的现代茶叶品牌,对茶叶品质有着严格标准,除了在原料上精挑细选之外,对加工环节也有着苛刻的要求。在依托认知视觉检测的生产线上,可以实现整箱毛茶自动开箱,将茶叶倒入暂存斗,经输送带震动整理传输,进入视觉监测区域,由摄像头拍照并传送到后台进行视觉分析,定位各类杂质所在位置,然后控制机械臂将杂质挑拣并分离开来,达到标准后转入收集和计量称重环节。整个过程模拟了人工筛茶、铺茶和挑拣的过程,但比人更加精确可控,而且效率更高。保守估计,一条这样的生产线每天可以完成200公斤毛茶的筛拣除杂工作,相当于50-60个挑茶工的工作量。
以上三个阶段都完成后,下一步就进入了将人工智能融入企业运营,实现更高商业价值的融合阶段。
由于企业想要将人工智能试点和概念验证转化为更大规模的生产,所以,他们会遇到一个障碍——如何信赖人工智能驱动的应用。
比如大家都知道的今日头条,会根据你的阅读历史进行内容推送。但很多人发现这种根据初始阅读习惯进行的推送容易固化,容易让你被定性为只喜欢某一类别,使你接触不到其他信息,这就是数据产生了偏差,是人工智能模型普遍存在的一种可能性。
随着人工智能被融入更多业务之中,这种情况会变得尤为明显。这时我们就需要在保证数据可解释、可信赖的前提下在企业中融入可信赖、可理解的 AI 驱动型流程。也就是说,和之前组织数据阶段的可信不同,融合数据阶段的重点是保证数据模型的公正。
为此,企业需要可以查看到模型提供建议的方式和原因,能够跟踪模型构建所用的系列数据和训练,通过融合建立信任和透明度,并且可以将模型集成到工作流和流程自动化平台之中,从而帮助企业更快地实现人工智能运营化。
通过人工智能阶梯的四个阶段,企业就可以实现数据资产的现代化,成功打造一个灵活、统一、高效且规范的信息架构,为企业利用人工智能进一步实现商业价值奠定坚实的基础。
最后还要注意的是,未来的商业环境越来越复杂,拥有一个开放且统一的整合架构无疑会帮助企业加快人工智能发挥价值的速度。IBM Cloud Private for Data 可以为企业提供一个完全统一且可控的整合式平臺,是一种开放、可扩展的基础,能够将人工智能阶梯上的所有功能整合到一个混合型多云环境中。在IBM Cloud Private for Data数据平台中,开放源码和现代云架构已然合为一体,可以说这是一种用于人工智能的云原生信息架构。这种架构能够充分实现数据容器化、部署微服务架构,还能提供完全可控的自动化整合技术和工作流。