崔宏禹
随着智能设备的发展,预计在2020年,全球的物联网设备所产生的数据将达到20B。那么这些设备所产生的数据应当如何处理?这是一个非常棘手的问题。
微软的世界观将我们的智能云平台的某些能力,延伸到边缘设备中,形成我们所倡导的智能云业务。因为如果将所有数据处理都放到云端,那么云端的计算将无法承受。所以我们尽可能将云端的计算能力与人工智能迁移到边缘。
我们将这一观点分为三个层面:第一,AI开发者。针对AI开发者我们运用的方法非常简单,只需要开发者运用人工智能和数据背后的能力即可。第二,AI数据科学家。目前每个企业都存储了大量数据,而数据科学家掌握数据算法,所以我们将数据科学家所掌握的算法,运用到我们的数据中。第三,AI公司。目前,运用深度学习技术的成本较高,所以我们建立了基于数据的开源平台,来深入到某些特定的行业中,来解决成本问题。
如何打造云计算的智能平台?我们将其分为三个阶段:第一,认知;第二,开放的机器学习与深度学习平台;第三,边缘计算。
在第一个部分,我们把与认知相关的服务开放出来,包括人脸识别、情绪识别、年龄识别等,我们在三年前就已经将认知服务开放出来并形成认知图谱,如今该图谱已积累了100万个使用者。
如果有些服务无法满足用户需求,那么客户可以自行制定机器所需要学习的场景,包括图片、视频、语音、CV等。此外,该图谱的所有能力,都可以部署到公有云与私有云平台,以及移动和物联网设备中。
什么是对话式人工智能?当语音数据产生时,我们可能会利用知识图谱或者人机对话以及工具等方式将其展现。
为什么我们会强调对话式人工智能服务?因为我们想赋予机器与人交流的能力。怎么样构建简单的对话式人工智能服务?我们在两年前开发了Bot Services,目前全球有30万开发者在使用该项技术。
Bot Services具备规划、部署和体验以及端到端的能力。现今要打造机器人客服,可直接使用知识图谱和人机交互技术,便可以迅速构建。
介绍一下我们的Azure平臺,微软如何构建机器学习和深度学习?
第一,最佳数据资产。目前,微软已经将自己用来进行机器训练的数据,全部贡献出来与大家共享,用户可以直接将这些数据下载后加以利用。
第二,我们提供大量的工具链。人们在运用机器学习时,需要分析数据背后的规律,而寻找数据规律最重要的环节就是算法,算法的编写十分困难,而且开发该项技术的人工成本也相对较高,所以我们就要降低人工使用机器学习算法的难度。
我们的平台是一个开放的平台,所以解决这一问题我们运用了托拉拽的方式来实现机器学习,包括参数调整、算法选择和训练集与教练集的分类等。
第三,最优算法。什么是最优算法?因为在大多数机器学习算法中,在开源的算法社区里,总会找到适合的场景算法。而在我们的平台中,微软的工程师已经将业界最优的算法放置在平台中,用户可以自行选择是否使用该算法。通过拖拉拽的方式实现机器学习过程后,便可以实现分布式部署,最终形成规律和算法。
为什么我们要在开源中开放数据?微软已经将业界最新型的深度学习算法整合到我们的平台中,并建立了开放的人工智能模型,可提高微软云计算平台的计算能力。
通过计算,用户可以将算法部署到任何想部署的环节当中。同时我们也提供高效的算力平台,该平台可以解决GPU的硬件设备算法和GPU的调度问题,并提供完整的端到端的解决方案。
我说过不能将所有工作放到平台的后端,因为大量数据处理需要在后端完成,在数据处理后就需要将它们迁移到前移的边缘设备中。微软有一个IoT Hub平台,在这个系统中所有操作系统的传感器全部是开源的。该系统可以通过我们最典型的安全协议,每秒可向云端上传1000万的数据量。
目前有很多汽车企业与共享单车企业,都在利用IoT Hub快速收集数据的能力。比如当一辆共享单车要解锁时,如果没有网络,用户的解锁请求就无法传递到后端。但当我们把云端的处理能力迁移到设备端时,共享单车就可以不需要网络进行解锁。
IoT Hub也是一个开源的平台,用户可以把程序运行放入在设备端,并在后台进行训练。无论是人脸识别模型、声音识别模型,还是设备开关的处理能力,都可以在这个平台中进行使用。
从最简单的AI能力,一直到机器学习和深度学习平台以及边缘设备上的智能能力,就形成了微软的云平台,与此同时,微软也希望与更多的合作伙伴进行合作,共同扩展云与人工智能的能力。
(根据演讲内容整理,未经本人审核)