文/廖陆春
亚马逊自创立以来,在全球有多个运营中心,在这些运营中心中,技术无所不在。
每年,亚马逊AWS在全球有35场技术峰会,大中华区作为亚马逊AWS全球布局里面的重要一环,共举办了5场技术峰会。北京,是亚马逊AWS大中华区最大的一个会场。今年的亚马逊AWS技术峰会2018北京站,为客户带来了很多亚马逊AWS在大数据、人工智能、机器学习等先进技术方面的新消息和发展方向。
亚马逊公司自创立以来,在全球有多个运营中心,在这些运营中心中,技术无所不在。亚马逊在这些运营中心中使用自动机器人系统,机器人随机地分布在大型运营中心的各个角落里,它们会自动去分拣货物,当它们拣出一个货物之后,会选择路径交到人工手里,由人工贴上具体的标签。亚马逊从2003年开始使用这一技术。“我们为什么要去开发这种技术呢?因为,在亚马逊内部,我们有一个信条,我们一定要花精力做好那些对于客户来说永远不会变的事情。从包裹的递送来说,我们相信,没有一个客户希望以更慢的速度、更低的准确率、更高的价格获得自己的货物。”亚马逊AWS全球技术与开发者布道师团队负责人Ian Massingham谈道。
对客户而言,物流领域的人工智能和机器学习的应用,体验不明显。相对于物流领域,客户对产品推荐有更深刻的体会。比如,当你搜索一本书,亚马逊会根据这本书的信息在网页下面出现一个方块,方块里会列出购买这本书的客户同时也购买了哪些书籍。并且,这样的产品推荐会以不同的形式展现出来,比如,你登录到亚马逊网站的主页时,通常在页面上会根据你的购买历史记录,推荐你很有可能购买的产品。
为了达到产品推荐的准确性,亚马逊解决了一个非常庞大的数据问题。在美国亚马逊的网站上,有两亿种不同的产品在销售,每个产品还有自己的库存数量。倘若亚马逊以Excel电子表格的形式展现这样一个庞大的数据,从表格的左边到右边,左边的第一列是美国亚马逊网站上的客户ID号,接下来的两亿列,每一列代表一种产品,表格纵横交错,得出来的非零的整数,就是客户购买这个产品的概率。Ian Massingham说:“可以想像,这样一个庞大的电子表格,它的数字排列是非常稀疏的,因为大部分电子表格中的这些单元格应该都是空的,也就是说其实没有交集,所以,我们就专门开发了一个算法,来计算行和列交叉的单元格里出现一个实际数字的可能性。通过使用这种算法,可以做推理,我们根据与你有类似消费习惯的客户的历史数据,来计算出你可能购买某一个产品的概率,这实际是一种预测性算法。”这样的算法非常强大,对客户来说非常有价值。亚马逊的一个大客户Netflix说:“自己有75%的视频流量,是通过这样的推荐引擎来达成的。”
亚马逊近年发布了一款新产品AWS DeepLens,这款产品不是服务产品,它是一个设备。“我们为什么要发布这款硬件产品呢?目的是能够把这些技术,介绍给那些可能以前没有做过深度学习或者IoT物联网的人员,让他们以更加简单的方式来理解这些概念。”Ian Massingham坦言。
DeepLens是亚马逊和英特尔公司联合开发的,它是一款可编程的智能摄像头,上面加载了GPU以及CPU,可以通过培训深度学习的神经网络,进行实时的视频分析。在DeepLens里,亚马逊提供了12个样板项目,可以让开发人员直接通过DeepLens部署服务。
据了解,通过DeepLens可以进行艺术风格的适配。适配时,先把一个艺术作品放在DeepLens的前面,待它识别后,你用DeepLens指向任何一个照片,它会把第一张图形的风格适配到第二张照片上。亚马逊已经对DeepLens预制了30种不同的对象识别模式,所以,对于开发人员来说,只要你对它做一些注释,就可以开发自己想开发的一些对象识别。
为什么有这么多开发人员以及客户选择在亚马逊平台之上来运行他们的深度学习和机器学习呢?原因如下:第一,亚马逊这个平台上已经有了大量数据,全球有很多客户与亚马逊分享数据。第二,亚马逊的机器学习和深度学习服务,可以和AWS其他云服务进行结合。第三,亚马逊已经把ML和AI的技术打包成服务,即使你不是专家,也可以轻松去使用。第四,亚马逊支持不同的使用场景,开发人员可以针对不同的使用场景选择不同的机器学习的框架和工具。第五,亚马逊有广泛的客户基础,有非常多元化的客户和使用场景。
亚马逊为了在中国加快推广云计算服务,2017年7月,光环新网正式落地;2017年12月,西云数据在宁夏开始启动。为了服务更多政企客户,亚马逊必须让他们知道亚马逊提供的服务是合法合规的,让他们可以很放心地把他们的一些应用、管理流程放到AWS公有云上。“针对中国的两个区域,我们加快推出了一些新的功能,一共有16个主要功能,大大小小的服务有150多个,并且,我们在服务功能上会进一步加快推广。”亚马逊AWS全球副总裁、大中华区执行董事容永康说。
2018年7月,亚马逊在宁夏方面的EC2部分已经可以支持三个AC可用区,所以,亚马逊企业客户的应用就可以可靠地在三个AC上面运行,可以达到非常高的可用性。紧接着,亚马逊于2018年8月在宁夏推出了Amazon Aurora,Aurora不仅可以作为一个全管理的数据库的服务,也可以协助亚马逊的企业客户把他们原来的商业数据库迁移到Aurora上。Aurora还推出了数据库迁移服务,可以加快客户从传统的数据库里面快速地迁移到Aurora平台上,希望可以协助客户加快上云的步伐。
特别是对于喜欢用传统数据库的客户来说,Aurora是一个非常好的服务。因为,Aurora相对于其他市场上面的一些商业的数据库来说,成本是他们的1/10,功能、速度最少可以提高5倍。在这种情况下,Aurora希望可以提供一个可用性高、成本低的服务。容永康分享说:“使用Aurora后,客户的管理水平也可以提高很多,我们希望客户可以把过去花在运维、运营、开发数据库等上面的经费,省下来做更多的其他创新。”