图片智能分类谷歌AI新模型ACE解密

2019-03-25 04:07技术宅
电脑爱好者 2019年24期
关键词:警车跑车分类

技术宅

图片智能分类并不是简单的事

电脑中保存的图片多了以后,为了方便后续的查找和管理,我们经常需要对图片进行分类。如果只是简单地根据图片类型、尺寸或者Exif版本等数字化元素进行分类,那么借助资源管理器的“分组依据”就可以非常快速地完成(图1)。

不过在实际的使用中,上述简单的分类并不能满足我们的需求,因为很多图片的分类是根据人类的感觉、掌握的知识,甚至情绪等进行划分的。比如下图中需要将跑车归为一类,因为我们知道跑车的底盘都较低、外观采用扁平设计、很多采用敞篷这些知识,通过人工是很容易区分的,但是机器并不掌握这些知识,这个简单归类就会让机器识别有难度(图2)。

看一眼就能挑出重点——ACE模型解读

如上所述,如果AI需要实现对于某一类图片的精准识别, 它就需要像我们人类那样进行学习。

首先AI需要设定模型,然后根据这个模型通过大量图片的深度学习来掌握人类的判断能力,这样才能通过识别照片上的某些属性进行分类。要让机器识别上述跑车图片,那么可以根据一定的模型先准备图片数据集,数据集中会标注每张图片的标签、特征值和分类,比如将底盘高度作为特征值,并将这个数据量化。假设跑车底盘高度被设定为5,那么以后AI只要在图片中发现汽车符合“5”的标准就将其归类到“跑车”组,从而实现对“跑车”图片的识别(图3)。

不过这种传统机器模型有很大的局限性,它们大多是基于每个样本单特征进行学习(比如上述底盘高度),但是在实际应用中这种单特征的学习还是无法应对更为复杂的图片识别。因为在机器学习中如何系统性地总结和解释每个样本的特征重要性得分很有难度,比如在上述跑车判断中,就涉及到了外观扁平设计、底盘高度、敞篷等特征,到底哪个特征更重要?

当然这样的问题如果交给人类判定就没有什么难度,因为这些特征都可以通过我们的直觉获得。在上述照片组中,人眼仅仅依靠汽车外观是否扁平化设计就可以轻松区别出是否为跑车。为此谷歌提出ACE模型来解决这个问题,通过ACE模型的训练后可以让AI拥有类似人的直觉功能,因此分辨类似上述照片就没有难度了。那么ACE是怎么训练机器,从而让AI拥有这样的功能?

ACE首先是分割类别图像,为了方便对图片识别,它将图片按照多个分辨率进行分割。在谷歌的一个示例中,它将多张包含警车的图片按照车辆的轮胎、警车上的执法徽标、警车上的小车窗进行分割(图5)

接着将相似的分割归为同一个概念,借助这些相似的分割图片训练出当前最优卷积神经网络,从而找出识别这些图片的最优策略,最后通过这些策略的训练,实现对这类图片的精准识别。在上述警车例子中,经过ACE模型训练后,对于警车的图像分类器来说,借助车辆上的执法徽标就可以很好地识别这类图片。这种能力就像是人类的直觉一样,只要AI“瞄一眼”这些图片,通过车上醒目的标记就可以知道这些是警车(图6)。

当然在实际训练中,ACE会根据不同图像的性质选择最佳的识别属性。在另一个例子里,对于预测篮球图像的分类器,ACE是通过分割出来的篮球球员的球衣来进行分类(而不是通过篮球本身,因为篮球的颜色容易和背景颜色混淆,不利于识别)。这样借助这种更为科学的模型,ACE可以拥有类似人类的直觉能力,从而可以更高效地实现对图片的智能识别。

小知识

什么是ACE模型

ACE是Automated Concept-basedExplanation(基于概念的自动解释)的简称,它的核心是“自动解释”能力,这种能力是基于识别高级概念的方法获取。ACE在提取概念并确定每个概念的重要性之前,会将一个训练过的分类器和一个类别的一组图像作为输入,并将片段图像的类似片段作为相同概念进行分组。ACE就像是人类的直觉一样,可以快速实现对图片显著特征的识别(图4)。

让更智能的AI为我們服务

如上所述,通过AC E模型训练,我们可以让AI拥有更加智能的能力。显然这些高智商的AI能够为我们的生活带来更多的乐趣,因为这样的AI就像拥有人类的眼睛和大脑一样,对于海量的照片,它只要看一下就可以立刻做出判断。

ACE的这种识别能力可以在生活中得到大量的应用,比如很多朋友喜欢在朋友圈晒自己的照片,现在可以使用ACE将最值得发朋友圈的照片筛选出来(比如找到美颜效果最理想的,最容易突出自己身体特征的照片),这样就可以将自己最美好的一面展示给朋友。我们期待类似ACE模型越来越强大,让更智能的AI为我们提供更多的贴心服务。

猜你喜欢
警车跑车分类
警车
分类算一算
分类讨论求坐标
数据分析中的分类讨论
超酷的敞篷跑车
2015款捷豹F型V8S敞篷跑车
车臣女“人弹”袭击警车