王燕
近日外媒披露了谷歌计算机视觉专家Tobias Weyand领导研发的一个技术项目Google Photos,据称使用该技术后电脑只要“一眼”就能辨别出照片拍摄地点。Google Photos技术它是怎样实现照片定位的呢?
添加地理标记——常见照片定位方法
对于照片的定位,如果照片里的景物是知名景点或地标性建筑,那么我们通过特殊景物标记就可以一目了然获知。对于普通地点的照片定位,大家一般是通过在照片中添加地理标记的方法进行标示。比如现在很多Andorid手机在拍照的时候,激活相机后进入拍摄菜单就会有“地理位置”功能,我们只需在拍摄前开启这个功能即可(图1)。
这样拍摄的照片就会自动添加上当地的地理位置信息了,当我们在电脑上查看这些照片时,切换到“详细信息”,在其中的GPS项目下就可以看到照片拍摄的实际地理位置,这里使用GPS经纬度进行标记,当然还可以使用手机基站、Wi-Fi等进行标记(图2)。
当然数码相机等也有类似的定位功能,这样通过在照片Exif信息中添加地理标记,我们就可以很轻松地为照片进行定位。不过在实际拍摄或者网上经过处理的很多照片并没有地理信息,那么对于这些照片的定位,谷歌的Google Photos技术又是怎么进行定位的呢?
一眼看透位置的背后——Google Photos定位识别解密
通过上述介绍我们知道,传统照片定位技术是通过在拍摄设备中记录地理位置信息,然后将其写入照片的Exif中实现的,定位的关键是通过设备预先记录地理位置信息。实际上Google Photos技术定位原理也与之类似,只不过它借助的不是拍摄设备记录地理位置信息,而是时下流行的大数据+人工智能技术。
首先谷歌工程师们挑选了一些常见照片的拍摄地点,如全世界一些人口密集或者摄影师喜爱的热门地区,然后将这些地区分解成26000个大小不一的方块,并为这些方块添加不同标记。比如可以将方块1对应到埃菲尔铁塔,这样生成包含常见拍摄地点的数字化数据,并将其保存在谷歌服务器中,每个方块就对应某一个具体的地理位置信息(图3)。
其次谷歌工程师从网上搜集了1.26亿张包含GPS信息的图片资源,然后利用人工智能技术,将照片分解成像素级别。接着将包含像素级别的数据录入到机器学习的算法当中,让计算机去认识、学习不同地方图片的特征。通过大数据学习和积累,谷歌图片识别服务器就可以保存海量图片信息和图片对应的GPS位置信息(图4)。
除此之外,谷歌服务器还会通过模拟人类大脑的工作方法去学习关于照片的更多内容。如我们要肉眼判断一张照片是在哪里拍摄时,人的大脑可以根据照片背景,然后结合自己掌握的知识去进行判断和推理。假设照片上某种动植物如袋鼠是澳大利亚的特有动物,照片上的建筑是欧式风格,通过这些信息并结合我们掌握的知识去进行定位。谷歌服务器人工智能模拟了这个推理的过程,当然计算机的存储和学习能力要比人脑高得多,Google Photos再借助谷歌街景视图、谷歌地图、Flickr里面的照片等就可以存储海量照片信息数据。
这样当用户需要使用Google Photos技术去定位一张图片位置时,只要将图片上传到谷歌服务器中即可。当服务器接收到需要定位的图片时,它首先会将图片分解成像素级别,然后将这些信息和数据库中的信息进行比对,通过一定的算法判断出照片所在的大概区域,如某个国家的某个景区等。接着再根据数据库中保存的GPS地理信息进一步判断,如照片特征符合某个经纬度信息就为其匹配对应的地理位置,这样通过实际经纬度信息就可以对照片进行精确定位了(图5)。
据介绍,谷歌工程师通过Google Photos技术进行了约230万张图片的试验,虽然目前精确度并不是很高,其中对“国家”的准确率为28.4%,“大洲”的准确率为48%,但是已经比人眼分辨要高得多。目前Google Photos技术定位结果仍然不够准确,但是随着Google Photos技术学习和积累的照片越来越多,借助大数据和高效的算法,Google Photos技术一定会拥有越来越精确的识别能力。
谷歌识图 方便你我
由于网上大量的照片都没有包含地理位置信息,而在日常生活中我们又经常需要对照片进行定位。很多网友经常会晒图说某地方很好玩但是又没有说明具体地址,某驴友在某地拍了很多自拍照但是之后出现了险情,诸如此类的情形。以后我们只要借助Google Photos就可以轻松识别出照片的实际地址,无论是自己以后去查找具体景区还是定位救援都非常方便。
不过任何技术都是一把双刃剑,很多时候出于隐私保护,我们并不想在照片上泄露自己的位置信息。但是Google Photos技术无需Exif里的GPS信息就可以实现照片定位,这显然容易导致个人隐私的泄露。大家可别小瞧谷歌的Google Photos技术,即使你是在一条小胡同口自拍,它的街景照片也可以精确将其识别出来。因此我们在享受Google Photos技术带来便利的同时也要注意隐私的保护(图6)。