文/本刊记者 张斯絮
“机器之眼”,站在大数据时代的下一个风口
文/本刊记者张斯絮
当你做到了无人能及,想淘金还难吗?
最近,“外星人”马云有了一个新昵称“刷脸帝”。今年3月,在德国汉诺威IT博览会开幕式上,他当场从淘宝网上“拍”得一枚1948年的汉诺威纪念邮票作为赠礼。令世界为之惊艳的是,到了付款阶段,他没有采用传统的密码输入认证,而是对着手机摄像头微微一笑,通过“扫脸”完成了支付。
在炫酷的“刷脸付”背后,一家年轻的创业企业——北京旷视科技有限公司浮出水面。三位来自清华的85后计算机“学霸”,经过四年的摸爬滚打发展出近60人的团队,自信已经成长为目前世界最大的人脸识别技术平台,并于2014年9月完成了4700万美元的B轮融资。站在C轮融资的门槛上,旷视科技的市场与品牌部负责人谢忆楠首次披露了公司的战略思维:“刷脸不过是个起点。我们要实现的是看懂世界的机器之眼。”
“我们真讲不出那些含血含泪的故事,只有一群技术咖一步一个脚印地专注和执着”,谢忆楠上来便给记者打了预防针。
他们是三位标准的“极客”——印奇、唐文斌、杨沐,一同出自旨在培养计算机精英的清华大学姚期智实验班。唐文斌,从初中起就参加信息学编程比赛,在各类编程比赛中榜上有名,并担任国家信息学竞赛总教练7年之久;杨沐,曾获国际信息编程奥林匹克比赛金牌;印奇,自大二起就在微软亚洲研究院实习,参与研发的人脸识别引擎后来被广泛应用于X-box和Bing等微软产品中。
2011年,三个小伙伴窝在宿舍里初试身手,研发了国内首款基于iOS的移动体感游戏。在《乌鸦来了》中,玩家通过摇晃头部控制游戏里的稻草人,拦截从天而降偷食庄稼的乌鸦。这款小游戏,让他们在短期内累积了40万用户,一度冲上APPStore排行榜的前5名,赢得了清华大学第三十届“挑战杯”特等奖,也拿到了联想之星提供的几百万元天使投资。最激动人心的,还有投资人的认定与预言:“过不了几年,人脸登陆、人脸搜索都将成为现实,有着广阔的应用场景”。
旷视科技于当年顺理成章地成立,很快即在2012年推出Face++平台,面向不同领域的开发者、企业以及个人提供免费的人脸识别技术服务。事实上,彼时已有Google、Facebook、百度等互联网巨头正在布局人脸识别领域,然而“旷视”打出了一种差异化策略。唐文斌说:“第一,我们要比他们做得好,跑得快;第二,大公司不可能把技术开放,而我们开放。”
在公司的创立阶段,有一位大咖的思想对其影响至深,他是李开复。李开复不仅携创新工场分别在2013年、2014年的两轮融资中给予了“旷视”强有力的支持,而且亲自在这家小企业中担任董事。在他生病前的一年里,每两周都会和团队核心成员见面聊一次,甚至会突然建议开发一个APP,以快速获取用户数据。
李开复强调:“如果有两个客户,一个客户可以给你一年100万元的钱,另一个可以给你一年贡献1000万的数据,那么一定要选择后者。”这句话让印奇至今难忘。他说人脸识别所用到的深度学习算法,是一套模拟人脑的神经网络算法,如果打一个比方,印奇喜欢称之为“婴儿智力的黑盒”,因为“入门容易,精深很难”。深度学习高度依赖于数据,为了持续优化算法,又必须不断给它喂海量数据。
四年来,免费而开放的“好用”模式已经形成巨大的集群效应。如今,Face++平台的图库数量已经超越10亿级,包括阿里、联想、世纪佳缘、美图秀秀等一大批国内外IT企业都在与之合作,移动端几乎所有与人脸识别相关的APP都在享用“旷视”的服务。
“Face++这个云服务平台的调用量已经累计超过了62亿次,证明我们的算法已经经过了62亿次的训练”,谢忆楠介绍,“这足以支撑我们成为世界上最大的人脸识别技术平台。”为什么“旷视科技”能在2014年连续摘得FDDB(人脸检测)、300-W(人脸关键点检测)、LFW(互联网图片人脸识别)三项国际评测的桂冠?这就是重要的秘笈之一。
人人都知道,互联网经济进入一个免费时代。可作为企业,不盈利如何形成造血机制?
2014年以来,这也是旷视科技CEO印奇常常思考的问题。他认为到了相对成熟的阶段,泛泛收集数据已经没有太大意义,只有让技术落地,形成一个又一个可供商业化的产品,才能证明整个公司的模式可以走通。
也许你能想到“旷视”与美图秀秀、美颜相机的合作方式:通过“人脸检测、追踪”快速捕捉到人脸区域,精确定位面部的关键点,包括眉、眼、口、鼻,以及整体轮廓等,从而进行美化处理;
但是你能想到它是如何服务于互联网“红娘”世纪佳缘的吗?如果你有中意的人脸照片,那么通过“大规模人脸搜索”,Face++便能从海量的数据库中发现匹配度最高、相貌最相似的那个TA;
估计你更想不出一个传统的餐饮企业——海底捞火锅是如何用到Face++的!谢忆楠告诉记者,其实在“刷脸付”之前,“旷视”早有一款落地产品投入商用。它是一个可以进行动态人脸识别的“智能迎宾机器人”。放在公司门口,它可能是一个操控门的智能门禁;放在会场,它可能是一套嘉宾签到系统……而对于“海底捞”,它是一套VIP识别服务。不需要出示身份,还没等贵宾进门,系统已经通过“1:1人脸验证”把他的姓名推送到了前台。
而当互联网金融的大潮涌来,“旷视”看到了更大的市场前景。几乎所有的银行、金融以及交通业务都要实现“实名制”线上面签。那么如何证明“你是你”,“你妈是你妈”这样看似荒谬而又客观存在的问题?最靠谱的验证渠道就是生物特征,而在中国,你的身份证上只有一种生物信息——人脸。“旷视”能够帮助企业做到的是:只要用户面对电脑或手机的前置摄像头,根据页面指令做出几个简单动作,例如摇摇头、眨眨眼,动动嘴巴,数据便被发送到云端后与公安部的备份照片进行比对。也许就是坐在家中的短短几分钟,银行开户这件麻烦事就能轻松搞掂了!
至于免费和商业是否矛盾,印奇认为,对于用户“旷视”将继续保持免费模式,而对于企业,只有提供定向化的商业产品,才有可能进一步获取垂直领域更有价值的数据。也只有试过才知道,其实“商用”和“数据”一定是一对相辅相成的作用力。
这应该是几种不难想象的模式:
通过北京二环路上的一部摄像头,解析每天过桥的车流量有多少,哪些时段最容易发生拥堵,哪些时段又发生了碰撞,碰撞的车辆分别是什么颜色、什么品牌的;通过一段比赛的视频,分析每支球队的得分情况、违规次数,以及球员的临场表现;通过一张海边的照片,来计算当地的湿度,每天太阳升起的时间和高度角,作为气象学判断的依据……
“很多人都以为我们只是做人脸识别的”,谢忆楠笑笑。其实一直以来,“旷视”都有一个更宏伟的目标——“重新定义图片和视频的价值”。
如果两年前大家还习惯于把互联网生态称之为“信息时代”,那么当下更恰当的说法应该是“数据时代”。可是数据从何而来?除了电子交易的方式,“旷视”希望用一种算法的革命让所有的摄像头都成为数据采集的来源。
那么,如何实现看懂世界的“机器之眼”?一方面,“旷视”要去做摄像头等硬件设备的更新换代;另一方面,去研究如何提取图片和视频中的可用信息,这是“旷视”的另一个平台Image++目前正在做的事:从文字、车辆、行人、场景等入手,按照物品信息价值的优先级,一步一步去强化机器识别“万物”的能力。
从刷“脸”,到刷“万物”,这就是“旷视”面向C轮融资的战略规划。不会玩噱头,也没必要搞小动作,一切都将是水到渠成的事。当记者问及“会不会预想到一些困难”的时候,被谢忆楠反问:“当你做到了无人能及,想淘金还难吗?”