林海
苹果收购Lattice意在其“暗数据”技术,而暗数据对于苹果AI、智能音响的发展意义非凡。
刚刚宣布为美国玻璃制造巨头康宁投资2亿美元的苹果近期又有了新动作。据外媒报道,苹果再度斥资2亿美元收购了数据挖掘和机器学习创业公司Lattice.co。
如果说投资康宁是看重其在玻璃硬件上的研发与制造能力,那么收购Lattice更像是苹果在软件领域的布局。不过,苹果对于此次收购并没有太多解释,只是在确认收购声明中表示:“苹果会不时收购小型科技公司,我们通常不对收购的目的和计划置评。”
有分析人士指出,苹果收购Lattice意在其“暗数据”技术,而“暗数据”对于苹果AI、智能音响的发展意义非凡。
资料显示,Lattice成立于2015年,前身为斯坦福大学的一项名为“DeepDive”的研究项目。该公司技术通过机器学习自行理解数据库、网站信息以回答外界对系统的提问。曾经默默获得过GV、Madrona和InQTel的2000万美元融资,其核心技术可实现对“暗数据”的理解——即从图像、文字段落中获取信息。
有相关统计,2013年时,整个互联网数据量为4.4泽字节(兆兆字节),预计2020年这一规模将达44泽字节,IBM认为,如今的数据量,90%是在过去两年中产生的。
在这一庞大的数据中,70%-80%的数据为非结构化数据,即“暗”数据,信息的格式难以归类并由计算机读取,从而分析。当外界需要对数据进行分析处理时,这部分数据是不能被利用的。
简单来说,Lattice所做的事情,就是从一大堆没有标签,分类或上下文的数据中梳理出一套有组织的信息,Lattice也可以通过生产有组织的数据来帮助训练AI系统。值得一提的是,苹果在去年的全球开发者大会(WWDC)上,宣布了操作系统的许多升级,并表明该公司正专注于机器学习和个人助手技术。
如今,人工智能业已成为苹果、谷歌、Facebook、微软等科技巨头在设计未来产品过程中青睐的关键技术之一,巨头的人工智能助理基本都已亮相了:Google Assistant, Apple Siri,IBM Watson,Microsoft Cortana等。
但另一方面,人工智能助理往往需要依赖结构化的数据,来提供有意义的答案。由于更多的“暗数据”不能被处理,所以Siri等助理的适用范围被大大缩小。智能助理大都是在信息检索,帮助用户获得资讯。绝大多數的内容是不牵涉“推理”的查询类信息服务。
一个简单的例子:智能助理往往能够回答诸如“明天的天气”,“附近的餐厅”等问题,而一旦涉及诸如“明天这个天气状况会造成航班延误吗”、“附近的餐厅可以使用电子支付吗”这类涉及推理的问题,智能助手往往就无能为力了。
在许多科技巨头都竞相打造大规模人工智能团队时,Lattice的20名工程师也加入了苹果。外界预测,收购Lattice之后,至少可以帮助Siri处理更多的命令,找到更多隐晦的信息。