刘岩
如果你在百度、必应等搜索引擎中输入“明晚从上海到广州的航班,东航”等类似问题,得到的答案往往是航班时刻表链接等模糊答案,甚至是各种风马牛不相及的答案。最终还需要进一步搜索,通过多步操作才能找到想要的航班信息。
“出门问问”语音助手则能帮用户找到想要的信息。这款语音工具能从出发地、目的地、去程日期、返程时间、价格、航空公司等多个维度帮助用户查询,答案还能一步到位,而且精准度非常高。它还能聪明地解析出口语中常用的“东航”即为“东方航空”等各种复杂的询问信息。除了查询航班信息外,出门问问还能查询火车票和酒店、餐馆、药店、银行等各种周边生活信息。目前,他们首选微信公众平台进行推广。
怎么想到做这个方向的?
这是一个靠技术驱动的创业团队。2012年底,出门问问创始人李志飞拿到天使投资后回国创业。早在2000年之前,他已经开始从事移动互联网相关工作,一直想在移动互联网领域成就一番作为,之后在约翰霍普斯金大学攻读博士期间的研究方向为智能机器人翻译,当时他写了很多相关领域的学术论文,他曾开发的一个开源机器翻译软件已经成为世界学术界两大主流机器翻译软件之一,斯坦福、麻省理工大学等都会使用。毕业之后,李志飞加入谷歌总部担任科学家,从事机器翻译的研究和开发工作。
随着移动互联网的需求放量,李志飞认为计算能力的提高、大数据量的存在等各方面已经取得突破。语音识别、机器翻译等技术在经历几波热潮之后,他感觉是时候加入创业大军中来了。
跟同类产品的差异是什么?
目前市场上有智能360、小i机器人、搜狗语音助手、讯飞等各种Siri跟随者。就产品形态来看,他们多是以打电话、发短消息、信息查找等形式展开查询,强调上下文对话时语义的解析功能。
出门问问弱化了对话功能,不存在上下文对话解析,即不允许用户进行先问“上海明天的天气如何”再问“那北京呢”这种提问方式。出门问问更突出信息搜索功能。这样做的好处是避免了“所问非所答”现象的出现。之所以不做上下文解析和多对话解析的原因在于,李志飞认为目前这种技术实现难度比较高。目前,出门问问跟定位于国外市场的Google Now产品形态更为相似。
特色在哪里?
出门问问的工作原理分为三部分:第一步,语音识别,即将声音转化成文字;第二步,语义分析,将时间、地点等关键字转化成表格;第三步,应用对接,即所谓垂直领域的搜索。出门问问最擅长、最核心的是第二步:语义分析。
拿机票查询案例说明。出门问问会将出发地、目的地、时间、价位、班次等多维度查询参数转化成表格。解析时,能判断“下星期二是几号”,即使句式颠倒也不影响查询效果。哪怕输入“魔都”去“帝都”的飞机班次,也能识别出来。
在李志飞看来,要做好任何一种机器学习系统必须具备三大元素:核心算法、系统架构、基础数据量。具备一定的数据量和核心算法之后,是否具备围绕核心算法的辅助性工具非常关键。于是,李志飞团队用六个多月时间搭建了一套系统,系统的亮点在于实现了模块化、工具化。这就是他们的核心竞争力之所在。
因此,即使不懂编程的员工也能在系统中添加数据。这意味着出门问问的可扩展性比较强,若他们想转向生活消费类外的其他细分领域,只需要非技术性人员花两三天时间就能完成一套垂直领域类语义分析系统的搭建。这套通用性、自动化系统搭建成型之后,出门问问以后的工作是不断优化系统,继续提高系统查询精准度。