James Cochrane
(What3words limited,65 Alfred Rd,London W2 5EU)
主题词:导航 地址 HMI 语音识别
OEM Original Equipment Manufacturer(汽车主机厂)
POI Point of Interest(兴趣点)
HMI Human Machine Interface(人机界面)
UX User Experience(用户体验)
ASR Automatic Speech Recognition(自动语音识别)
API Application Programming Interface(应用程序编程接口)
SDKSoftware Development Kit(软件开发工具包)
虽然在过去十年里车辆的地图构建技术取得了显著进步,但这并没有改善我们使用信息娱乐和车载导航解决方案的方式。它们提供的用户体验仍然很差:大多数驾驶者仍然需要通过手机获取导航方向。
这一问题的主要原因常被忽视:现有的地址系统不适用于所有目的。它们并不是针对语音输入而构建的,而且往往无法指引您到达确切的目标位置。缺少全球通用、精确、一致的街道地址给OEM,这给地图构建和导航供应商等都带来了不小的挑战。就本文而言,车载导航定义为OEM在汽车主机设备中提供的嵌入式导航解决方案,驾驶者可以通过语音或文本来输入地址。
以下章节将重点介绍中国和世界各地的地址问题,以及三词地址这项创新解决方案将如何改善现有车载导航和驾驶体验的难题。
传统地址可以定义为街道名称、建筑物编号或是邮政编码,数百年前创建这一体系时所考虑到的目的只有一个:信件递送。但现代消费者需要的地址用途远不止于此。地址应该能够让人们接收账单、直接订餐上门,甚至享受无人机送货。地址还应该让人们能够直接指引无人驾驶出租车到达确切地点,并且就本文而言,还可以让车辆将他们送到世界上任何精确的目的地。但是,当现代需求只能依托于已有数百年历史的老旧基础设施时,提供流畅的车载导航体验就变得极其困难,甚至是一项不可能完成的挑战。
世界上很多地方根本没有地址。虽然百度和谷歌等企业在大力推动构建地图以及扩大覆盖范围,农村地区、露营地、海滩、停车场和其他野外地点却通常都没有传统的街道地址,这使得这些地方的导航尤为复杂。
持续的城市化发展也使得导航系统无法跟上繁杂的街道名称变化。例如,预计到2030年,中国城市人口将超过10亿,相当于全国总人口的70%[1]。由于各地政府和市政部门难以跟上城市的发展速度,许多街道会有长达数月甚至数年没有命名的情况。拥有250多万人口的上海闵行区(图1)便是面临这一挑战的典型例子。目前闵行区仍有数十条道路有待命名或是缺少路牌标注,所以公众、企业和当地市政人员难以准确地对整个地区进行描述。中国的城市化速度惊人,但它并不是面临这一问题的唯一国家。街道命名作为一项昂贵且费时的流程,更是加剧了这一问题的严重性。据世界银行估计,拥有150万人口的城市实施正式编址需要花费130多万美元,即每户0.87美元[2]。
图1 上海闵行区仍有许多未命名的道路
即使在编址完善的城市里,车载导航系统仍面临目的地输入的挑战。重复的街道名称便是最常见的例子:德国有8 279条海德堡街[3],墨西哥城有630多条华雷斯街[4],伦敦有54条维多利亚街[5]。这个问题在中国也十分常见,例如,在南京可以找到好几条博爱路(图2)。即使在最好的情况下,驾驶者也必须要了解关于目的地的辅助信息(例如邮政编码)或是滚动查看地址选项列表以选择正确的目的地,而这极大地影响了用户体验。最糟糕的情况是,驾驶者不仅选择了错误的地址,还在毫不知情的情况下抵达了错误的地点。
在很多情况下,驾驶者会利用兴趣点(POI)作为克服这些障碍的捷径,而许多时候,这是一种相对有效的输入方法。然而,许多常见的POI占地面积非常大并且有多个入口,例如购物中心、体育场馆和办公大楼(图3)。当整个建筑物只有一个POI可供参考时,POI在导航最终路段的指引作用将大幅减少。这不仅导致了驾驶者难以选择前往正确目的地的最佳路线,也造成了极差的用户体验。
图2 重复的街道名称可能会导致导航混乱:南京有多条博爱路
图3 大型建筑物的单一POI无法帮助您找到特定的入口:上海的金茂大厦就是一个典型的例子
因此,很明显今天使用的传统地址不是为21世纪设计的:它们不适用于人机界面和语音输入,而且其准确性也无法满足当今驾驶者的需求。
提供可靠且最新的地址数据库对地图供应商来说是巨大的挑战。尽管有中国最齐全的地址数据库,高德POI数据库为6 000万[6],百度为1.5亿[7],但这也不会解决街道地址不足的问题。在世界其他地方,Here Technologies在200多个国家和地区提供地图构建数据[8],然而它每天需要对其地址数据库进行大约270万次更新[9]。这意味着地址数据库不仅不完整,而且往往还不精确,它需要不断的更新维护,因此这也决定了地址数据库不是实时的。许多OEM都希望建立适合多个市场的信息娱乐系统,然而每个市场不同的地址格式也使得汽车系统的目的地输入难以实现标准化。由数字或字母数字组成的邮政编码的不统一使用、街道编号和街道名称的前后排序以及地址从大范围到具体地点的排列顺序等问题对OEM而言都十分棘手,然而为不同市场量身定制也需要付出大量成本[10]。
这些问题在展望车载人机界面(HMI)和语音技术的未来时显得尤为突出。虽然预计到2022年有90%的新车将具有某种语音识别能力,但识别过程的不准确性是新车主目前投诉的两大问题之一[11]。根据J.D.Power的报告,只有13%的车主使用语音功能来操作导航系统[12]。报告还指出,在使用语音功能的人当中有32%的驾驶者表示,由于语音识别功能的不准确性,他们至少在一半情况下会放弃使用语音功能[13]。虽然中国消费者正在引领语音输入的潮流,但多达50%的中国驾驶者认为他们的车载导航服务已经过时[14]。这都是因为传统地址并不适用于语音输入。
街道名称时常令人困惑,而使用中的错误又难以被人发现。发音相似的街道名称让语音识别技术很难纠正错误。在南京,“中山路”和“钟山路”的发音完全相同,但写法却不同。在英语中,数字15和50很难区分。在意大利,许多街道名称包含了显示为字母的罗马数字(例如,Via XXV Aprile),因此人们很难正确发音。街道地址还使用了数以千计的生僻词,而这些词更是难以准确读出,因此无法实现语音导航预期的便捷性。例如,人们经常会把位于美国马萨诸塞州的Worcester念错。正确的发音是“伍斯特”,而不是“伍切斯特”或“伍赛斯特”。全世界还有成千上万这样的例子。结果,地址经常被误听、误解或根本无法识别,这使得车载语音输入非常令人头痛。这违背了语音导航系统简化旅程的初衷。
虽然OEM在改进我们与车辆互动方式的方面取得了巨大进步,世界各地的编址问题仍是当前面临的严峻挑战。世界上许多最美的地方根本没有地址,而且随着城市化不断发展,我们需要付出极高成本才能使街道命名跟上城市快速发展的步骤。即使在一些编址最完善的地方,导航问题仍然存在:重复的街道名称和不甚精确的POI每天都会让驾驶者不胜其烦。车载语音技术的发展加剧了这一问题,因此实现良好的用户体验变得难上加难。
考虑到编址和语音输入方面的这些问题,现代导航需要通用、精确且语音友好的寻址系统。三词地址是准确交流任何位置最简单的方式。这一技术将整个世界划分为3 m×3 m的方格,并给每一个方格分配一个由3个常见词语所组成的唯一地址。三词地址用算法将复杂的GPS坐标转换为简单的三词地址(图4),反之亦然。这意味着用户只需三个词就能找到世界上任何地方。
人们可以在免费的三词地址地图或应用程序上查找三词地址。在任何拥有传统地址的地方都可以找到三词地址:酒店和餐馆的联系信息页面、会议邀请函、名片,用户也可以通过微信、电子邮件或其他平台分享三词地址。在中国,这款应用程序叫做“三词地址”(图5),可以在iOS或是部分安卓应用商店内下载。
图4 三词地址算法将复杂的GPS坐标转换为三个词,反之亦然。
图5 三词地址应用提供覆盖中国全境的中英文三词地址
三词地址非常易于使用,并提供包括英语和简体中文在内的36种语言,而且还在不断增加新语种。这消除了传统街道地址带来的语言障碍。虽然用户可以一键转换三词地址的语言,但这些词语并不仅仅是简单的互译。每种语言版本都经过了精心的研发。排除了难以发音的词或是同音词—例如“手指”和“手纸”(读音:shǒuzhǐ和 shǒuzhǐ)以及令人反感的词语。每种语言都针对最常使用该语言的国家进行了优化,这意味着在说英语的国家中可以找到最简短的英语单词,而在西班牙和墨西哥等地区则可以找到最简短的西班牙语单词。对于英文而言,总共只需要40 000个单词就能覆盖整个世界(包括海洋)的57万亿个3 m×3 m方格。其他语言的词语列表则更短(只需25 000个),因为其他语言只覆盖了陆地范围。每种新语言的开发需要几个月的时间,而版本一旦启用,其中的三词地址将永远不会改变。
简单设计的背后隐藏着非常灵活的功能:在人口密集的区域会使用较短的词语,因为其使用频率会更高,每一个三词地址都是独一无二的,并且发音相似的地址已尽可能被远远隔开,以避免任何混淆。例如,///妻儿.得主.制定这一地址位于上海,而///吸热.得主.制定则位于甘肃。因此,三词地址完全可以将车辆的位置作为决定因素来推荐正确的结果。这个内置错误检测功能叫做AutoSuggest(图6),它通过显示地理位置上最相近的匹配结果这一尽可能简单化的方式,以保证驾驶者到达正确的目的地。AutoSuggest功能可根据用户的位置推荐最有可能的地址,以助于发现错误。发音相似的地址被远远隔开,以避免混淆。此功能是三词地址与其他寻址解决方案最重要的区别之处,因为将用户体验置于技术研发的首位。
图6 三词地址AutoSuggest功能推荐最有可能的地址
虽然三词地址并不是一个地图构建解决方案,而提供导航也并非其目标用途,但是三词地址独特且精确的寻址功能作为一项必要链接,可以让人们在车内轻松输入目的地的精确地址。三词地址的寻址解决方案可以与任何语音或地图服务供应商相兼容,并具备可用于车载导航领域的多项关键优势。
(1)通用。与街道地址不同的是,三词地址技术已经为世界上每个3 m×3 m的区域都提供了一个地址。无论是农村、偏远地区、还是快速发展的城市环境,三词地址使得通向无址位置的导航成为可能。三词地址遵循///词.词.词的统一格式,因此也便于跨国界使用。
(2)精确。每个三词地址都标注在一个精确的3 m×3 m的范围上,这比POI或街道地址的准确性要高得多。
(3)人性化。因为三词地址是唯一基于常见词的寻址解决方案且拥有AutoSuggest功能,与传统街道地址相比,它拥有更加人性化的设计。
(4)离线支持。因为三词地址的技术基于算法而不是像传统的地址系统那样依托于数据库,所以三词地址可以完全离线使用。在一种语言完成全球地图构建后,这些三词地址就是固定的,而且永远不会改变,因此不需要更新。这意味着整个系统可以离线嵌入车内系统且无需连网。
(5)专为语音设计。三词地址是全球首款专为语音设计的寻址系统。字典常用词不仅发音很简单,而且还很便于语音识别软件理解。三词地址语音输入的语音识别准确度为95%[15]。虽然街道地址语音输入的准确度并没有一个公认的标准,但三词地址无疑已达到了行业的领先水平。
由于三词地址解决了一个现实问题,越来越多的大众和企业已开始使用、分享和展示三词地址(图7)。人们将三词地址与传统地址一视同仁,而获取该两种地址的方式也并无不同。孤独星球等旅行指南网站现在正将三词地址添加到其印制指南中,而凯宾斯基酒店等品牌也已在其网站中为旗下所有的酒店添加了三词地址。在中国,食派士等餐饮配送公司现已在其应用中添加了所有餐厅的三词地址,而Time Out杂志正在使用三词地址来帮助读者更轻松地找到不为人知的理想休闲去处。用户获取三词地址后,只需将其输入至三词地址应用程序或通过语音输入至汽车系统即可定位。
三词地址可以通过API在线添加,也可以通过SDK进行离线添加。这样,车载自动语音识别(ASR)就可以识别三词地址,并在将其转换为GPS坐标后标注在地图上以进行导航。为了提供最佳的驾驶体验,三词地址建议使用离线解决方案,这样就可以确保在无数据连接的情况下正常使用功能并缩短延迟时间。语音和文本输入的技术集成过程如图8所示。
梅赛德斯-奔驰是第一家集成三词地址并在中国市场推出该地址系统的原始设备制造商。三词地址是其全新顶级的MBUX信息娱乐系统的主要功能之一,它使得驾驶者能够最大程度地享受通过语音或文本输入地址的流畅体验(图9)。这项功能显著改善了驾驶者的行车体验,因此梅赛德斯(戴姆勒)决定投资三词地址公司。除了梅赛德斯(戴姆勒)之外,三词地址公司还获得了来自汽车及技术行业的其他关键企业的投资,包括上汽投资、阿尔派、索尼和英特尔投资。在中国市场,语音供应商普强信息技术和蓦然认知以及导航提供商东软集团是第一批将三词地址集成到旗下产品中的供应商。
图9 梅赛德斯汽车MBUX信息娱乐系统中的三词地址界面
OEM在为驾驶者提供最佳车载导航体验的过程中要面对许多挑战。其中,传统街道地址的不准确性及与语音技术的不兼容性日益凸显。随着中国和世界各地驾驶者对流畅人机界面(HMI)的需求不断增长以及语音技术正在成为人们与车辆互动的主要方式,这一问题在近期内并没有得到缓解的迹象。三词地址的创新寻址系统为现代消费者提供了便捷的解决方案。这一技术以用户体验为核心,提供拥有难以匹及的准确性、覆盖全球且适用于语音输入的地址系统。随着中国在各方面持续引领创新的步伐,三词地址是否会展现超越一个世纪之久的老式基础设施的能力?三词地址对此抱有充分的信心,并已准备更深入地参与到中国市场当中。