智能音箱:变革产品or技术泡沫?

2017-09-15 14:11刘鹏宇
互联网经济 2017年8期
关键词:音箱家居入口

□ 文/刘鹏宇

智能音箱:变革产品or技术泡沫?

□ 文/刘鹏宇

智能音箱是为传统音箱赋予智能的新产品,成为继智能电视、智能手机后智能家居新入口,引得国内外IT企业竞折腰。本文围绕智能音箱如何成为智能家居入口、构成智能音箱生态的要素以及如何进一步发展智能音箱三个问题展开。只有真正解决以上三个问题,才能使智能音箱成为新一代变革产品而不是技术泡沫。

刘鹏宇

中国电子信息产业发展研究院 信息化研究中心

智能音箱是利用人机语音交互技术,面向家居场景提供搜索、听歌、购物、社交等服务的智能硬件。智能音箱首先是智能产品,其次关系用户使用习惯,最后是智慧家居入口。

为音箱赋“智”

智能音箱是利用人机语音交互技术,面向家居场景提供搜索、听歌、购物、社交等服务的智能硬件。2014年11月,Amazon公司公布了全球首款智能音箱Echo,迄今其全球销量超过1000万台;随后两年,科大讯飞、Google公司相继推出了智能音箱产品;2017年以来,智能音箱进入了发布的井喷期,微软、苹果、联想、阿里等公司纷纷入局抢占市场。智能音箱成为继智能手机、虚拟现实眼镜之后,最受IT企业推崇的新产品。那么,如何剖析智能音箱产品呢?它应有三个属性。

首先是智能产品。智能产品是“智能+产品”,可以从“智能”和“产品”两方面分析。智能是思考的能力,其强度由低到高分别为经验智能、成分智能和情境智能。其中,经验智能是指依赖实际经验归纳得到一般规律;成分智能是指依赖已知知识演绎得到隐知识;情境智能是指根据所处环境做出最优化决策。产品是封装了技术逻辑、外观设计、商业模式的用户需求解决方案。综上所述,智能产品是具有一定智能强度的用户需求解决方案。当前,市场现存智能产品(例如智能手机、智能电视)的智能程度普遍不高,仅为经验智能产品,仅能根据经验为用户迅速连接到信息、服务和社群。智能音箱就是“智能”+“音箱”,其核心在于“智能”,应为音箱赋予更高的智能强度,从经验智能上升到成分智能甚至情境智能。

其次是用户使用习惯。主要从人机交互和用户感官两方面分析。人机交互方式从按键、触摸到语音、脑机,是信息传递效率不断提升的过程。当前,智能手机、车载终端、智能机器人等产品都有向基于语音的人机交互方式演进的趋势,提供更迅捷、更方便的交互体验。用户感官主要包括视觉、听觉、嗅觉、触觉等。因此,智能产品是由人体不同感官全方位感知,经由大脑处理分析后形成的综合认识和感受。对不同类型感官的综合性越强或者对单一感官的刺激越精深,用户体验就越深刻。据智能语音行业研究报告,人类从外界获取信息的感官依赖度,视觉占60%、听觉占20%、触觉占15%。例如,智能手机就是高度综合了用户信息获取依赖度前两位的视觉和听觉方式;而虚拟现实眼镜则把二维非沉浸视觉体验提升至三维全沉浸,对用户接受度最高的视觉方式做了精深拓展。智能音箱在强化人机语音交互功能的同时,需要进一步拓展对用户感官的覆盖范围或者加强对听觉的精深刺激,提供更丰富的交互体验。

最后是智慧家居入口。入口是服务商获取市场、用户、数据的渠道。当前,各大IT厂商都在搜寻家居场景的终极入口。智慧家居入口之争已从电脑、手机、平板、电视,延伸至智能音箱。从桌面互联网到移动互联网的时代更迭中看,手机以其泛在性、便携性特征脱颖而出。那么,当前从移动互联网到万物互联网的时代演变中,谁可以成为真正的智慧家居场景入口?以下主要从三个方面分析。1.家居是一个弱移动场景。入口产品并不要求像手机、平板一样具有很强的高速泛在性。2.家居是一个高效交互场景。任何需要用户付诸复杂肢体动作的入口产品都不会受到欢迎。3.家居是一个强人性化场景。入口产品作为家庭生活的组成部分,需要具有融成员化、融情感化的能力。综上所述,智慧家居入口的特点是弱移动性、高人机交互性和强人性化。智能音箱必须要同时兼容以上三点,才能制霸智慧家居入口。

构建智能音箱产品生态

智能音箱的支撑核心在于智能语音,其本质是“技术+平台+内容”。只有形成强关联的产品生态,才能让智能音箱产品拥有变革生活的能力。

多种技术的综合应用形成了智能音箱产品的核心服务能力,其中包括语音识别、声纹识别、自然语音理解、多轮对话管理、自然语言生成等。其中,语音识别技术可将人类语音转换为机器可读取的文字;声纹识别技术是根据语音内在生物特征,对说话者进行身份验证;自然语言理解技术可为机器翻译人类语音的含义;多轮对话管理技术是围绕某一话题人与机器进行多轮次确认问答;自然语言生成技术是将机器内外部文字信息转换为人类语言的技术。整体技术逻辑可描述为:当人与智能音箱交互时,首先机器利用声学技术处理接收到的语音和环境噪音,并通过声纹识别技术确认对话者身份,同时利用语音识别技术将感知到的声音转换为机器可识别的文字,语义理解技术则会帮助机器理解这些文字的含义。其中,机器可以应用多轮对话管理技术进一步明确用户意图。最后,机器执行用户指令并通过语音合成技术表达相关内容。

平台是智能音箱语音交互能力的汇聚和支撑主体,提供了唤醒、去噪、识别、理解和合成等语音综合服务。科大讯飞公司打造了全球首个智能交互技术服务平台,支持Android、iOS、WP8、Java、Flash、Windows、Linux等SDK开发功能,提供语音唤醒、语音识别、语义理解、语音合成、人脸识别等技术服务。思必驰公司以DUI对话定制平台为载体,开源全部核心语音技术,面向广大用户输出语音识别、语义理解、智能对话、语音合成、资源对接、应用开发等一站式语音定制服务。

图1 智能音箱技术逻辑图

图2 中国智能家居市场规模

内容是对垂直场景需求的响应与解决。第三方服务商可接入技术开放平台,针对车载、家居、可穿戴、医疗、教育等场景开发出新应用。例如,用户可以在开车时与智能音箱进行实时沟通,知晓家庭成员安全、家用电器安全等信息;用户可以在健康咨询中与智能音箱进行交流,获取定制化健康解决方案。

升级智能内核

智能音箱欲成为变革产品,应先变革现有对智能产品的定位,形成融感官、情感、场景于一体的智能内核。

丰富感官体验,在“显示视觉”方面做精深。智能音箱向用户所传递的感官体验不能仅停留在听觉上,而应进一步拓展至视觉感官体验。可考虑以空气、水分和光为基础元素,通过向空中喷射出超细水滴,打造半透明空气屏幕。该屏幕既可以追踪放大、缩小、旋转等手势操作,还可通过无线WiFi连接室内窗户玻璃、镜子等呈像装置,提供信息展示、虚拟试衣、虚拟美妆、虚拟旅游等服务,形成处处皆显示的居家体验。

提升情感能力,在“人机情感”方面做突破。智能音箱不能仅定位于智能硬件,应上升至有情感的家庭成员的高度。我们不但要赋予智能音箱经验智能、成分智能,还要训练它的情境智能,使其在与各家庭成员的相处和各方利益权衡中获得全面信任和广泛认同。例如,智能音箱能够与老人进行情感抚慰式交流,与孩子进行教育启蒙式对话,与男成员进行社会话题研讨式沟通。这些人与机器的深入情感交流都比简单的信息链接,更能激发人类对于产品的依赖感、亲密感。

增强情景渗透力,在“垂直场景”方面做延展。智能音箱应该以家居为中心,向车载、医疗、办公室、购物中心、体育场等场景进行扩展。通过在人体部署可穿戴式感知设备,实时监测个体在各个场景中的活动数据,并回传至智能音箱。智能音箱可通过深度分析个体社会活动大数据,为用户预备定制化情感沟通、资讯推送、健康指导等服务。

智能音箱正在为传统音箱赋予智能,其支撑核心在于智能语音,本质是“技术+平台+内容”。未来融感官、情感、场景于一体的智能内核才能真正变革生活,而不至于沦为昙花一现的技术泡沫。

责任编辑:卫丽红

weilihong@ccidmedia.com

猜你喜欢
音箱家居入口
高速公路入口疏堵解决方案及应用
打造日常家居“氛围感”
KEF推出新一代LS50 Wireless Ⅱ音箱
Polk(普乐之声)推出高端Reserve系列音箱
基于新一代称重设备的入口治超劝返系统分析
小音箱,大精彩 B&W 805 D3尊贵版书架音箱
多一对音箱,多一份惊喜Marantz AV8805
台北家居
秘密入口
第九道 灵化阁入口保卫战