智能电视语音交互专利技术综述

2018-06-06 05:28刘文静黄懈
科技创新与应用 2018年15期
关键词:专利

刘文静 黄懈

摘 要:语音交互是智能电视人机交互的重要发展方向,已成为国内外智能电视相关企业、机构创新竞争的重点。文章重点研究智能电视中语音交互技术的国内外专利情况,对技术总体发展趋势、专利布局、分支情况、重点发明人等进行分析。

关键词:智能电视;语音交互;专利

中图分类号:TP18 文献标志码:A 文章编号:2095-2945(2018)15-0003-03

Abstract: Voice interaction is an important development direction of intelligent television human-computer interaction, and has become the focus of innovation competition of domestic and foreign intelligent television related enterprises and institutions. This paper focuses on the situation of domestic and foreign patent of voice interaction technology in intelligent television, and analyzes the overall development trend, patent layout, branch situation, key inventors and so on.

Keywords: intelligent TV; voice interaction; patent

引言

随着2010年Google首款智能电视的面世,全球电视产业也随之跨入智能化时代,世界IT巨头和跨国电视企业都相继投入巨资开发智能电视,传统电视产业格局被打破,新兴厂商与传统电视企业开始博弈,争夺市场。随着网络技术、芯片技术、软件技术、显示技术及云计算、物联网等技术的快速发展,全球智能电视产业得到了迅猛发展,智能电视已成为一种潮流,其发展势头不可阻挡。在智能电视各项关键技术中,人机交互技术是制约电视智能化发展和普及的重要瓶颈,其成为国际国内智能电视相关企业、机构创新竞争的重点,成为智能电视专利布局的重要方向[1]。语音是最自然最直接的获取信息和交流信息的方式,语音信息的输入、识别和执行,能够极大地降低用户的沟通成本,丰富人机交互方式。随着互联网的快速发展和云计算的不断成熟,以及智能电视时代的到来,语音技术在智能电视终端人机交互中的重要性也日渐凸显。利用语音来控制终端已成为可能,即智能终端能够听懂用户的语音,并根据用户的语音指令做出快速响应,这将大大提升用户的操作便捷性。语音交互式目前是最被业界看好的人机交互方式之一,微软、苹果、IBM等国际巨头争相投以巨资进行研发,三星、松下、长虹、TCL等多个品牌所销售的智能电视均已植入了语音识别功能。

1 智能电视语音交互技术原理及分支情况

语音交互流程[2]如图1所示:通过语音输入设备,如麦克风,进行语音数据的录入;然后传递给智能电视系统层进行编码;在将编码后的语音数据传输至语音数据处理模块对语音进行语音识别处理;识别成功后,将语音数据中包含的文字信息解析出来,并返回给智能电视;最后智能电视对返回的信息映射成控制命令或相關信息输入来对智能电视进行相应操作,比如更换频道、打开第三方应用等。

通过对智能电视语音交互技术的专利文献收集、标引和梳理,根据技术手段的不同,将该领域大致可以分为三个分支:语音输入、语音处理、语音控制,如表1所示。

基于语音输入的电视语音互动包括语音输入设备和语音服务开启。以遥控器、机顶盒、手机和TV内置传声器为主的语音输入设备,对模拟语音信号进行录入、滤波、去噪、量化和编码等步骤,实现语音信息的预处理及传输。为防止智能电视错误地识别周围的环境噪音而产生不必要的不正常工作,采用特定的输入语音命令或其他语音操作以开启语音服务,减少声音输出设备的声音产生的错误识别。

基于语音处理的电视语音互动主要包括两大部分[3]:语音识别和语义分析。语音识别是语音交互的基础,正确识别用户的语音信息,是随后语义分析和语音合成的前提。语音识别过程是对语音特征进行提取的过程,首先要确定语音识别单元,常见的语音识别单元有单词、音节和音素三种,选择何种识别单元取决于具体的研究内容,之后对说话人语音进行检测和降噪等预处理后,通过对输入的音频流进行分析,确定用户说话起止,即端点检测;根据识别单元中的信息进行关键特征的提取,通过压缩信息、去除冗余信息,从语音信号中提取一组或多组能描述语音信号特征的参数。语义分析是语音交互技术中最灵活的一部分,语义分析是在语音识别引擎对语音数据进行识别解析后,将识别后的数据以某种特定的协议格式转换成文本,并返回给终端应用,并根据应用要求转换成相应的逻辑或命令。

基于语音控制的电视语音互动是指用户通过语音的对话形式,将指令发送给智能电视,令其自动执行相应的用户操作,例如进行音量调节、换台、切换模式等。随着用户的需求提升,借助于无所不能的互联网,能够实现更多的云端功能,例如打开第三方应用、天气查询等服务,提高了用户体验。

智能电视语音互动领域的申请总量为1323项,其中语音输入、语音处理、语音控制三类的申请数分别为429项(32.43%)、341项(25.77%)、553项(41.80%)。可以看出,一半以上的专利申请涉及基于语音控制,高于其他两个分支。比重其次的是语音输入,而最少的则是语音处理。其原因主要在于基于语音控制的电视互动是人们最自然和最方便的互动方式,因此越来越多的人更愿意由语音形式向电视下达控制命令,由于需求推动技术的发展,导致了该分支下的专利申请量也应该是最多的。

2 智能电视语音交互技术专利现状分析

截至本次检索时间截止2017年12月,经过检索式检索与简单人工筛选,最终确定的涉及智能电视语音交互技术的全球专利申请共计1323项,总计312位申请人,总体发展趋势呈现增长状态。

(1)全球专利分析。图2为智能电视语音交互技术在全球专利申请逐年分布趋势图。从图2中可以看出,就智能电视语音交互技术的申请量呈逐年上升趋势,并在近几年保持较高的申请量。在1999年以前,智能电视语音交互技术还处于萌芽阶段,申请量很少,每年的申请量只有个位数,申请人主要集中在日本和美国的电视通讯设备公司和电信公司。在2004年以后,申请量逐渐开始增长,说明此时智能电视语音交互技术已经进入发展阶段,开始受到人们重视,而主要申请人也从以前的日美转为三星、LG等韩国公司。同时,中国的长虹、TCL等公司在该领域的申请也正式起步,虽然起步较晚,但增长显著,到2010年以后该技术的申请量都维持在100件以上,说明该技术在这几年开始迅猛发展。从图中虽然显示的2016和2017年的申请量呈下降趋势,但是并不能说明该技术的热度正在减少,相反的,该技术的热度还会呈上升趋势,其主要原因在于部分专利技术还未公开,所以并未被统计完全。

(2)申请的地域分布。图3为基于智能电视语音交互技术主要申请国逐年分布趋势。从图3中可以看出,在2007年之前,日本的专利申请量一直都位于领先地位,年申请量都高于其他国家,在2003年-2015年,中国、日本、韩国、美国的申请量都呈逐年增长的趋势。虽然中国在2005年左右才有了该领域的专利申请出现,但在2008年后,中国在该领域的申请量显著增长,2010年左右中国后来居上,智能电视语音交互技术发展迅猛,年申请量超过了其他几个国家。一方面这是由于世界知名的厂商在中国有众多的代工企业,另一方面,我国在这一阶段涌现出了大批优秀的国内电视厂商,如长虹、乐视、联想、TCL等,这些电视厂商将语音交互技术应用到电视中,这也成就了我国在该领域的专利申请量爆发式增长。

(3)主要申请人分布。图4示出了智能电视语音交互技术全球主要申请人的分布和排名情况,这代表了各公司在该领域的技术储备和技术实力。从图4中可以看出,全球申请量排名前十五的多为国际知名跨国企业,排名前五位的分别是三星电子、松下、索尼、LG和长虹。在排名前十五的申请人中,有五位申请人是日本企业:索尼、松下、东芝、船井电机、日本广播公司,这三家日本公司均以数码影像、电视技术为主要业务,并具有丰富的电视产品支持,足见日本在该领域中的领先优势。有两位申请人是韩国企业:三星电子和LG,这两家公司也都具有雄厚的实力,并在电视互动领域有旺盛需求的公司。有两位申请人是美国企业:美国电话电报公司和nuance,三位申请人是中国企业,一位申请人是欧洲企业。虽然排名前十五的申请人均是技术实力雄厚的公司,但是在智能电视语音交互技术领域中的申请的绝对量并不是很多,这十五家申请人的申请量的总和只占了申请总量的35%左右,因此该领域在全球范围内仍未形成具有绝对优势的申请人集团。而中国也有三家公司进入了前十五的行列,长虹是中国最为悠久的电视及相关行业的电视厂商,并且拥有实力雄厚的技术储备,以联想、乐视等为代表的互联网公司在智能电视领域近几年发展迅速。

(4)主要申请国家分布。图5是智能电视语音交互技术全球专利申请的国家及地区分布图。从图5中可以看出,来自中国的专利申请占总申请量的28%,可见在该领域中虽然中国技术发展较晚,但是申请人的技术力量不容小觑。美国和日本的申请量紧接其后,其申请量占全球申请量的26%和25%,由于这两个国家其在该领域发展最早,前期储备了优厚的技术作为基础,率先将该技术引入到电视互动中,拥有大量的基础专利技术,他们一直处于该领域的前列,引领行业发展趋势,并大力发展这一在电视互动领域语音互动,可见日本和美国在该领域中的技术优势十分明显。而韩国作为电视领域技术力量雄厚的国家,其在智能电视语音交互技术申请量也仅次于日本,可见对该领域的重视程度。

3 结束语

本文对智能电视语音互动领域的技术演进、专利申请状况、重点专利等进行了分析。从整体来看,智能电视语音互动技术在全球和中国的申请量都在持续的增长,特别是近几年进入了快速发展时期,智能电视语音互动技术主要的原创动力来自于中国、美国、韩国和日本,来自于日本和韩国的申请人具有较强的实力,中国和美国缺少领军型的申请人,中国申请人与国外申请人在该领域的差距还比较明显,应当加强在该领域的研发力度。

参考文献:

[1]张文凤.面向智能电视的个性化人机交互系统的设计与实现[D].哈尔滨工业大学,2014.

[2]吳进强,苏凯雄.基于智能电视的语音识别系统的设计与实现[J].电视技术,2013,37(10):27-30.

[3]詹新明,黄南山,杨灿.语音识别技术研究进展[J].现代计算机,2008(9):43-45.

猜你喜欢
专利
王振义 放弃专利为患者
专利资产全寿命管理模式探讨
华为三星专利大战国内大局已定
华为三星专利大战国内大局已定
USPTO裁定卡骆驰专利无效
苹果收购泛泰11件专利
IBM2016年获得超过7000项专利
滴滴购60余件导航技术基础专利
2007年上半年专利授权状况统计