万阿平
(江苏联合职业技术学院扬州分院,江苏 扬州 225003)
随着大数据技术的发展,有必要开发出具有更强大计算能力的芯片。传统体系结构设计的芯片在用于大数据并行计算时需要复杂的指令系统,计算速度不能满足实际要求。芯片的本质是集成电路,其主要制作工艺是将集成电路制造在半导体晶圆上,当前集成电路技术发展迅速,晶体管可达到每平方毫米100万的数量级。
在信息化时代,电子产品得到越来越广泛的应用,其核心技术是芯片的设计制造。芯片被视作微型“计算机”,能够嵌入在卡片、存货清单和设备中,人工智能芯片这种具有复杂算法处理能力的芯片其性能主要取决于内部特定的结构设计和简单的指令集,如类脑芯片。与传统语音芯片相比,智能语音芯片的特点和优势在于它可以通过使用元器件对接收到的命令进行信息分析和分类,并指导机器执行各种动作。同时,智能语音芯片还可以进行高质量、高压缩率的录音,并在需要时进行回放,从而实现人机对话。
人工智能或机器翻译技术在自然语言处理方面已获得许多成果。经过国内外媒体的广泛报道,智能语音技术受到公众的广泛关注,这也使得智能语音技术得到飞速发展。目前,人机交互技术依托人工智能和大数据技术发展,在智能化、自动化趋势下蕴含巨大的商业价值。而语音芯片作为现代汽车智能化的表现,能够满足车辆消费者在车内工作、休闲娱乐等要求,是行业发展的必然趋势。
目前,智慧系统的研发困境主要是自主核心技术缺乏,产品信息共享体系不足和校企联合培养人才储备不足等。我国的新能源汽车需要在车载新能源系统、驱动系统及控制系统方面逐步实现国产化,这在合资发展道路上是难以实现的,从而造成在生产或出口过程中投资成本较大。而智能网联市场还处在萌芽期,部分细分市场蕴藏着巨大的潜力,未来还可能应用到发动机、变速箱等机械设备中,无人驾驶是重点发展方向[1]。近年来,各车企纷纷发布智能网联汽车战略,尽管他们的智能网联系统名称不同,但功能大多包含语音识别、语音控制、云服务和空中下载技术等[2]。如今,传统信息共享平台已不能满足研发企业的大量信息共享需求,因此需要对信息交互平台进行完善,以便其能更广泛地应用于新能源汽车领域。在我国高等职业院校教育改革目标下,采取“校企合作,产教融合”的教学模式推动我国实用性技术人才培养,但目前还处于探索阶段,还需在地方政府政策引导下不断拓展和加深合作范围及合作深度。
目前,国家不断提倡环境保护,营造采用绿色能源的社会环境,因此新能源汽车成为汽车行业的主要发展方向。而数字化系统在新能源汽车中的应用也越来越广泛,如音乐播放器、蓝牙电话、车载导航和可视化通讯等,这些都带来了更加舒适便利的驾驶体验。新能源汽车本身就具有人工智能的技术和硬件基础,搭载智能语音系统以后使得其应用场景更为丰富和广泛,可以满足用户的更多需求,如商务汽车和房车需要具备工作学习和生活的必备条件,智能翻译可以帮助连线跨国会议和接打国际长途电话等。一方面,智能语音技术可以赋能传统家电,延伸设备的功能,提升人们的智能使用体验;另一方面,随着人类生活水平的改善,未来的家居电气设备种类将日益增多,能够搭载智能语音功能的或将达到近百款。
语音芯片需要运用到多种智能语音技术,包括信号处理与模式、发生机理与听觉机理、概率论与信息论和人工智能等。而芯片与集成电路制造属于精密仪器制造,对制造环境和运行环境具有较高要求,对应的开发与制造成本相对较高。
语音芯片按照对象与内容可以分为特定人语音芯片和非特定人语音芯片[3]。特定人语音芯片用于对指定的人进行语音识别,在进行语音识别前必须将用户的语音参考样本存储在数据库中作为比较,也就是说,必须在使用前对特定人的语音进行训练。通常在机器提示下训练固定次数,机器便能掌握特定人员的讲话习惯与特点,进行更为贴切的交互。非特定人语音芯片是指无特定人员语音资料库的语音技术,无论年龄和性别,只要说的是同一种语言,机器就能进行识别。非特定人语音芯片的应用模式是在产品定型前,根据确定的十几个语音交互条目,采集约200人的语音样本,通过计算机算法处理交互条目的语音模型和特征数据库,然后在芯片上烧录。若将该烧录芯片应用于智能娃娃、电子宠物等机器,这些机器就具有人机交互功能,实现儿童与玩具的双向互动,起到陪伴作用。但该模式具有显著的优缺点,优点是无需采集多人语音样本即可进行交互,缺点是识别准确率不高,性能也不稳定。
图1给出了语音芯片在新能源汽车中的应用设计流程。语音芯片的设计需满足如下功能:① 准确简单的语音指令;② 完成简单的人机语音交互;③ 提升语音准确率,降低背景噪声干扰;④ 多复用设计,在多种场景下可以自动匹配模式;⑤ 低功耗,保证使用时间可达一周;⑥ 系统遇到故障能自动重启,保证使用的稳定性;⑦ 具有一定的纠错功能,自动录入错误并纠正;⑧ 适用性广,可嵌入多种电子设备并保持正常运行。
图1 语音芯片应用设计流程
语音系统的设计架构如图2所示,其一般操作顺序为:系统录入语音,完成语音词汇特征提取,构建声学模型,构建语音模型,词汇与语音库词汇解码,设置好中断函数,最后开启中断允许位。如果不使用中断函数的方式,需要在“开始语音”后判断寄存器(B2H)中的值,如果寄存器中的值为21H,就表示有结果产生,如果没有就返回,此后的读取候选列表等操作与中断方式相同。
图2 语音系统设计架构
嵌入式语音芯片可分为封闭域和开放域,封闭域范围围绕指定的字词集合,即在开发系统的时候会设定好应当注意的字词,对范围外的词语语音系统识别得不够准确。而这样的设定字或词的方式可通过声学模型和语音模型进行裁剪,有利于减小引擎的运算量,最后再将引擎封到嵌入式语音芯片中,这样便可完全脱离云端,无需连网也可以完成智能语音识别。目前主流的语音芯片是将日常生活语音转化成文本,属于开放域语音识别,如果不与人工智能结合,其应用场景不如封闭域语音识别广泛。典型的应用场景就是在汽车人机交互导航地址搜索框中录入语音,系统根据用户发布的语音进行识别,搜索出相关的地址信息进行导航。
伴随着人工智能、大数据等技术的发展,新能源汽车的智能化水平不断提升,增强了产品的舒适性和便利性。语音芯片的设计和应用推动了第3次人工智能热潮,未来智能语音技术将在集成更多功能的同时控制能耗,并将大量应用到新能源汽车等领域,使人机交互方式得到推广和应用。