不啸叫、无噪声、免调试？这款“语音处理器”skr什么厉害东西？

2018-10-11 06:18施映秋

信息化视听 2018年9期

施映秋

一位业内人士的心声：随着时代发展，演艺扩声的业务逐渐萎缩，目前主要集中在少数专业演出团队。而随着电子通讯及网络技术的发展，会议室扩声和普通厅堂语言扩声类业务却是越来越多。但相应所需要的具备专业音频工程和调音技术的工程师却越来越少，大都由与网络、通讯、综合布线类相关的工程师逐渐接手。同时，用户方对电子会议室的接管人员逐渐由音响师过渡到电工，然后随着物业外包的兴起，会议室接管人员就是IT部门或者行政部门了。甚至有的大型企业根本没有具体负责人，连设备开关机都没有人管理。

由以上种种的问题可以看出，在音频行业，专业音频人才有趋向枯竭的危机，而语言类的扩声项目却是有增无减，那么如何在这两者之中寻找一个平衡点，让语言类扩声在缺乏专业音频人才的情况下也能达到较为理想的扩声效果？深圳奇正设计顾问公司正是看到了行业的这个痛点，推出了自主研发的“QZAudio语音处理器”（下称“语音处理器”），旨在让完全不懂音频的人都可以做音频。

那么问题来了，这款“语音处理器”到底是何方神圣？用现在流行的话说：真的有那么skr吗？下面我们一起来了解一下。

不啸叫、无噪声、免调试语言扩声也能如此简单？

“语音处理器”是一款全新概念的产品形态。以对话筒输入端标准化处理为工作目的的设备。其核心就是在减少专业技术投入同时，预校正话筒的工作参数，达到语言类扩声不啸叫、无噪声、免调试的工作效果。

“语音处理器”针对语言扩声工作进行标准化处理，核心特点之一就是无需专业技术干预的情况下解决过去很难处理的话筒反馈、拾音距离不够等技术难点。最显著的特点是通过语音处理器处理过的会议话筒，包括鹅颈麦、界面麦、纽扣麦、阵列麦等，均可以轻松达到1米以上的拾音距离，提高传声增益。

提高传声增益的核心技术是反馈抑制。

过去市场上有多种反馈抑制技术，都是针对声音信号的波形进行修改，以避免声场正反馈。手段包括移频、移相、陷波、限幅等，核心特点是通过反馈信号的特征来修改整个扩声系统的品质，在反馈发生后进行技术干预。

还有工程应用上的分区扩声。分区扩声属于工程应用技巧，核心原理就是提高拾扩比（拾音距离和扩声距离之间的比值，通常电容话筒要达到1：10，动圈话筒要达到1：5）。

而“语音处理器”如何达到不啸叫的目的，也是它与其他的反馈抑制器相比最突出的亮点，就是在反馈发生前就进行技术干预。在反馈发生前，“语音处理器”将话筒拾取的原始信号进行记录，与音箱扩声后发出的信号进行比对，然后过滤音箱发出的声音而只保留拾取到的人声，最终做到无啸叫的目的。使用鹅颈或界面会议麦，其拾扩比可以达到1：1甚至2：1。产品设计拾音距离可以轻松达到1米以上。而通过SHURE阵列式天花麦克风，还可以做到6米远拾音室内扩声不啸叫。拾音距离的延长，大大地创造了演讲形式的可能性，演讲者的活动范围受限减少，不被拘束，可以达到一种较为理想的演讲状态。

QZAudio超高传声增益语音处理的声学处理原理

1.讲演者发出的直达声（绿色线段）通过话筒拾音，到语音处理器处进行声纹记录后，由扬声器回放；

2.回放的声音（蓝色线段）会让讲演者听到，同时，也会回到拾音器端（红色线段）；

3.拾音器拾取到扬声器返回的声音，会和演讲者的新的声音一起送到语音处理器；

4.语音处理器将获取到的声音与事先保留的声纹记录比对，将扬声器返回的有记录的声音过滤，将拾音器拾取到讲演者新的语音内容旁路，输出到扬声器回放。

5.以上信号周而复始，系统自动判断讲演者的声音是有效声音，放过声闸，将有声纹记录的扬声器发出的声音进行过滤，使得系統不再产生反馈。

那么如何在声音发生反馈前进行干预呢，这就涉及到一种叫筛频的技术。筛频技术全称是智能反射筛查——IRS（Intelligent Reflection Screening）。其定义是：将拾音器拾取的声音信号进行波形比对，再进行时间判断，从而分辨出早期直达声和反射声，从而将反射声筛选出来。简称：筛频。

筛频技术可以应用于声学扩声环境的反馈抑制。尽可能不去拾取非早期直达声，从而达到抑制啸叫的效果。

与其它反馈抑制的技术相比较，筛频技术有个完全不同的解决思路。即其它技术都是在反馈发生后再去做后期弥补，而筛频技术是在反馈发生之前做预防，从而真正区别有效声和无效声，达到超高传声增益获得的远距离拾音的效果。而“语音处理器”就是筛频技术实施的载体。

除去这个反馈抑制的功能，“语音处理器”的其它功能结构与普通固定架构音频矩阵可以说是没区别的。也有均衡、压缩、矩阵，也有Dante扩展口用于远程传输。但是在用途方面，设计者已经缩小到只针对话筒进行优化处理，并且出厂前根据协议合作方的话筒参数进行优化，以此达到免调试的目的。

左图为普通传统拾音效果图，右图为使用语言处理器后的效果图。可以让普通心形鹅颈话筒轻松达到一米的拾音距离，使用户坐姿、侧身、立姿讲演扩声效果一样。

多场景应用满足多种语言扩声需求

“语言处理器”目前的设计场景在讨论会议室、演讲会议室、报告厅、教室等场景。可以与单只鹅颈、界面麦、纽扣麦、手拉手会议麦、吊麦、阵列麦等进行匹配工作。也可以将多只麦送入自动混音器混合后进行处理。

演讲已经是一种很普遍的活动形式，无论是会议还是活动现场，都会有演讲的环节。而演讲又是一种非常重要的场景，稳定的扩声系统是确保演讲顺利进行的一大保障。因此演讲台也成为了用户特别关注的扩声功能需求之一。但是演讲台高度固定，演讲者身高相差悬殊，嗓门音量区别更大。同时，很多演讲台都是布置在音箱前面，容易啸叫。“语言处理器”专门针对这个场景进行了优化，包括话筒处理、笔记本电脑音频接入、话筒对笔记本声音的动态优先、电脑信号的电噪声隔离等等。使得用户无需再担心此类场景的应用故障。

而话筒优先功能，也是“语音处理器”让会议进行变得更加人性化的特点之一。在过去的讨论型圆桌会议中，有一只主席单元负责维护发言秩序。但是它所有的手段只能是将发言者强行打断。显得不明主也不和谐。采用语音处理器进行会议管理后，主席單元（不限数量）对列席单元有优先权，主席单元讲话时，列席单元话筒音量降低一定值（可调），当主席发言结束时，列席单元话筒音量逐渐恢复到原始值。既显得明主，也无需关心技术操作。这个功能也同样适用于商场广播，当广播讲话时，音乐声降低音量。讲话结束，音乐声逐渐恢复。

有一个过去由于技术问题根本无法本地扩声的场景，就是视频会议和电话会议。由于需要拾音话筒的高灵敏度，传统技术本地扩声根本无法抑制啸叫问题。采用筛频技术的“语音处理器”很好地解决了这个问题，使本地发言和远程语音的信号一起从音箱中扩声出来，使得本地发言存在感获得极大体现。

让不懂音频的人也能做音频解放劳动力

“语音处理器”推出的核心目的就是让非音响专业的工程师和设计师能够随心所欲设计和轻松实施语言扩声项目，使语言扩声不受声学环境建设和调试技巧的限制，以一个可预测的扩声结果和工作量解放劳动力，降低人力资源成本。这对企业来讲，降低运营成本未免是一件值得庆幸的事。但对具备专业音频工程和调音技术的工程师来讲，“语音处理器”的出现，有可能会对他们造成一定的危机。不过现在担心有点为时过早，“语音处理器”是针对语言类扩声推出的产品，目前也是在小范围应用中，是否真的会动了调音师的奶酪，也需要等待市场的验证。

QZAudio语音处理器推出市场后，目前已经投入使用的用户有企业视频会议室、企业培训室、大型报告厅、酒店流动会议、学校会议室、教室等等。在这些项目上，非常有效的提高了话筒的拾音效果，明显提升了拾音距离和扩声音量，获得用户的一致好评。

未来，在进一步累积话筒数据的基础上，深圳奇正设计顾问公司将逐渐扩大推广范围，尽量将此产品应用到更多的工作领域。也让我们期待这款产品能够应用到更多的场景去，让语言扩声变得更加方便。

不啸叫、无噪声、免调试？这款“语音处理器”skr什么厉害东西？

多场景应用 满足多种语言扩声需求

让不懂音频的人也能做音频 解放劳动力

多场景应用满足多种语言扩声需求

让不懂音频的人也能做音频解放劳动力