邓城 张钦锋 詹宏林 麦强
摘要:针对会议中采用的同声传译系统存在设备铺设麻烦,信号受到干扰重叠或用户数量有限等问题,根据会议同声传译系统在室内使用的特点,提出利用照明LED光源进行可见光通信来实现信号的传输。综合利用,STC单片机、LED驱动电路,LED灯、光电传感器,蓝牙模块和树莓派等硬件模块,通过科大讯飞开放平台进行语音识别、转写、机器翻译,实现了中英同声传译功能。通过实验对系统可靠性进行了验证,系统能够准确进行语音翻译,并通过LED灯将信息发送至接收端,完成同声传译功能。
关键词:LED可见光通信;机器翻译;语音合成
中图分类号:TN929 文献标识码:A 文章编号:1007-9416(2019)11-0025-02
0 引言
随着国际文化交流日益频繁,各国语言存在差异,翻译人员的需求剧增,而人工智能的高速发展,机器翻译的准确率越来越高,利用语音转写与机器翻译可以实现同声传译的功能。
目前会议采用的无线同声传译系统的通信方式主要有红外辐射式、蓝牙传输式和射频发射式。但由于在会场场地限制下,存在着安装、调试很不方便,R容易被干扰,无法大量用户同时使用等问题。
本文根据同声传译会议系统的特点和应用范围,提出利用会场照明LED灯进行通信的新方式,设计一套采用LED可见光通信技术的会场同声传译系统。利用科大讯飞平台,实现人工智能同声传译,减少了对翻译人员的依赖,并用了LED可见光通信技术,通过LED灯光进行高频闪烁,进行数据的传输。因为闪烁频率高,人眼无法识别,所以LED灯在正常照明的同时,还是实现了通信的功能。同时用户只需要在灯光能照到的地方就可以接收到信号,实现了大用户量实时通信,参会人数不受限制,可广泛应用于各种会议现场,具有一定市场前景。
1 系统工作原理与设计方案
1.1 系统工作原理
基于LED可见光通信的中英同声传译系统是发言人通过麦克风说完一句话后,翻译器会将发言的语音翻译成中文或者英文的文本,并通过无线通信发送至会议室顶端的LED灯具,再以二进制形式通过LED灯光发送。听众戴上安装有接收器的耳机,在会场LED灯光照射范围内就可以接收到信号,通过接收器解码和语音合成后还原出中文或者英文的语音信号,并利用按键来选择播放中文或者英文。
系统工作原理示意图如图1所示,主要由语音采集及人工智能翻译,LED可见光通信信号发射,光信号接收与语音播放三个部分构成。
语音采集及人工智能翻译的工作原理是基于科大讯飞开放平台进行语音翻译,通过麦克风接收语音信号,将语音信号转换为文本,再通过机器翻译转换为对应的中英文本。
LED可见光通信信号发射的工作原理是通过微控制芯片来控制LED灯,以每秒数百万次的闪烁,其中灯亮代表1,灯灭代表0。将文本以二进制形式编码调制成灯光信号,从而进行有效的中文和英文的文本传输了。
光信号接收与语音播放的工作原理是通过光电传感器接收LED灯的光信号,并将光信号转换为电信号,经过信号处理后,进行语音合成播放。
1.2 系统设计方案
根据系统的工作原理,将系统框架分成了语音处理与翻译端、LED可见光通信发射端,光信号接收与播放端,如图2所示。
语音处理与翻译端是通过树莓派3B+将麦克风的语音信号录制为WAV格式,并将音频文件上传至科大讯飞开放平台,通过平台将语音转换为文本,再将文本进行机器翻译为目标语言文本,最后通过蓝牙将文本发送LED灯具。
LED可见光通信发射端是通过蓝牙模块接收语音处理与翻译端的文本信息后,利用单片机进行编码,并通过驱动电路将信息调制到LED灯光进行发射。
光信号接收与播放端是通过PIN光电二极管将LED灯光信号转换为电信号,再进行IV转换放大比较处理,通过单片机进行解码,并将用户选择的语言文本送到讯飞SX-TTSCv4.0语音合成模块进行语音合成播放。
2 系统软件设计
2.1 语音翻译处理流程
语音翻译部分主要流程如图3所示,首先树莓派初始化,扫描录音按键,判断录音键是否按下,如果按下开始录音,反之继续判断。录音完成后,判断按键1(中文转英文)和按键2(英文转中文)是否按下,如果按下开始转换并从串口发送数据,反之就继续录音直到按键按下后结束(最长时间为1分钟)。
2.2 语音转写处理流程
语音转写流程图如图4所示,首先调用预处理接口,上传音频文件的基本信息、分片信息及相关的可配置参数。调用成功,返回任务ID。预处理成功,调用文件上传接口。
按预处理设置的分片信息依次上传音频切片,直到全部切片上传成功;上一切片成功上传,才可进行下一切片的上传操作。调用过程中若出现异常,可重试若干次。
全部文件切片上传成功后,调用该接口,通知服务端进行文件合并与转写操作。该接口不会返回转写结果,而是通知服务端将任务列入转写计划。转写的结果通过getResult接口获取。
2.3 机器翻译处理流程
机器翻译流程图如图5所示,首先通过接口密钥基于hamc-sha256计算签名,将签名以及其他参数放在Http Request Header中,请求参数以及图片数据放在Http Request Body中,以POST表单的形式提交,向服务器端發送Http请求后,接收服务器端的返回结果。
3 系统测试分析
为了验证发送端串口通过LED灯光发送的数据与接收端接收的数据是否一致,采用示波器测试发送端的串口发送数据的波形,再与接收端发送到科大讯飞语音芯片上的波形进行对比,并且通过扩音器来验证播放的语音。如图6所示,为发送和接收端的示波器波形图,可以发现发送端与接收端的数据波形是一致的,而且语音合成芯片成功播报出对应的语音。
4 结语
本设计方案提出了一种能应用于室内会议场所的同声传译系统,该系统通过LED可见光通信进行数据通信,解决了现有系统安装调试麻烦,用户数量有限的问题。通过对系统的工作原理分析,设计了一套完整的系统方案和系统软件。通过实验验证了收发数据的一致性,该方案可以有效完成中英翻译播放功能,并且实现了LED兼顾照明的同时完成通信功能,具有一定的市场应用价值。
参考文献
[1] 麦强,卓惠佳,廖晓琳,刘洋.可见光通信调光技术研究[J].中国新通信,2018,20(24):16-18.
[2] 于正永,唐万春.一种全双工VLC无线导览系统的设计及实现[J].无线光通信,2017(10):37-41.
[3] 王浪.室内可见光通信LEDs选择及调制技术的研究[D].长春:吉林大学,2017.