林睿睿,黄锦桥
(陕西科技大学镐京学院,陕西 西安712046)
到目前为止,全世界共有200多个国家和地区,共有80余种民族语言,其中汉语、英语、俄语、法语、西班牙语是较为常用的语言[1]。语言是国与国之间、人与人之间交流的媒介和工具,一旦语言不通,就无法进行进一步的交流和合作。再加上,互联网和信息技术的发展,依靠专业的翻译人才进行转译已经无法满足交流的实时性需要,因此在线翻译辅助系统开始出现并被广泛应用。
在线翻译系统,也被称为机器翻译系统、自动翻译系统。目前,在很多文献中都将在线翻译作为研究课题。文献[2]基于实例设计了一种机器翻译系统,通过对比翻译对象与现有实例库内容之间的相似度进行参考翻译;文献[1]设计了基于多语言交互的英语翻译在线辅助系统,提高了多种语言翻译成功率。文献[3]设计了基于人机交互的网络化智能翻译系统。在该系统中采用主题词特征匹配方法实现网络化智能翻译,提高了翻译的智能性。
虽然现有的翻译系统有很多,但是交互性并不是很好,存在一定的滞后性和错误性,尤其用于不同语言口语交流时,语言组织更为随性,导致翻译系统并不能很好地理解其中的含义,从而需要时间进行语义分析,然后才能进行翻译,有时甚至因为语义理解错误而导致翻译错误。
针对上述问题,本文设计一种基于B/S(Browser/Server)框架的交互式在线翻译系统,该系统设计分为框架设计、硬件设计、软件设计以及系统测试等四部分。最后经测试,证明了所设计系统的翻译准确性和及时性,提高了交互体验,为人与人之间的交流提供有效的媒介,促进了国家之间的合作与发展。
语言的不同是阻挡人与人之间交流的主要障碍,但随着经济全球化的发展,各国之间的联系逐渐加强,这种障碍必须打破[4]。在此背景下,各种辅助型的自动翻译系统被设计出来,并被广泛应用在社交场合。由于自动翻译系统是通过计算机进行翻译的,不同于人一样具有灵活性,因此翻译的内容经常出现错误,尤其是人与人之间通过口语交流时,这给翻译系统又增加了语音识别和语义分析两个方面上的障碍,更影响了机器翻译系统的翻译效果[5]。为了提高系统的交互性能,准确且及时地进行不同语言之间的交流,设计一种有效的在线翻译系统迫在眉睫。在前人研究经验的基础上,本文以B/S三层架构为系统框架,设计了一种交互式在线翻译系统。
系统框架是系统设计的基本组成结构,在系统设计中起到指导思路的作用。本次设计的交互式在线翻译系统框架是基于B/S架构设计的。B/S架构是一种三层架构,由数据逻辑层、业务逻辑层和显示逻辑层组成,如图1所示[6]。
图1 B/S三层架构图
数据逻辑层:整个系统的最下层,主要用于储存数据和各种业务程序[7]。在本系统中,主要存储各个语言信息和各种翻译程序。
业务逻辑层:整个系统的中间层也是核心层,主要作用是处理用户请求,对数据层进行操作、运行各种业务流程,得出翻译结果。
显示逻辑层:整个架构的最上层,主要作用是实现人机交互,也就是将翻译成果反馈给用户,或者是用户输入操作指令,控制系统运行等[8]。
本系统硬件大致可以分为三部分,即源语言采集处理部分、语言翻译部分以及目标语言输出部分。
1.2.1 源语言采集处理硬件
源语言采集处理部分的关键硬件有两个,即话筒、语音信号处理器。
1)话筒主要作用是采集用户发出的源语言。话筒直接关系到采集的语音信号质量,进而影响翻译是否准确,为此本系统选择一个具有高录入性且便于随身携带的SHUREMV7话筒[9]。其具体性能如下:
将拾音头、拾音模式和减震架巧妙组合,让语音始终干净清晰,阻隔任何多余的噪声干扰,即便在嘈杂的环境中,也能拾取干净的声音。
同时兼备USB和XLR输出接口,可配合电脑和专业音频接口使用。
设置触摸屏,可直观观察到话筒是否正在工作,并可快速滑动调整话筒增益、耳机音量、监听混音、话筒静音、锁定功能等。
2)语音信号处理器的作用是对采集到的源语音进行处理和识别。该处理器集滤波、放大、转换、识别等功能为一体。本系统中的语音信号处理器为WT7010,其内建8 bit DSP核心,能提供高分辨率ADC模拟采样和高质量的差分音频输入[10]。
1.2.2 语言翻译处理设备
用于语言翻译处理的设备是一台单片机。由运算器、控制器、存储器、输入输出设备等一系列硬件组件构成,相当于一个微型的计算机。本系统当中的单片机为ATmega6490单片机,该单片机实现了接近1 MIPS/MHz的吞吐量,平衡了功耗和处理速度,因此高性能、低功耗是其最大的优势[11]。ATmega6490单片机技术参数如表1所示。
1.2.3 目标语言输出设备
目标语言输出设备是系统末端硬件,主要作用是将翻译结果反馈给用户,其中包括语音合成芯片、功率放大芯片、驱动扬声器、液晶触摸显示器等四部分。下面进行具体分析[12]。
1)语音合成芯片
语音合成芯片的作用是实现文本到语音的转换,然后驱动扬声器发声[13]。本系统当中的语音合成芯片为SYN6658。
表1 ATmega6490单片机技术参数
SYN6658优点如下:采用高效的压缩编码方式,合成音频的音质完美;采用智能的文本韵律处理方法,文本朗读顺畅;支持G82312、GBK、BIG5、UNICODE四种编码方式的文本;支持多种文本控制标记,具有智能文本分析处理算法。
2)功率放大芯片
功率放大芯片的作用是将输入的较微弱信号进行放大,提高后期扬声器声音播放质量。本系统当中的功率放大芯片为LM1875,具有低失真、工作稳定可靠、外围电路元件少、电流负载能力大等特点[14]。
3)扬声器
扬声器的作用是播放翻译出来的目标语言。本系统当中的扬声器为A500,其特点如下:内置两颗单独通道功放减少底噪,使扩音效果更加清晰,声音还原真实、不刺耳;内置1 500 mA·h大容量电池,可连续工作10 h;90°×60°(可旋转号角)覆盖角度,使得周围的人都能接收到声音。
4)液晶触摸显示器
液晶触摸显示器的作用是显示翻译处理结果。本系统当中的液晶触摸显示器为M1502E,其特征如下:分辨率为4 096×4 096;反应时间<5 ms;表面硬度为3 H;点击寿命为250 g粒度,3 500万次;笔划寿命为250 g粒度,500万次;透光率81以上;工作温度为-20~70℃。
系统软件是系统的逻辑运行程序,包括系统处理事务的各种功能模块。整个交互式在线翻译运行程序主要分为三部分,即源语言采集处理子程序、目标语言翻译子程序、目标语言反馈子程序。下面对上述三个子程序进行具体分析[15]。
1.3.1 源语言采集处理子程序
源语言采集处理子程序是整个系统最开始运行的子程序,主要包括采集、放大、滤波、转换、特征参数提取、识别等环节,具体过程如图2所示。
图2 源语言采集处理子程序
1.3.2 目标语言翻译子程序
目标语言翻译子程序是系统运行的核心,其任务是将采集到的源语言翻译成目标语言,具体过程如图3所示。
1.3.3 目标语言反馈子程序
目标语言反馈子程序是系统的最后一个运行环节,主要任务是将翻译过来的目标语言以语音的形式反馈给用户。这一过程具体输入目标语言文本,其次按照从词典中选择的语言规则自动地将目标语言文本转换成连续的语音声波,接着对合成语音中的韵律进行调整,按照语序连接规则把这些波形拼接起来,使之成为连续语音,最后利用扬声器进行播放,完成用户之间的语言交互[16]。
为测试设计系统的翻译性能,以引言中前人研究设计的三种翻译系统进行对比,并进行仿真测试,以便在测试过程中发现系统设计中存在的漏洞,进行改进和优化。
图3 目标语言翻译子程序
所设计的基于B/S框架的交互式在线翻译系统需要处理庞大的语料,故需要足够的软件环境和硬件配置提供运算能力,本系统的环境配置如表2所示。
表2 系统运行环境
实验采用的测试样本共有三篇,分别为汉语、英语、法语对话,其样本内容如图4~图6所示。
图4 中文样本
将三种样本语言相互翻译为另外两种语言,也就是翻译成汉英、汉法、英汉、英法、法汉和法英等六种源语言——目标语言测试样本。
图5 英文样本
图6 法语样本
1)BLEU
通过BLEU(Bilingual Evaluation Understudy)能够算出比较译文和参考译文之间n组词相似的占比,取值范围在[0.0,1.0]之间,如果两个句子完美匹配,那么BLEU是1.0,反之,如果两个句子不匹配,那么BLEU为0.0。由此可知,越接近1.0,翻译质量越高,交互越准确。
2)在线翻译速度
在线翻译速度是用来评估系统翻译一篇文章的快慢,速度越快,交互越及时。
系统翻译性能测试结果见表3,表4。
表3 BLEU指标测试结果
表4 在线翻译速度指标测试结果 b/s
从表3和表4中可以看出,利用不同系统对三种测试样本进行翻译,得出本文系统的BLEU指标值更大,翻译速度更快,解决了当前翻译系统翻译滞后性和错误性问题,提高了与用户之间的交互性。
综上所述,随着世界各国之间的联系不断加强,语言系统不同成为各国之间交流的主要障碍,为此,研究一种基于B/S框架的交互式在线翻译系统。基于B/S框架的逻辑层完成硬件、软件的设计,通过实验证明该系统能够实现多种语言之间快速且准确的翻译,提高了交互性能。然而,本系统主要针对汉语、英语和法语之间的翻译,适用性还有待进一步扩展。