跨境电商平台产品文本翻译器设计构想

2016-02-07 02:51周静梁敏洁
广东开放大学学报 2016年6期
关键词:壳体语料库跨境

周静 梁敏洁

(广东农工商职业技术学院, 广东广州, 510507)

跨境电商平台产品文本翻译器设计构想

周静 梁敏洁

(广东农工商职业技术学院, 广东广州, 510507)

产品在跨境电商平台进行销售时其文本翻译质量至关重要,但译本同质化、可读性弱以及实时更新慢等问题仍需解决。目前,使用机器自动翻译技术和开发网络垂直翻译服务是跨境电商平台解决用户交流障碍的方案。而将机器翻译与语料库翻译结合,设计产品专业领域的便携式翻译器,是平台个体卖家用户进行产品翻译和即时交流辅助的有益尝试,同时也为人机互动的翻译模式在产业领域的实践提供新的思路。

跨境电商;产品翻译;技术;翻译器

《国务院关于新形势下加快知识产权强国建设的若干意见》中明确提出“有效促进知识产权创造运用,保障和激励大众创业、万众创新,为实施创新驱动发展战略提供有力支撑”[1]。在以“互联网+”为核心的新一轮大众创业中,跨境电商网络贸易是国家重点发展的项目,也是让“中国创造”走向世界的新途径,因此这一平台上文字宣传的重要性不言而喻。国内跨境电商卖家对于平台产品英译的重视度和实践度总体亟需提高,除使用语言普及性等客观因素外,一味追求产品快速上架和平台流量、过分依赖在线翻译软件的文字拼凑,以及认为堆积产品图片能解决文字描述缺陷的观念,都影响到众多商家对于平台产品外文宣传质量的重视程度。

在跨境电商平台国际化的信息流建设过程中,采用基于大数据的成熟机器翻译技术,开发结合翻译技术辅助工具和众包模式的垂直网络翻译服务,能比较有效解决平台商品数量巨大,产品信息更新频率高的问题。此外,借助现有技术设计便携式产品翻译器,通过数据库更新、语音翻译、输入文字与扫描翻译以及搜索词获取等操作功能的实现,也有可能为平台卖家提供产品翻译的解决方案。

一、跨境电商平台产品文本翻译现状简析

跨境电商平台建设理念是借助信息科技,帮助企业产品进行全球销售,其平台的搭建除了有赖于良好的物流网络和支付渠道,国际化的信息流建设也同样重要,而翻译在其中就扮演了至关重要的角色。跨境电商作为现代的营销媒介,其平台产品文本语言专业性强,表现形式多样,突破了传统单一静态产品文字展示方式,将产品文本音频和视频等媒介结合起来的呈现方式,丰富了文本的表现形式,给网络用户带来更为直接的阅读互动感受。除此之外,这一类文本有别于其他类应用性文本在于其商品数量巨大,种类繁多,产品信息更新频率高,文本描述销售指向性强。大部分平台商家都希望在保证成本控制和翻译时效的前提下通过良好的文本宣传和展现,产品能够在眼花缭乱、竞争激烈的市场中脱颖而出,得到消费者的青睐,成为“热门商品”和“爆款”品。

目前,跨境电商平台产品文本翻译总体仍存在不少问题。一是整体翻译宣传意识不足,翻译质量参差不齐,总体表现为译文可读性不强,这是应用文本翻译类型中一直较为常见的现象。产品英译的可读性是基础性的语言规范,其具体表现为合乎语法、习惯、合乎文体的需要。许多跨境电商平台卖家对于产品外译文字可读性重视度不够,部分原因是目前其主要贸易方是来自发展中国家的客户,自身对译本文字的精确性敏感度不高;更多的是因为企业自身因素导致产品翻译出现词不达意、逻辑结构混乱、错译漏译和可读性差的现象。二是单纯照搬他人产品译本,导致自身产品描述差异化不足,无法让自身产品从众多产品中脱颖而出。一些大的跨境电商平台由于重视产品翻译,加大在资金、人力和技术方面的投入提升产品翻译质量,并逐渐积累不少具有一定参考性的产品翻译平行文本语料库。而一些中小企业在自建跨境电商平台时,常常会照抄现有平台同类产品文本翻译内容,或仅在此基础上做有限修改,这样的结果是自身产品同质化描述严重,更新速度慢,无法有效让潜在客户通过搜索方式寻找自己的产品,其结果是商家放弃提高产品翻译质量的努力,更多的是以价格战和平台推广等渠道来达到宣传产品,提升销量,这为跨境电商平台产品文本翻译产业带来发展机遇和挑战。

二、技术在跨境电子商务平台翻译产业的发展简述

跨境电子商务所具有的“全球性、无形性、匿名性、即时性、无纸化”的特点决定了各大平台用户在对自身产品进行翻译时,需要综合考虑翻译技术、翻译成本和翻译效率等多方面的因素,这需要新的解决平台翻译的思路。

目前,国外知名的跨境电商Rakuten, Etsy,亚马逊和ebay等企业主要采用微软和Google等公司的机器翻译服务进行产品信息互动交流。以上述为代表的科技公司具有研发和企业服务的传统优势,能为用户提供可靠的产品翻译解决方案,例如,微软公司基于云计算API技术的Microsoft Translator[2],能将现有的数据进行整合,根据不同行业定制专有语料库,并通过拓展翻译功能为电商平台用户提供浏览器翻译功能,提升平台产品文本翻译的时效。同时,其在语音翻译方面取得的突破也为电商平台的实时翻译沟通提供可能;再如,谷歌翻译从基于短语的机器翻译(PBMT: Phrase-Based Machine Translation)模式发展到如今的谷歌神经机器翻译(GNMT:Google Neural Machine Translation)系统[3],能有效地减低翻译误差,同样能给包括电商平台产品简介这样的应用性文本带来很好的翻译体验。

区别于国外电商平台采用第三方公司机器翻译(Machine Translation)解决方案的思路,国内的跨境电商企业则更多倾向于借助技术搭建翻译服务平台的方式,从技术和管理两个方面同时入手解决中小企业参与跨境电商贸易的语言障碍。例如,阿里巴巴集团在2015年收购了365翻译后[4],将传统语言服务和众包翻译模式进行整合,搭建了垂直的在线翻译管理平台。这是一种将语言服务企业和人才聚拢,通过服务流程的管理合理优化,加快机器翻译辅助下的人工翻译效率,提升平台产品简介和客户互动质量的经营模式,这种“机器翻译+人工翻译”的模式将直接推动翻译产业新生态体系的建立,并有助于解决互联网时代跨境电商平台的翻译存量市场需求,而且还有可能通过这种服务创新刺激增量翻译需求的产生。

三、跨境电商平台产品样本翻译器设计可能性探讨

目前对于国内电商平台卖家而言,使用最新的机器翻译技术和平台翻译服务仍处于体验培育阶段,许多商家在进行产品简介翻译时,还是主要依赖于使用电子在线词典等外文查询工具。传统的电子词典和在线翻译工具的设计主要基于规则计算的机器翻译理念,可以满足一般字词基本义的查询,但在具体语境中的段落翻译方面效果欠佳,单纯依赖这些工具比较难以实现产品翻译质量的提升。因此,对于一些仍然使用电子在线词典等外文查询工具,实现产品文本语言自动翻译的卖家用户而言,使用将机器翻译与语料库翻译相结合的翻译器来进行本产品的相关外宣翻译或许是提高产品外宣翻译质量的路径选择之一。

随着技术和语言服务业的发展,将机器翻译与语料库翻译结合被公认为自动翻译研究真正的突破口。语料库是将海量的材料电子化语言进行储存,利用计算机运算功能进行语言统计、分析和检索,根据其使用用途可以划分为单语、双语和多语语料库,以及平行、对应和类比语料库等,在语言实证研究、词典编撰、翻译及语言教学等诸多方面都有比较好的用途。对于中英翻译实践而言,双语平行对应语料库最具有应用价值,它是由英文或者中文的原文文本和平行对应的译文文本构成,主要以句级为单位的双语语料文本。国内学者王克非[5]曾对其承担的大型地质科技领域的翻译项目进行统计,发现整个大约有三千万综合性字词的双语文本,是可以实现字级、词级和常用短语结构的直接对应的。通过对句级双语平行语料库的创建,能很好地提升后续翻译项目的效率。

在全球语言服务业大发展的背景下,目前国内不少大规模翻译企业在自身的翻译项目中积累了多个领域,容量以千万级字词以上为单位的双语对应文本素材。近年来,业界也出现了不少从事专业领域语料库回收应用及商业和研究推广的企业,将这些现有的专业领域语言资产应用于跨境电商平台产品样本英文翻译,设计一款基于现存产品描述双语规范数据的便携感应式机器翻译系统,以用于平台卖家产品的翻译与交流,具有一定的现实的可能性。

此类翻译器设计基本理念是以翻译实例数据库(Example-based)为基础,结合基于统计(Statistics-based)和基于规则(Rule-based) 机器翻译系统的特点,设计适用于跨境电商平台卖家产品英语介绍交互式翻译辅助器。它具有一定的便携性和美观性,同时能实现数据库的更新,以及语音翻译、输入文字翻译和扫描翻译等多项功能,从而提高产品上架的效率(设计思路见下图)。

图1 翻译器设计结构示意图

图2 背部结构示意图

图3 下壳体内部结构示意图

图4 下壳体结构示意图

(1、面板,2、触摸屏,3、外放孔,4、下壳体,5、USB接口,6、耳机孔,7、麦克风孔,8、挡板,9、键盘,10、滑槽,11、模式开关,12、摄像头,13、LED灯,14、背板,15、集成电路板,16、电池盒17、连接块。)

上述设计图的面板上嵌有一块电容式触摸屏,这种设计可以减少或者放弃使用外加触控笔来进行辅助操作,直接使用手指就可完成,提升了人和装置的交互体验感觉;触摸屏两侧设置有外放孔,面板内部在和外放孔相对应的地方安放有喇叭,面板背面还设置有两个滑槽,下壳体上端面上固定有两个连接块,卡在滑槽内使得面板和下壳体连接在一起,可通过滑动自由开合,方便调出键盘打字和使用完毕后隐藏键盘。下壳体上端面设置有键盘,底部固定有档板,与档板内侧边的形状和面板的边缘形状相匹配,在面板和下壳体合在一起时档板可有效地对面板起到定位作用,方便面板和下壳体进行频繁开合。档板上设置有麦克风孔,档板内部和麦克风孔相对应的位置设置有麦克风,而下壳体左侧端面上设置有充电和数据一体的USB接口和耳机孔,实现一个接口即可实现给电池充电和往装置内下载数据。下壳体右侧端面上设置有模式开关,可控制LED灯的亮灭,可以根据使用的时间和使用场地的光强,选择性的打开和关闭LED灯,从而保证摄像头的工作环境良好。集成电路板和电池放置在下壳体内部,电路板上设置有声音识别模块,这样就可以实现语音翻译,提高翻译效率。集成电路板和电池通过连接线连接在一起,背板固定在下壳体背侧,并设置有高像素摄像头和LED灯,可清晰的扫描分辨出文字类的信息并直接进行翻译。

从结构上看,翻译设计器的设计必须满足以下功能:前端的语料库使用与更新功能、机器搜索预处理功能、声感识别功能和优化提取功能。当跨境电商卖家使用此自动翻译器时,首先可以将语言词典等数据通过USB连接口下载至装置内。在需要输入文字翻译时,将面板和下壳体滑开,调出键盘即可打字。如果需要扫描翻译,根据使用的时间和使用场地的光强,通过模式开关选择性的打开和关闭LED灯,然后通过摄像头扫描翻译即可;当需要语音翻译时,对着麦克风说出需翻译语句即可,充电时将充电线插在USB接口处即可。这种翻译器装置外形美观,携带方便,可实现语音翻译、输入文字翻译和扫描翻译等多项功能,适用于跨境电商平台产品快速翻译和修改,有助于提高翻译效率,也比目前广泛用于英语学习中双语字词句查询的电子词典具有更有针对性的功能以及扩容性。

由于跨境电商网络平台中的搜索词的优化是提升卖家产品提升销售量的关键,相比通过给平台付费提高流量的做法,或者单纯依靠平台支持的通用翻译付费系统,卖家使用产品翻译系统能简化翻译过程,翻译器将翻译记忆技术和机器翻译技术二者结合,建设具有可读性强的产品英译语料库,实现文本语段发送至翻译记忆系统,由机器进行翻译预处理,然后再把翻译产品返回翻译记忆系统,最后得到有效的机器翻译匹配,便于买家再根据搜索词进行产品描述的优化,这样使用者可以迅速进入译后编译阶段,通过对自身产品简介文字的调整,实现与平台热门搜索词的匹配,便于买家快速进入产品链接。在此基础上,翻译系统设计可以实现数据库的实时更新,提升系统与不同组件的兼容性,使设计能从机器翻译走出实验室并迈向产业化。

对于广大平台商家而言,在有限的成本内积极提升产品翻译质量,培养良好的产品外宣意识并不容易,借助日渐成熟翻译技术与创新的平台翻译服务是一个较好的解决方案,而专业产品翻译器设计的应用也是一个可以探索的思路。值得注意的是,如何使产品结构中面板、下壳体、摄像头、键盘及数据和充电接口之间布局合理,满足键盘打字、数据传输等需要并节省空间实现美观;如何实现集成电路板中声音识别模块的设计,实现语音翻译;实现文字感应模块的设计,能清晰扫描分辨出文字类的信息,提高翻译效率,这都是在工业设计和应用过程必须考虑的实际问题。更重要的是,当前语言服务产业的兴起与语言技术和翻译技术的出现密切相关,传统的人工翻译模式在机器翻译的介入下边界日渐模糊,跨境电商平台产品文本翻译器的设计思考可以为人机互动的翻译发展在产业研发与实践方面开拓新的研究议题。

[1]国务院国务院关于新形势下加快知识产权强国建设的若干意见[国发〔2015〕71号][Z].2015-12-18.

[2]极客公园公众号(geekpark).探访:微软是怎么做机器翻译这件事的?[EB/OL]. http://www.geekpark.net/ topics/216547,2016-08-29/2016-09-28.

[3]美国研究生留学公众号.翻译界的重大突破!作为一个翻译,此刻我理解了18世纪纺织工人看到蒸汽机时的忧虑和恐惧![EB/OL].http://chuansong.me/ n/871150641725, 2016-09-28/2016-09-28.

[4]中国投资咨询网.阿里巴巴收购365翻译此次收购预谋已久[EB/OL]. http://www.ocn.com.cn/touzi/201508/miejc21114145. shtml, 2015-08-21/2016-09-20.

[5]王立非.语料库的缘起与概念——语言的翻译考察新途径[R].广东外语外贸大学翻译学研究中心学术论坛的主题发言,2016-11-02.

[6]高志军.计算机辅助翻译工具测评框架初探[J].中国翻译,2013,(5).

[7]徐彬,郭红梅.基于计算机翻译技术的非技术文本翻译实践[J].中国翻译,2015,(1).

[8]崔启亮,李闻.译后编辑错误类型研究——基于科技文本英汉机器翻译[J].中国科技翻译,2015,(4).

(责任编辑:楚和)

On the Design of Translation Machine for the Product Introduction on the Cross-border E-Commerce Platforms

ZHOU Jing LIANG Min-jie
(Guangdong AIB Polytechnic College, Guangzhou, China, 510507)

The product sales on the cross-border E-Commerce platforms largely depend on the translation quality, but in general, the problems of featurelessness, unreadability and low updating speed in the product translation remain unsolved. At present, cross-border E-Commerce platforms are working to remove the barriers of the language by the application of the sophisticated data-based translation technology and the development of vertical translation service network. Meanwhile, the design of portable translation machine by integrating both corpus and machine translation might also help individuals with product translation and instant communication, and inspire the development of human-machine interactive translation in the industry.

cross-border E-Commerce; product translation; technology; translation machine

TP391.1

A

2095-932x(2016)06-0107-04

2016年广东大学生科技创新培育专项资金项目“基于跨境电商平台产品样本翻译器设计与实现”(pdjh2016b0651);广州市社会哲学科学发展“十三五”规划2016年度课题“翻译叙事伦理研究”(2016GZGJ67)成果。

2016-10-20

周静(1979-),女,四川双流人,广东农工商职业技术学院副教授;梁敏洁(1995-),女,广东云浮人,广东农工商职业技术学院外语系。

猜你喜欢
壳体语料库跨境
减速顶壳体润滑装置的研制与构想
《语料库翻译文体学》评介
跨境支付两大主流渠道对比谈
在跨境支付中打造银企直联
关于促进跨境投融资便利化的几点思考
汽车变速箱壳体零件自动化生产线
基于PRO/E的防喷器壳体设计及静力学分析
锁闩、锁闩壳体与致动器壳体的组合装置、车辆锁闩的上锁/解锁致动器
基于JAVAEE的维吾尔中介语语料库开发与实现
跨境直投再“松绑”