提 要 中国语言产业的历史进程可概括为三次浪潮:第一波约始于1990年,是传统语言产业的快速增长期;第二波约始于2000年,是语言信息技术产业的兴盛期;第三波约始于2010年,是“语言信息技术平台(互联网、智能手机、语言智能)+语言产业”的发展期。三次浪潮前后呼应、彼此融合,每一波发展都以某种方式汇入新的浪潮之中。第一次浪潮主要由社会开放所致,第二、三次浪潮则为语言信息技术革命所引领。未来语言产业将是“人工语言智能+语言产业”的时代。
关键词 当代中国语言产业;传统语言产业;语言信息产业;智能语言产业
Abstract Chinas Language Industry has witnessed three waves of development in the past three decades. The first wave appeared in around 1990, a time when the traditional Language Industry experienced a rapid expansion. The second wave started in around 2000, a time often seen as the rise of Language Information Industry. The third wave arrived in around 2010, a period when “language information technology platforms” (e.g., internet, cell phones and language intelligence) became a major media for press, education and speech synthesis. The three waves are three continuous developmental phases, showing the upgrading trajectory of the language industry in China. With regard to the driving forces of such developments, this paper contends that the first wave can be attributed to the opening up of the Chinese society, while the second and the third waves are the results of the revolution of Language Information Technology. It is predicted that the next phase in China will be “Artificial Intelligence plus Language Industry” .
Key words contemporary Chinas Language Industry; traditional Language Industry; Language Information Industry; Intelligence Language Industry
一、前言:中國语言产业的兴起
在国内,大约自2010年起,语言产业概念开始引起比较广泛的关注。我们把语言产业概念初步界定为生产各种语言产品或提供各种语言服务的规模化的产业形态。语言产品则是以语言为内容、材料,或是以语言为加工、处理对象的产品形态。目前,较为典型的语言产业业态主要包括语言翻译、语言文字信息处理、语言培训、语言出版、语言能力测评等(贺宏志、陈鹏 2012)。在德国语言技术中心(The Language Technology Center)提供,欧盟翻译总司2009年发布的《欧盟语言产业规模研究报告》(Study on the Size of the Language Industry in the EU)中,语言产业业态主要包括8个领域:笔译、口译、语言技术工具、语言教学、字幕翻译和配音、软件本地化、网站全球化和会议组织及咨询,其概念内涵是以语言翻译及本地化服务为核心。本文采用的则是以语言产品供给为核心的外延更加广泛的语言产业概念,它在逻辑上包含相关的所有业态。
从语言产业研究的角度看,语言产业及其相关的语言服务概念兴起于欧美。1999年1月美国语言学学会第73届年会的主题定为:“语言事业:未预料到的机会”(Linguitic Enterprises: Unexpected Opportunities)。在此次年会上,斯坦福大学语言学教授、语音学家Williame Leben做了题为“命名产业”(The Naming Industy)的专题学术报告。美国语言行业协会(the Association of Language Companies,ALC)于2004年起发布年度语言服务行业调查报告。美国卡门森公司(Common Sense Advisory,CSA)自2005年起发布《语言服务全球市场年度报告》(Annual Survey on the Global Language Services and Technology Market),据2005年年度报告显示,当年全球外包语言服务市场总额预计达88亿美元,报告按年均增长率7.5%估算,2006年将达90亿美元,2010年将达120亿美元。报告发布了全球35强语言服务企业名单及其简介,中国的海辉公司、统一数位翻译和传神联合信息技术公司榜上有名。在欧洲,瑞士语言经济学家弗朗斯瓦·格林教授及其团队2008年的研究表明,语言产业每年为瑞士约创造500亿瑞士法郎的收入,约占瑞士国内生产总值的10%。瑞士有着独特的语言政策和语言环境,德语、法语、意大利语、罗曼什语四种语言都被认定为官方语言,瑞士还是众多重要国际机构的所在地,巨大的语言需求促成了这样的产业规模(李宇明 2012)。《欧盟语言产业规模研究报告》显示,2008 年欧盟成员国的语言市场总产值达84 亿欧元,该报告当时预测,欧盟2015年语言市场产值可达到165 亿欧元。①
从实际的语言经营活动来说,语言培训、语言出版、语言翻译、语言测试早已有之,但国内这些经营活动开始被称为规模化的语言产业,应该是在20世纪90年代之后。概念反映总比实际事件要滞后一些,从21世纪起,这个业态系统开始作为语言产业引起人們的关注,国内开始有人提及语言产业的概念。2010年前后语言产业概念开始受到较大范围的关注,一些研究机构成立,一系列研究成果产生(李宇明 2004;黄少安等 2012)。这在一定程度上是因为受到了国外数据信息输入的影响,但在根本上是国内语言产业发展到一定程度的自然结果。随着改革开放的历史进程,语言的基础性地位、社会文化地位以及市场地位日益突显,各方面的语言需求被激发出来,中国规模化的语言产业才得以呈现。概括起来,主要有以下几个方面:
其一,社会的开放与流动激发语言需求。新时期以来中国社会进入一个全新的快速发展期,随着社会开放程度和活跃程度的加强,语言在社会交往和经济发展中的作用日益突显,开放、流动的社会对个人和团体的语言交往不断提出新的要求。
其二,市场化进程促使语言能力成为一种重要的竞争力。从个体说,语言技能成为一种重要的人力资本,它是个体职业竞争力的重要组成部分。从企业说,语言能力(企业的命名、宣传、网站、广告语言设计、说明书等)是一个企业的重要竞争力(徐大明 2010)。
其三,语言类考试的刚性地位决定了语言经济活动最基本的市场地位。在新的职前职后教育体系中,语文、英语以及其他语言类考试占有相当重要的地位,考试结果直接关乎升学、就业、升职、出国等,由此带来强劲不衰的语言学习需求。夸张一点说,改革开放以来第一轮语言产业的兴起就是由两类语言考试决定的,一类是与升学有关的中高考中的语文、英语类考试;一类是与出国有关的托福、GRE、雅思等考试。
其四,国际化、全球化进程激发外语需求。随着全球化进程的不断深入,各种形式的跨国交流日益频繁,多语交际能力已成为国家、单位和个人语言能力的重要组成部分。个人和单位出国学习、工作、交流、旅游等需求不断增加,逐渐引发了一个包括语言培训、语言翻译、语言出版、语言测试等业态的具有相当规模的语言产业。
其五,信息化导致新型语言产业的兴起。语言技术特别是语言信息技术的发展,改变了语言学习和应用的传统方法,造就了新型语言产业,使语言产业可以在全新技术平台上实现新的整合和繁荣。
其六,综合国力的提升促使汉语的国际化需求迅速增长。海内外以汉语为母语的人大约有13亿,汉语是世界上使用人口最多的语言之一,中国综合国力和国际地位的提升,使汉语具有更重要的文化地位和经济地位,越来越多的外国人、外国企业开始重视汉语。汉语水平考试已成为世界上最重要的第二语言或外语水平测试之一,美国等许多国家已把汉语作为主要外语纳入国民教育体系。
上面的因素聚合起来,加上国内的人口规模和市场规模,中国语言产业的兴起和持续增长就成了必然。其中,全球化(多语需求)和信息化(语言技术进步)是两个最重要的引擎(李宇明 2011)。
值得注意的是,从全球视野看,并非先有一个全球的语言产业,然后中国的语言产业才在它的刺激和影响下兴起,实质上是,伴随着中国社会、经济的市场化、全球化、信息化进程,中国语言产业的兴起势在必行,中国的市场地位、市场规模以及汉语人口、汉语文化的地位就决定了中国语言产业的市场地位。当然,我们并不否认国外语言产业和语言服务业对中国语言产业的积极影响。
近30年,中国语言产业的发展势头一浪高过一浪,表现为三次浪潮。三次浪潮不同于三个发展阶段,它们是前一波推着后一波,后一波在某种程度上叠加了前一波的内容,或者说每一波都以某种方式汇入到新的浪潮之中。
二、第一次浪潮(1990年起):传统语言产业的发展
传统语言产业业态主要包括语言培训(面对面课堂培训)、语言出版(纸质图书)、语言翻译(人口翻译)、语言测试(卷面测试)等,它是指语言信息技术广泛应用之前的语言产业形态。改革开放以后,市场经济快速发展,对外开放程度不断增加,个人和单位的各类语言需求被空前地激发出来,因而导致了中国语言产业的第一波发展,这一波发展的主体是传统语言产业。在这一波发展中,外语需求最为显著:一类是个人的外语学习和外语考试需求,它的目标是提升个人的外语能力;一类是企业的外语需求,无论是中方企业“走出去”,还是外方企业“走进来”,都需要专业的多语种服务。以下分别从培训、出版和测试三个方面加以扼要说明。
(一)语言培训
自1990年以来,在培训需求的不断刺激下,中国培训市场产生了多元化的产品结构,以语言培训、电脑培训和中小学生课外培训为三大支柱。中国语言培训自20世纪末开始进入快速增长期,比如,外语培训第一企业的新东方教育科技集团于1993年11月成立;1994年,李阳创办国际英语推广工作室,开启了“疯狂英语”的培训产业进程;著名英语培训机构华尔街英语于2000年进入中国培训市场。1995年以后,语言培训业市场规模每年以20%左右的速度递增;2010 年,中国语言培训行业产值已达 300 亿元,到 2016 年中国语言培训行业产值超过800亿元。①
新东方的发展历程可以看作语言培训在这一波发展中的缩影。1993年俞敏洪创办了北京市新东方学校。1995年底新东方学员突破1.5万人次。1998年新东方英语人才培训体系初具规模并建立实用英语学院。到2000年,新东方学校就已经占据了北京约80%、全国50%的出国外语培训市场。2003年成立新东方教育科技集团,2006年在纽约证券交易所正式上市,成为中国大陆在美国上市的第一家教育培训机构。
(二)语言出版
语言出版的快速增长也出现在20世纪90年代后半段。外研社是中国最大的外语出版机构,也是全国规模最大的大学出版社,被认为是“英语图书市场上真正意义的产业领导者”,其出版地位很大程度上就是靠这一阶段的迅猛发展来奠定的。从1991年到2005年,外研社发行码洋从1000多万元增长到13亿元。目前,它旗下有九大分社、12个独立法人企业,以及分布全国的16个信息中心。《英语周报》的辉煌历程更是报业出版的一个传奇,这个诞生于山西师范大学的曾经的英语小报,自20世纪90年代以后,每年的发行量都上一个新台阶,1995年他们在同行业中率先自办发行网络,创新发行体制,至2000年它的期发行量已突破千万。2006年,《英语周报》达到1600多万份的期发行量巅峰,此后开始下降。同样诞生于山西师范大学的《语文报》系列产品覆盖了语文教学的各个层次,它鼎盛时期的期发行量也逾500万份。综合书、报、刊,保守估计,2005年全国语言出版的产值应该接近100亿。
(三)语言测试
由于升学、出国、评职称等的刚性需求,相关语言测试也就越来越火爆。托福、雅思、GRE等在中国市场不断膨胀;英语四、六级的考生规模也是逐年递增。同时,随着中国经济实力的不断提高以及“软实力”的增长,“汉语热”开始在全世界范围流行开来,对外汉语测试也发展迅速。可以说,各种语言测试的不断发展催生了一个新型测试产业。
据《中国教育考试年鉴》,“十一五”规划(2006—2010)期间,参加海外考试的考生达到455万人,相当于 “十一五”规划前整个海外考试历年考生人数总和的1.4倍。以雅思考试为例,自1989年雅思进入中国,迄今已28年,参加雅思考试的中国考生数量逐渐递增(见图1)。据统计,2013年共有超过35万人次在中国参加雅思考试。
另一个大规模的英语类考试是大学英语四、六级考试,该考试于1987年开始,当时每年只有10万人次,至2000年就已发展到500万人次,2010年接近1800万人次。与此同时,海外汉语水平测试(HSK)的规模也逐年增加:2008年,海外考试规模为67 558人次,到2009年为76 088人次,增长幅度为12.63%(罗民等 2011)。
总体上说,传统语言产业的这一波发展浪潮大致起于1990年,在2005年前后达到高峰。之后,它虽然仍有一定的规模性增长,但从宏观上来看,传统形态的语言产业已经增长乏力,如纸质出版、面对面的课堂培训、人工翻译以及卷面测试等产业形态已经不可能对语言产业的内部结构产生根本性影响,也很难激发出新一轮的语言需求。
语言产业的发展并未止息,与这一波浪潮相隔不久,由于语言信息技术的全面开发和应用,语言产业很快迎来了新的兴盛时期。
三、第二次浪潮(2000年起):语言信息技术产业的兴盛
中国是幸运的,近30余年中国产业的发展赶上了信息化和全球化双重历史机遇,在这个历史进程中,信息技术和信息产业塑造了全球产业的基本结构和总体走向。对于语言产业来说,信息技术的影响直接且深刻,因为任何一种语言技术都是信息技术,反过来,信息技术的基础性领域还是语言技术。传统的语言技术不过是纸、笔、图书,再好一点的就是打字机、话筒、录音机、投影仪之类,而随着计算机、网络平台和移动终端技术的产生和发展,语言技术也迎来它的信息化时代,使得我们习得语言、运用语言的方式均发生了革命性的变化。如果说语言产业的第一次浪潮主要是社会开放、语言交往的直接需求所导致的,那么语言产业的第二次浪潮则是语言信息技术革命所引领的。
简要地说,語言信息技术是运用计算机技术、网络技术、数字化技术以及移动技术等现代信息技术来处理自然语言的技术。从语言要素的角度,语言信息技术大致可以分为以下几种类型:(1)语料技术:对语言材料(字词、语段、语篇等)进行分类、整理、检索、贮存等处理的技术;(2)语形技术:将文字作为图形的信息处理技术,如文字输入、语形识别等;(3)语音技术,对语音进行信息处理的技术,如语音识别、语音合成等;(4)语义技术,对自然语言进行内容处理的信息技术,如机器翻译、自动文摘、人机对话等,语义技术是人工智能的关键环节;(5)语言综合处理技术,如语言能力测评、语言机能康复等。因此,所谓语言信息技术产业就是运用计算机、网络等信息技术对自然语言进行信息化处理和运用的产业形态,在这个产业形态中,语言信息技术及设备本身就是语言产品。以下我们以输入法、智能翻译、语音处理为代表来描述这一波语言信息产业的新浪潮。
(一)输入法产业
从20世纪80年代中期到90年代末,中文信息处理研究进入了一个万“码”奔腾的时期。在联想汉卡、四通中文电脑打字机之后,五笔字型、郑码、自然码、智能ABC、拼音输入法等不断涌现。也正是从这个时期开始,中国的汉字输入法产业逐渐形成规模,进入了繁荣发展期。进入21世纪以后,输入法从电脑时代进入手机时代,迎来了新一轮爆炸式增长。工信部的统计数据显示,2001年,中国手机用户1.45亿,此后几乎每年都以近亿的速度快速增长,截至2014年5月底,中国的手机用户数量已达到12.56亿人,相当于中国90.8%的人都在使用手机,其中手机网民的规模十分惊人(见图2)。2015年,中国手机市场销量3.86亿部,再加上个人电脑每年近亿的出货量,这样的数量意味着庞大的输入法市场。有人估计,基于输入法整合的手机应用平台所产生的相关收入将高达8000亿元。①
十多年之前,80%以上的手机植入的汉字输入法的知识产权属于外国公司,中国企业每年需为此支付6亿至7亿元专利费,被称为“洋码奔腾”。经过十多年的努力,这种情况已大有改观。搜狗、百度、讯飞、QQ等输入法均表现不俗,搜狗输入法在2009年的装机量已过亿。作为首家支持语音输入的输入法,丰富的语音功能已成为讯飞输入法的独特标志。近期,讯飞输入法的语音识别率提升至98%,可以适应不同场景,不同语速、音高,而且支持21种方言,讯飞输入法越来越受到用户的青睐。在移动互联领域,讯飞输入法用户达4亿。③
(二)智能翻译产业
传统翻译是人工翻译,主要是口译和笔译。计算机的出现促使人们探索新的翻译技术,可以称之为机器翻译。到20世纪70年代,机器翻译的技术日趋成熟,基于统计和实例的机器翻译逐渐替代了过去简单的语言字面转换。最近二三十年来,随着计算语言学的发展,计算机处理语言的能力不断增强,翻译技术有了显著的发展和进步。最新的翻译技术已经是计算机辅助翻译、翻译语料库、大数据、云翻译、语音语义处理等的信息技术整合,可以称之为智能翻译。智能翻译技术对传统翻译形成很大冲击,当前几乎再也找不到一家大型翻译公司可以完全依赖于传统作坊式的翻译模式而成功运作。在此,我们以文思海辉和中国传神两家公司为例简要描述这一历程。
1995年,文思海辉公司成立。随着第一批跨国科技企业陆续进入中国,IT服务市场开始出现语言翻译服务需求,文思海辉抓住机遇,将公司的语言服务从最初单一的中文扩充到如今囊括亚、非、拉、欧美主要语种的147种语言,从基础的语言翻译扩展到如今涵盖本地化咨询、技术研发、内容翻译和营销、测试、语音转录、商务会议同传等一站式服务体系;服务团队从最初的20人发展到今天分布在100多个国家的10 000多人。其产值从2009年9亿美元提高到2013的36亿美元。美国著名语言调查机构卡门森公司的研究显示,2009至2016年,文思海辉连续八年入选“全球语言服务企业25强”,位列中国第一、全球第十六。
2005年3月,传神公司成立,同年成功开发中国首个基于互联网的协同翻译及流程管理平台系列软件。2010年,传神公司打造“云翻译服务平台”,公司总部正式迁入武汉,建立中国第一家翻译产业园——“全球多语言处理中心”。公司通过互联网技术和产品建立网络化的语言服务平台——“语联网”,该平台整合中国乃至全球的个人译员和翻译机构等各种翻译资源,将用户的语言需求分类聚合,借助语联网平台的智能基因匹配技术,将需求和产能进行快速精准的分层对接,向用户输出各种不同种类的高质量的语言服务或产品。2012年产值突破80亿元。据市场调查报告显示:目前传神(中国)网络技术有限公司已经成为亚洲第七、全球第三十三的语言服务供应商。传神公司表示,计划用3年时间,成为全球最大的中文翻译服务提
供商。①
(三)智能语音产业
从语言技术的角度讲,语言信息产业的最高级形态就是语言智能产业,而语音智能产业是它的重要支柱,现称智能语音产业。智能语音产业是指以智能语音技术为核心,提供智能语音技术、产品和服务的产业形态。智能语音技术主要包括语音增强、语音合成、语音识别、自然语言处理和理解等技术,特别是相关人机自然对话技术的发展突破了传统语音技术的范围,为其在日常生活中的应用打开了无限广阔的空间。中国智能语音产业起步时间基本上与国外同步,以语音识别技术研究开发为起点,大致经历了技术萌芽阶段(20世纪 50—70 年代)、技术突破阶段(20 世纪 80—90 年代)和产业化阶段(20 世纪 90 年代末—21 世纪初)。自20世纪90年代末,科大讯飞、捷通华声等智能语音企業相继成立,智能语音技术逐步在通信、交通、教育、金融、邮政、电力等各行业推广应用,开启了国内智能语音的产业化时代。根据工信部的数据,2011至2015年中国智能语言产业规模每年都有较高增长(见图3)。
科大讯飞公司的发展历程可谓中国智能语音产业发展的一个缩影。1999年,科大讯飞公司成立。2001年11月,讯飞推出第一块语音合成单芯片,同年12月,又推出了具有语音合成和语音编解码功能的板卡。在公司成立后的短短3年时间内,讯飞就获得了国内电信、证券等语音合成技术主流应用市场80%的份额。2007年,科大讯飞成功上市,成为中国语音产业的唯一上市企业。 2009年,科大讯飞实现营业总收入3.07亿元,同比增长19.25%;2010年实现营业总收入4.36亿元,比2009年增长41.98%。正是由于以科大讯飞为代表的一批国内语音企业的崛起,以及信息技术发展进程中“智能语音时代”的来临,2012 年 8 月在工信部指导下,中国智能语音产业联盟正式成立,这是中国语言信息产业发展史中的一个里程碑。
我们正着手收集、整理2010年以来中国整体语言产业的发展状况,这个“语言产业整体”力图涵盖语言出版、语言培训、语言翻译、语言信息、语言测试等多个语言产业业态并且尽可能明确这个产业的基本边界。当然,无论是厘清边界,还是获取数据都非常困难。以2010年为例,据估算,国内包含语言翻译、语言培训、语言出版、语言信息技术等的整个语言产业的总产值应不少于2000亿。其中严格意义上的语言信息技术产业应不少于300亿,至于其他与语言信息技术应用直接相关的语言教育、语言出版等产值应占有更大的比例(陈鹏 2016)。
四、第三次浪潮(2010年起):基于全方位语言信息技术的语言产业
一波未平,一波又起,在语言产业的第二次浪潮和第一次浪潮之间产生融合效应之后(不是简单叠加),当互联网技术和智能手机终端深度整合成新的应用平台时,便催生了语言产业发展的第三次浪潮,即基于全方位语言信息技术平台的语言产业,换一种说法就是专业语言服务或语言产业的信息化时代。语言信息技术的发展首先是催生了新型的语言信息产业,诸如输入法产业、智能语音产业、机器翻译产业、语义智能产业等;同时,这些语言信息技术不断渗透到培训、出版、翻译、测试等传统语言产业之中,形成一个基于现代信息技术的语言产业形态;尤其是互联网技术和智能手机终端的广泛应用,使得语言产业的新一轮发展不再是规模性数量上的增长,而是质的变化。与传统语言产业相比,我们可以把这个基于信息技术的语言产业称为语言产业2.0版。这一波浪潮将长期引领语言产业的发展。下面我们以数字出版、在线语言教育以及“语音智能+”为例来说明这一轮语言产业的发展。
(一)数字出版
受益于互联网特别是移动互联网、移动终端的全面应用,中国数字版权产业蓬勃发展,年增长速度稳居30%之上,远远超越了其他行业。根据中国出版科学研究所《2015年度中国数字出版产业年度报告》的统计, 2009年中国数字出版业总值达795亿元人民币,首度超越传统纸质书、报、刊出版物的生产总值。到2015年中国数字出版产业整体收入规模为4403.85亿元,其中包括移动出版(手机彩铃、铃音、移动游戏等)、网络游戏、互联网期刊、电子书、数字报纸(不含手机报)、在线音乐、在线教育等。当然,这是广义的出版行业,游戏、广告、铃音也占据相当大的份额。需要注意的是,2015年互联网期刊、电子图书、数字报纸的总收入只有74.45亿元,在数字出版总收入中所占比例仅为1.69%,这说明传统出版行业在数字化融合发展、数字化转型升级方面仍有巨大的增长空间。
有数据显示,人们的阅读方式正在发生根本性的变化,调查显示:2014 年,以手机阅读、网上在线阅读为代表的数字化阅读方式的接触率为58.1%,较2013 年上升了8.0 个百分点,首次超过了图书阅读率。①这在相当程度上说明了数字出版方式将逐渐取代传统纸质印刷出版而成为主流出版方式。
在语言出版领域,语言工具书的出版一直占有相当大的份额,有些金牌工具书甚至被比喻为印书如印钞,但是它仍然要应对数字化出版。随着智能手机全覆盖式的普及以及在线工具书的使用,纸质工具书的地位不断下降。比如,2008年至2010年间,上海译文出版社的《新法汉词典》年销量从13 000册下降到3000册。根据开卷公司的调查,2013年纸质工具书销量比去年下降5%,除了中小学生常用的《新华字典》《现代汉语词典》销量平稳以外,语言类工具书总体下降9.2%,外文工具书总体下降9.3%。外研社有关人士也提到该社纸质字典销售呈逐年下降之势,年均下降7%至8%。越来越严峻的现实逼迫传统工具书进行数字化变革。商务印书馆《新华字典》纸质图书发行量迄今已有近6亿册,但它仍不能高枕无忧。在国内出版社中,商务印书馆较早着力于数字化出版的打造。2006年商务印书馆与方正集团合作启动“工具书在线”,为自己丰富的工具书资源打造数字化平台。商务印书馆可以提供总计1000余种工具书,商务版工具书的权威性和专业性都是不容置疑的,这些数字资源可以提供在线使用、电子书、资源库、手机APP等多种服务。目前商务印书馆数字出版的利润当然无法与传统出版相比拟,但前景是无比开阔的,作为中国现代出版发源地的商务必须跟上时代的步伐。
一些信息企业正在成为另一种意义上的出版企业。以方正集团为例,2000年起,在汉字激光照排技术的基础上方正集团着手研发适应互联网时代的数字出版系统。2007年,方正集团发布数字出版战略,向全媒体的数字复合出版技术发展,积极研发包括数字印刷、手持阅读、互联网出版等在内的数字复合出版技术,被称为方正的“第二次技术革命”。方正阿帕比(Apabi)公司已发展成为全球领先的数字出版技术提供商,阿帕比以因特网为纽带,将传统出版的供应链有机地联结起来,实现完全数字化的出版。
(二)在线语言教育
在线教育是一种通过信息科技和互联网进行教育和学习的方法,在线教育的显著特征是任何人在任何时间、地点,选择任何课程,从任何章节开始的一种完全超现实的学习或教育方法。它超越了课堂、教室、书本等实体条件的限制,带来一种非常自由、灵活的学习状态。在线教育改变了人们的学习方式,尤其是自主学习这一块。在语言教育这一领域,艾瑞咨询公司的调查显示,在线语言学习正在成为语言学习的主流方式(见图4)。
据该公司的调查报告,2010 年之后,在线语言教育市场每年都保持高于 20%的增长速度,到 2017 年将达到 360亿元。2016 年中国在线语言培训占互联网教育市场份额的21%,在投资领域,语言培训占据 35% 的市场份额。报告显示,至2016年,80%的用户选择通过智能手机进行语言学习,智能手机已成为在线语言学习的第一终端工具,用户比例已超过PC终端(见图5)。在线语言培训已与传统语言培训分庭抗礼,它迟早会取代后者而占据主流地位。
(三)“语音智能+”
根据《2013年智能语音产业白皮书》的介绍,目前智能语音完整的产业链基本形成,智能语音技术已在移动互联网语音搜索服务、智能手机、平板电脑等移动终端设备、汽车电子和车载终端、智能家电、智能家居等方面得到广泛应用。同时,智能语音技术应用及服务在公共服务、智慧城市、教育、医疗、法律等领域不断渗入,市场前景无可比拟。仅从智能手机终端来看,预计到 2017 年底,全球移动终端 90%以上将配备语音功能,智能语音用户规模将超过 20 亿,其中中国用户规模达将达到 10 亿。
以科大讯飞的语音智能发展为例。它始终包含两个线索,一是语音技术的发展,一是语音技术的广泛应用所带来的产业整合效应。科大讯飞起家的核心技术是语音识别、语音合成和语音评测,目前占有中文主流语音市场70%以上市场份额。随着人工智能时代的来临,2014年,科大讯飞发布“讯飞超脑”计划,核心就是让机器从“能听会说”到“能理解会思考”,努力实现语音处理和语义智能的融合。在语音识别和语义理解方向上,针对人与人之间自由交流的语音转写正确率已突破85%的实用门槛,针对会议演讲等实际场景应用已达到95%以上的识别率,并且已经研制完成软硬件一体化的远场语音识别系统。在机器评测方向上,讯飞的技术从口语评测进一步向纸笔试卷评测延伸,在正式承担了广东英语高考的全部口语评测任务后,基于试卷扫描识别的中英文作文自动评分技术在重点考试的实际数据验证上已达到与人工专家评分高度吻合的水平。此外,其语音—语义智能技术在医疗、汽车、法院、电视娱乐等许多方面都有应用。
随着万物互联时代的到来,越来越多的设备没有屏幕了,越来越多的设备需要我们在几米之外来操控它,比如说机器人,它必须在几米之外能够实现交互,并能够随时打断。在这种大趋势下,语音联通将是重要入口,语音合成和识别就成为万物互联时代人机交互的最主要的方式。2016年底,科大讯飞首先在发布会上提出信息产业已经从“互联
网+时代”进入“人工智能+”时代,讯飞认为,未来5到10年,人工智能会像水和电一样,进入我们每个人的生活。
从全球角度看,中国的语言产业进程基本与世界同步,这主要是因为中国抓住了全球化、信息化的产业发展机遇。从语言产业的内在进程看,语言产业的发展就是与信息技术不断融合的过程。由于自然语言本身就是一种信息形态,导致语言产业的“信息技术+”与其他产业的“信息技术+”有着根本的不同。语言产业的最新发展将围绕人工语言智能展开。从技术的角度,人工智能是一种用智能机器(如计算机、翻译机器、机器人等)来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划、行为活动等)的技术;从计算机科学的角度,人工智能研究包括语言识别、图像识别、自然语言处理、核心算法、专家系统和机器人等。可以看出,语言智能是人工智能的重要组成部分,甚
至是基础性的部分。从实际应用的角度,使用自然语言的人机对话将是未来万物互联的基本方式,人工智能不仅会听会说我们的语言,而且能最大限度地模仿和聚合我们的语言智能。不同形态的语言产品都将不同程度地融入语言智能这一新的技术平台,未来语言产业的发展无疑将是“语言智能+”的时代。
参考文献
陈 鹏 2016 《语言产业经济贡献度研究的若干理论问题》,《语言文字应用》第3期。
贺宏志主编 2012 《语言产业导论》,北京:首都师范大学出版社。
黄少安 苏 剑 张卫国 2012 《语言经济学与中国的语言产业战略》,《光明日报》3 月2日。
李宇明 2004 《强国的语言与语言的强国》,《光明日报》7月28日。
李宇明 2011 《语言也是硬实力》,《华中师范大学学报》(人文社会科学版)第5期。
李宇明 2012 《认识语言的经济学属性》,《语言文字应用》第3期。
罗 民 张晋军 谢欧航 黄賀臣 2011 《新汉语水平考试(HSK)海外实施报告》,《中国考试》第4期。
徐大明 2010 《关于语言经济学的七个问题》,《云南师范大学学报》(哲学社会科学版)第9期。
责任编辑:戴 燃