互联网思维下方言有声语料库对方言的保护与传承研究

2021-09-29 16:43翟力娇曹钰红胡晗陈逸寒潘晓芙
国际商业技术 2021年11期
关键词:互联网思维文化自信

翟力娇 曹钰红 胡晗 陈逸寒 潘晓芙

摘要:应互联网时代信息技术的发展,方言的传承也有了新的手段,但仍摆脱不了逐渐落寞的命运。本文以信息技术时代比较普遍的方言保存形式——方言有声语料库为抓手,对相关方言保护研究项目进行了解、对现有语料库进行使用体验,以激发青少年对方言文化的兴趣、深化群众对方言的了解从而更好地保护方言文化。同时,对现有方言有声语料库的优点和不足进行总结并提出建议,以望能对方言的保护和发展作出贡献。

关键词:方言保护;有声语料库;互联网思维;文化自信

一、引言

自十八大提出“文化自信”以来,中国就掀起了一股中华文化热潮。方言作为语言中举足轻重的一类,是文化的活化石,具有重要的文化传承意义。保护并发展方言,是当代大学生义不容辞的责任与义务。

但不可否认的是,随着互联网时代的到来,地方方言的传统传播方式受到了较大的冲击,旧有的传播途径、传承媒介土崩瓦解;加之信息流转速度的加快、规范普通话的普及、多种外语的流行等,方言的魅力被逐渐掩盖,年轻人几乎不再关注地方方言的兴亡,方言文化也逐渐落寞。

为了更好地促进方言的保护与传承,社会各界纷纷行动起来,利用互联网高效的信息共享能力,建设了一个又一个方言语料库,将身边的方言资源汇总、整合,再投放到网络当中,以便于更多人了解并学习。基于上述情况,本文特此对“互联网思维下方言有声语料库对方言的保护与传承”问题展开研究。

二、研究基础

参与各地方言保护、传承研究的研究人员多自行建立方言语料库,充分研究方言的发音特点,将方言语料库的建设向系统化、专业化、学术化的方向迈进。如陈琳(2020年)通过自建“《红楼梦》江淮方言汉英平行语料库”的方式来研究《红楼梦》中的江淮方言[1]。他们考虑到了方言难以用书面文字形式记录的问题,转而借用语音资源进行保存,语音语料多从本地影视作品中剪裁或邀请当地志愿者进行录制。为研究海南方言的语音识别问题,余旭文(2020年)邀请志愿者参与方言语音的录制,经语音切分后,进行加噪、速度扰动等语音增强手段增广语料库数据[2]。但这些专业学者构建的方言语料库传播范围极小,多是用于自身研究某一专业领域,对广大网民了解、学习方言有声语料库起到的作用微乎其微。

也有部分研究互联网思维下方言保存与传承问题的人员参考了各地已建成的方言语料库,如甘莹(2017年)在论文中提及的天津方言语音档案资料库。她认为已建档语料库存在内容形式单一、方言个性特征提取不完善、文本化气息过重、生活气息不足等问题,提出了将语料库建设专业化、内容深度化,推进方言语料库的传播和运用,优化语料库的结构和类别等解决措施[3]。

可见,已有研究大多仅集中在充分运用数字技术上,对于互联网特性的运用考虑不够全面。邹晓燕、韩琨(2017年)提出了以高校教师和研究者作为突破口,发挥高校学生众多、方言资源种类丰富的优势,解决语料库存储方言语料种类少、加工处理工作量大这一问题的方法[4],但没有意识到网络上众多网友所持的海量方言资源,未能找到利用共享信息的方式发动网友完善方言语料资源的有效途径。

本文将以现有的方言有声语料库为研究出发点,充分探索现阶段语料库的建设状况及优缺点,以互联网特性为基础,着力找出互联网思维下方言有声语料库建设的有效途径,将互联网开放性、共享性、多元化、交互性等特点融入语料库建档方法中。

三、问题与讨论

經过对大量方言语料库的查找和试验后,我们收集了38个建设较完善且具有代表性的方言有声语料库信息,其中地方类、综合类、艺术类语料库分别占比47%、34%、19%。在18个地方类语料库中,8个涉及粤方言,5个涉及吴方言,这也是总体方言有声语料库中语料资源最丰富的两类方言。

基于调查试验,我们认为现阶段方言有声语料库存在以下四个问题:

1.方言录入形式单一

许多语料库基本上都是对于方言单字、词汇的方言发音的保存,收录方式上多采用文字、注音、录音音频结合的形式,如“潮州音”、“潮州·母语”、“粤语发音在线学习网”等。

这较之前仅有文本资源的语料库而言有了较大进步,但形式上仍较为单一,应当增加方言资源录入形式,丰富方言的保存途径,使方言资源更加真实化、多样化。如“粤语学习网”、中国语言资源保护工程采录展示平台等语料库,增加了类型多样的视频资源,或是展示方言发音的嘴型变化,或是介绍方言所属地的风俗人情,引导网友深入了解方言背后的人文故事。

2.收录词汇不完整

对于用户学习方言和应用方言的需求而言,语料库收录的内容是根基,是学习应用的直接来源。在运用语料库的过程中,我们发现语料库录入的方言词汇数量较少,现存的方言语料库录入的大多是一些比较典型、有代表性的方言单字、词汇,收录内容有限。如“潮州音”只收录了单字的解释和发音,“潮州·母语”则是将搜索的词组拆成单字提供解释和发音,对于想要了解方言文化的使用者并不能起到良好的解释作用,也破坏了方言词汇本身所携带的文化内涵;“粤语发音词典”虽然对于常用语言做出分类,方便使用者按照日常用语和习惯分类进行高效筛选和学习,但是大多分类下的方言词汇较少,且相关词汇下的短语释义不够完善,存在词组例句只出现词组中单个字的释义的情况,影响用户学习效果。

除此之外,大多数方言有声语料库缺乏体现当地特色文化生活的内容,只收录了一些广泛使用的方言资源,像“方言库-江苏省方志馆”虽收录了江苏省大量地区的方言资源,但各个地区仅收录了少数词组的发音(如太阳、月亮、星星等),而许多当地特色的词汇、短句未被收录,使用者不能够通过搜索的形式找到自己感兴趣的方言资源,方言收录碎片化,方言语料库无法形成系统、有效的整体。

3.网站运行维护困难

多数方言语料库缺少专业人员维护,常出现系统相斥、网页崩溃、链接失效等问题。如“粤语发音词典”为用户提供了MP3、视频教程以及推荐教材书目,但很多功能需要从美国网站安装相关软件,这与国内大多数网站、软件相排斥,使得用户不得不放弃该网站,阻碍学习积极性。

还有不少语料库缺乏有效的用户反馈途径,导致语料库中漏洞百出,无法向使用者提供良好的使用体验,极不利于方言语料库的进步和发展。如“广州话口语”,虽收录了约31万字语料,提供的方言录音多是从综艺节目、电视剧等中截取,录音资源真实化、生活化、趣味化,但缺少在线留言的途径,运行人员无法了解到用户存在的需求和网站收录语料的漏洞;有些网站虽有平台留言、用户交互交流渠道,但是用户缺乏反馈与交互意识。如“吴语词典”中设置了用户相互交流的路径和官方反馈邮箱,但大多数用户遇到困难还是不知道在何处或者不懂得如何反馈,只是简单粗暴地选择更换其他有声方言语料库。

另外,语料库的维护成本昂贵。多数方言有声语料库为非盈利性质,为了正常运行下去,有些语料库在网页铺设了大量广告,这可能会让浏览语料库的网友产生抵触心理,不利于语料库的长期发展。类似“四川方言库”这种个人因兴趣而研究建立起的语料库甚至因种种原因被暂停。

4.语料库推广度较低

在试验现存方言语料库的过程中,对方言语料库的有效寻找是最大的难题。大多数方言语料库推广度低,对方言有了解兴趣的网友很难直接找到有丰富资源和满足需要的方言语料库。现存的较为官方的一些方言语料库,如我国教育部、国家语委联办的中国语言资源采录展示平台,由于开放权限限制,许多资源不能面向大众开放。

大多數语料库尽管已经建设得较为完备,但因为推广力度缺乏、浏览人数较少,已经长时间没有更新内容,这对于方言爱好者和方言的保存与传承都是阻碍。“黄梅戏在线”是一个大型戏曲类语音分享学习平台,具有该方言的语料学习、视频学习、新闻更新和用户上传自己作品等功能,但受制于推广不够和用户使用缺乏等问题,该平台现在处于停滞状态,新闻没有及时更新,相关视频学习资料有空白页面、权限设置、空有标题而无实质内容等问题。

方言的传承与保护需要一定流量的推广者,在一定量使用者的使用分析反馈中语料库才能进一步发展,在推广度的加强中开发者才能更好及时有效丰富语料库内容,做到全面控制与发展。

四、建议与对策

方言保护问题,关系到中国传统文化的继承与发展,而有声语料库则是方言保护中比较重要的一笔。针对方言有声语料库存在的问题,提出以下改进建议:

1.注意丰富方言收录内容,可利用互联网互动性传播的特点,鼓励用户通过在线平台优化语料库。

参考吴语语料库中的“吴语小词典”。该网站的设计者思考十分全面,相比其他网站它还囊括了“吴语协会论坛”板块,该版块聚集了大量热爱吴语、献力保护吴语文化的网友,他们能在论坛中分享资源、交流讨论;还专门设有“报错”板块,用户可以在该板块下发帖,反应该网站的错误或补充建议,这是值得大部分网站学习借鉴的。再比如,“潮州音”、“潮州·母语”网站,用户可以通过在线留言联系到管理员为其在网站操作等基础问题上答疑解惑,其中“潮州音”还向用户开放了“我来录音”功能,让网友来提供更本土化的方言录音。

只有高度重视用户交互的重要性,纷繁复杂的方言语料库才不会成为一座座零星的“孤岛”。

2.注意方言语料资源趣味化,建议以生活对话、地方经典文化片段为主。

调查发现,使用者放弃使用语料库或者对语料库兴趣不大的原因往往是大多数的语料库学术性、专业性过强。相反,类似“梨园”、“京剧艺术网”这类的艺术趣味性很强的网站则更吸引普通用户。在调查考证的支撑下,我们建议目的在于推向大众的语料库网站不要局限于简单字词的查询,要注意收录方言语料资源的趣味化,甚至可以以生活对话、地方经典文化片段(如戏曲)为主。这点可以参考“粤语发音学习网”,该网站在查询字词时增添了与之相关的影视中的语句,大大提高了网站的趣味性。

3.注意收录方式多元化、系统化。

在实操和体验过程中,我们发现比较完善的语料库网站大多是文字、音标注音和音频范读三位一体的结构,而类似戏曲艺术类的网站往往是以视频为主。那普通字词查询的工具类网站是否也可以结合相关视频呢?比如视频可以对该方言中所查询字词的历史和语境应用进行一个系统的介绍,方便用户理解。所以我们认为,更为有效的收录方式是将文字、注音、音频、视频一体化,提升语料收录的质量。

这并不是一个不简单的工程,但我们可以借助广大热心方言研究者和原住地使用居民的力量来共同完成这一工程。

4.注意信息碎片化问题,注重语料库的开放共享。

方言语音是复杂多变的,不能简单地一以概之,有时同一方言区的不同村落间往往都存在较大的语音差异,所以在构建方言有声语料库时应当注重信息的共享性和开放性,不拘泥于个别字词但也能较为客观全面地展现出该方言的全貌。如“吴语学堂”,其字音搜索功能考虑得非常专业且周到——考虑到不同吴语地区读法有所不同,独创性地设置了一个地图读音搜索的选项,点击“多地联合查询”,可以同时对比不同地区的读音。

除了上例网站内部网状式搜索结构的优化,还可以与其他网站相互建立友情链接,采用频道聚合形式,避免信息茧房影响方言语料的精确学习与传播,从而更好适应互联网多样性、互动性、海量性、开放性的特点,充分发挥出互联网带来的新的发展机遇。如两个美国留学生司圆直和柯祎蓝曾于2013年制作过一个名为“乡音苑”的中国方言网站。各地的用户可以用家乡的方言说故事并上传至网站,每一段上传的音频都会在地图相应的位置被标出,形成由录音组成的语言地图,五颜六色的标签直观地展示了这片土地上语言的丰富性。

对方言的有效保护与传承可以让文化传承开出新花。在互联网背景下,方言焕发了新的生机活力,但同时,许多方言的意思在某种程度上被扭曲、破坏,网络传播的一知半解使其丧失了本来的意义。方言不应当是网络土味、无厘头无营养新词的滋生土壤。我们研究方言有声语料库正是为了从源头上实现对方言的保护与传承,寻找方言文化的延续性,探访历史地理留给我们的根脉相传的文化符码和精神财富,用方言的魅力建立文化自信!

参考文献

[1]陈琳.《红楼梦》江淮方言的异化翻译——以霍克思译本为例[J].淮南师范学院学报,2020,22(05):48-53

[2]余旭文.基于深度学习的海南方言语音识别[D].海南大学硕士学位论文,2020

[3]甘莹.语料库视域下的天津方言建档[J].山西档案,2017(06):87-89

[4]邹晓燕,韩琨.语言生态学视野下方言语料库建设的路径、实现与应用——以赣方言为例[J].地方文化研究,2018(04):40-45

作者简介:

翟力娇(2001-),女,汉族,江苏常州人,南京审计大学本科在读,汉语言文学专业

猜你喜欢
互联网思维文化自信
融媒体时代如何践行基层群众文化自信
浅析习近平“文化自信”的四个维度
新闻媒体坚定文化自信的思考
浅析移动互联语境下中小成本电影去中心化的创作趋向
论述互联网思维在电子商务中的作用
如何让西方文化帝国主义“退场”
新媒体背景下党报的转型探析
互联网思维与传统企业再造研究