方言——通

2020-04-15 03:59李琪
大学生 2020年4期
关键词:音频文件恩施语言学

李琪

我是北京语言大学汉语国际教育研究院2018级的硕士生,师从饶高琦老师,专业是语言学及应用语言学,平时主要做数字人文方面的研究。在严峻的疫情面前,作为湖北人,我非常希望能为家乡的“抗疫”工作出一份力。

语料库

2月7日下午,国务院联防联控机制公布了16个省支援武汉以外地区的“一省包一市”方式,全力支援湖北省的疫情防控工作。湖北方言比较复杂,外来的医护团队很难完全听懂。为方便医患的正常沟通,齐鲁医院医疗队制作了一本《国家援鄂医疗队武汉方言使用手册》,它让我们看到了抗疫一线医护人员与病患顺畅沟通的需求。

2月10日中午,我的导师饶高琦告诉我们,北语开始负责“抗疫方言通”的制作。我们专业的工作是快速形成一个小型的日常医疗场景对话语料库,并提供与医疗诊断相关的“抗疫诊疗词语”和“抗疫诊疗句子”两个板块的内容,方便方言发音人录制方言音频。

语言来源于生活,也服务于生活。这段时间我身处“疫区”,虽不能像那些医护人员一样去前线发光发热,但我可以通过所学的语言学知识为他们保驾前行。

大家迅速行动了起来,首要任务是使用数据分析的方法提取与医疗诊断相关的词语和句子。我们选用了搜狗词库以及百度百科中涉及医疗场景的770个词汇,筛选出与日常医患交流及肺炎相关的用语,并在此基础上扩充了与肺炎相关症状的描述。例如从肺炎症状“发烧”扩充到“我发烧,烧得厉害,烧了几天了”“量了体温,38度多”“我的体温是38度”等症状描述用语。一个下午的时间,便形成了由 “患者自述病情”“病房护理对话”等场景的76个短句,以及与“称谓语”“身体器官词”“肺炎相关医疗用语”“生活相关用语”有关的156个词语组成的小型“抗疫语料库”。这个语料库随后成为湖北不同方言点方言采录的基础。

2月12日,根据北语提供的方言转写材料和音频制作的“抗疫方言通”正式上线,包含了武汉、宜昌、襄阳、黄石、黄冈、孝感、咸宁、鄂州、荆州九个方言点。用户只需选择自己所在的方言点,在搜索栏输入需查询的关键字,就可以找到和听到与医疗诊断相关的词语和句子。

方普对

2月15日,为协助技术团队制作抖音等平台的宣传视频,我接到了合成“方普对”的任务,需要找出宜昌、荆州及襄阳三地方言所对应的普通话所有音频,并将方言音频和普通话音频一一配对拼接起来,最后将整合好的音频文件交给技术团队。

在进行音频整合的过程中,我发现音频文本排序是音频合成的一大难题。起初,由于音频文件数量众多(共696个),加上对音频合成软件不够熟悉,我选择了手动合成的“笨办法”。一个小时后,我才合成了25个“方普对”。眼看时间不多,我想到了一个名叫Total Commander的文件管理软件,它可以进行文件批量重命名的操作,这样一来,方言和普通话的音频就能自动排序。于是,我给音频文件添加了后缀名,放入对应的两个方言音频文件夹下,再利用音频软件中添加文件夹的功能,将排好音频文件顺序的文件夹放入音频合成软件中,这时,只需点击“音频合成”按钮,就快速地完成批量合并。通过这个办法,在短短30分钟内,我和同学们就将剩下几个方言片的“方普对”音频合成完毕,提交给技术团队。

恩施话

2月17日,在前期九个方言点“抗疫方言通”的基础上,我们又增加了大冶和恩施两个方言点。作为恩施人,我义不容辞地担负起了恩施话的采录工作。具体来说,我需要先将 “抗疫语料库”中的词句用恩施话写成文本,并补充一些与其语音相近或语义相同的词句,再去找恩施话方言发音人进行采录。方言发音人最好是长期在本地生活的居民,才能保证发音的准确性。

因为本科和读研都在省外,我担心自己的地方话不够“地道”。于是,我找了两个一直在恩施生活的同学来协助我完成这个任务。我先按照自己的方言发音,将恩施话填写在表格中,然后发给两个同学核对。这种填写方式,可以很好地避免恩施话采录时可能出现的错误。例如,针对“头”这个词,我刚开始填写的方言说法是“头”,经过同学提醒,最终改成了更地道的“脑壳”。

填完表格后,我想请其中一位同学进行恩施话的录音,但因为他身边设施不全,我只好硬着头皮自己上。鉴于我的设备和录音环境实在有限,我只得关紧门窗,拉上窗帘,连上蓝牙耳机,用学校的录音软件进行了采录。试听时,我发现有很多音频出现了喷麦的情况(话筒被嘴里的气喷出来弄得扑扑响)。后来我又尝试了很多次,但效果还是不佳。到网上一查,果然有针对这种情况的调整攻略。最后,我换了个带线的耳机,将耳机麦克风外面套了层卫生纸,这才顺利完成了恩施话的采集。

18日,我将采集好的恩施话和方言文本发给了老师,当晚十点就得到了反馈,有一个音频文件没有被采录到。我立马打开录音软件进行补录,却发现方言表格中因有一个句子添加了问号,一出现就会令软件卡顿,于是我用手机进行了补录。

两小时后,“抗疫方言通”恩施版在微信上线,我迅速转发到朋友圈。不到十分鐘,同学和朋友就纷纷在线上找我。有的问这是不是我的声音,有的从觉得恩施话很有趣,也有人说我做这件事很有意义。还有一个朋友给我提出了意见,说我有一个词语读错了,“头疼”应该说成“脑壳疼”。整个晚上,我都很纠结,也很担心,一方面怕给医患沟通带来不便,另一方面担心微信平台不能进行音频的修改。

第二天,我一醒来就向老师反馈了这个问题。很快,老师将聊天记录截图发给了我,时间显示是2月18日晚上九点半。原来,在我提出这个问题之前,老师们就已经讨论过这个问题。他们认为,即便是方言也是分场景和语域的,诊疗环节是一个相对正式的场景,患者通常会讲“头疼”而不是“脑壳疼”。这下,我悬着的心才放了下来。

语言学+信息技术

作为一名语言学专业的学生,我也曾经对自己的专业迷茫过,语言学专业在社会上究竟是一个什么样的定位?它又能给我自己带来什么?通过这次参与 “方言通”的制作,我想我找到了答案。语言学不是藏在“象牙塔”里的一门学科,它存在于我们日常生活中的方方面面,与我们息息相关。

同时,语言学还给我带来了新的感悟。“语言学”+“信息技术”带来的专业优势,通过快速构建专门领域的语音资源,帮助医护人员克服语音障碍,这在传统的语言学习中是很难想象的。

语言来源于生活,也服务于生活。我身处“疫区”,虽不能像那些医护人员一样去前线发光发热,但我可以通过所学的语言学知识为他们保驾前行。医者为人,而我为医者,这是一份能被传递的温情。如果恩施版的“方言通”能够帮助天津救援队与恩施本地的医护人员及病人进行良好的沟通,那么我们的努力就没有白费,这也是我2020年记事簿上最值得被记录的一件事情。

责任编辑:曹晓晨

猜你喜欢
音频文件恩施语言学
恩施石油:党建为经营赋能
恩施方言中的“倒”和“起”
基于Android手机的音频文件取证技术研究
认知语言学与对外汉语教学
恩施年俗——点路烛
动真招下苦功创建平安恩施
数字水印在音频文件篡改检测中的应用
社会语言学名词
语料库语言学未来发展趋势
基于认知语言学的“认知修辞学”——从认知语言学与修辞学的兼容、互补看认知修辞学的可行性