论民国有声电影资料中方言口语的语料价值及整理

2021-11-30 07:00欧阳国亮
关键词:语料语料库音频

欧阳国亮

(中国刑事警察学院刑事科学技术学院,辽宁 沈阳 110035)

民国时期拍摄了很多有声影像资料,它们在记录社会百态或故事情节的同时,也将那个年代人们说的话语录入其中。由于当时并没有法定的“普通话”,因此流传至今的很多有声影像资料都不乏记录有原生态的方言口语,它们距今已近百年,为研究近代某些方言的概貌以及现代方言的历时流变情况提供了活生生的口语语料素材。它们让我们得以穿越时空的屏障去倾听历史的声音,进而触摸岁月的年轮在语言中留下的历史印迹。这也愈发让我们感受到整理这些语料的意义。

一、民国时期电影资料中的方言口语概况

(一)记录民国时期方言口语的主要载体 民国时期,特别是在1932-1949年间,随着有声电影技术的传入,当时诞生了很多有声电影资料,其中有很多资料就记录有方言口语,它们大致可以分为两大类:

第一类是纪录片类,包括会议记录片、生活记录片、军事训练记录片、教育文化纪录片等。例如东北军、伪满政府以及国民政府在上世纪30年代就拍摄了很多此类纪录片,里面有大量的人物对话、军政要员演讲、百姓日常生活交谈的内容和场景,里面的人物在说话时基本都用的是方言。

第二类是故事片类,主要是当时的电影公司拍摄的各类情节故事电影。根据有关资料显示,整个民国时期(1912-1949),一共拍摄了约1500部电影,超过百分之六十是1932年以后拍摄的有声电影。[1](P25-26)在没有法定“普通话”的背景下,有不少电影都是用方言进行配音,特别是闽粤沪地区的电影,方言配音尤甚。例如1937年拍摄的《天之骄女》用的是粤语配音,1938年拍摄的《压岁钱》用的是上海方言配音,伪满时期拍摄的“国策”类电影多用东北方言(长春话)配音。

上述两类电影资料几经辗转流传至今,保存在国家档案馆、中国电影资料馆及各地影视艺术管理、档案管理、博物馆等部门。随着网络和多媒体的发达,很多此类资料已经从档案馆走上网络,让今天的人们能够切身感受民国那个年代各地的方言口语,也让语言研究者能够从中窥探那个年代中国方言的概貌。从语言学角度来看,这些资料是一类珍贵的语言档案和数字遗产,其价值已经超越了“电影”本身的范畴。

(二)民国时期有声电影资料中方言口语的语言学属性 众所周知,现代方言研究界在调查和记录方言主要采用的是“列表法”,即设计一些调查表格,里面罗列单字、词汇以及语法例句,让被调查者根据这些表格进行话语表达,以此求得想要的调查内容。这种方法固然有其优势,但被调查者容易受到表格的束缚,导致某些话语的表达不自然,或者部分表述出来的语言材料不够准确,这就使方言语料缺乏“自然话语”的属性。相比之下,民国时期的那些有声电影资料特别是那些纪录片,例如开会的纪录片、百姓生活纪录片、军事训练纪录片等,里面的人物在说话时状态十分自然,所说的话语内容也都是生活中的内容,淳朴而自然。这种由人在自然状态下说出来的口语语料,语言学界将其称为“自然口语语料”。[2]这类语料最为真实,也最有研究价值,因为它们是自然语言的一部分,不是刻意为了“说话而说话”。从这个角度来看,民国时期有声电影资料中的方言口语一般都具有自然口语属性。

二、民国时期电影资料中方言口语的语料价值

语言学界不少学者就提到要加强对旧时有声影像资料中方言口语的整理,例如赵元任先生在上世纪70年代就对民国时期遗存的一些吴语录音录像进行过整理,并从历史发展角度去考察吴语在近半个世纪中的变化情况。[3](P52-53)近年来学界亦有此类呼吁,范俊军先生主张用“语言数字遗产”的概念来指代那些早年记录的口语有声资料,并认为这类遗产对研究某种语言或方言可以起到“活化石”的作用,不应被历史所遗弃。[4]我们认为,民国时期电影资料中的方言口语具备三方面的语料价值:

(一)为研究民国方言及其流变情况提供形象直观的有声语料参照 社会语言学和历史语言学认为,语言会随着时间的推移和社会的变迁而发生变化,方言在这种变化中表现得最为明显。[5](P105-106)在这种方法论的导引下,进入新世纪以来,学界开始重视民国时期方言与现代方言的比较。现阶段学界研究民国时期的汉语方言,其素材不外乎两个来源:一类是民国时期编撰并流传至今的书籍,其中主要是各地编撰的方言志、字书、韵书。例如记录民国时期沈阳方言的《奉天通志·方言志》(1934),记录民国时期济宁方言的《济宁县志》(1938),记录民国时期上海方言的《上海方言课本》(1923),以及记录民国时期福建地区方言的《闽语考》(1923),等等。另一类来源是民国早期出生至今仍健在的老人,他们保持了较为纯正的方言口语,通过方言调查手段从他们口中获取方言研究的素材。根据上述两类素材来源去研究民国时期的方言存在两个问题:一是那些记录有方言的文献资料经常是内容记录不全,或者是只记录词汇而没记录语音;二是那些民国时期出生的人,在后来生活的过程中,其口语容易受到现代语言因素的干扰,因此他们的口语并不能完全代表民国时期的口语,作为佐证材料使用尚可。而民国时期那些电影资料,很多就记录有当时的方言口语,它们以有声的形式存在,能更加客观准确地展示特定年代的方言原貌。例如张学良1932年发表的长度为4分钟的演讲,不但话语清晰,而且方言色彩浓厚,很好地展示了当时辽宁奉天一带的口音。又如1935年拍摄的反映上海百姓生活的纪录片,里面有街头百姓吆喝以及和军警对话的内容,将当时上海地道的方言口音展示无余。这些记录在影像中的自然口语语料,为我们研究当时方言中的字音、词汇、语法现象,以及研究近代汉语方言与当代汉语方言的发展流变都提供了宝贵的素材和语言参照,它们比起那些记录在书籍中的方言材料更加形象生动,无疑是研究民国时期方言的“活化石”。

(二)为现代语言博物馆(数据库)建设提供历史语料 进入新世纪以来,学界关于保存和记录方言的呼吁愈加强烈,一些学者用自己的实际行动践行到这种呼吁中来。与此同时,民间也表达出了要求建立语言博物馆的诉求,并引起了社会的广泛关注。受此感召,国家也进行了积极的回应。2015年,我国从国家层面发起了中国语言资源保护工程(以下简称“语保工程”),方言保护的范围覆盖了全国各地。保护方言,从最初的学界呼吁逐渐上升为国家意志[6]。语保工程启动5年多来,我国已经完成了1000多个方言点的方言调查记录工作,覆盖了全国所有地级市。下一步就是将摄录的各种方言语料汇集成库,建立大规模的方言资源库(语言数字博物馆)。在这种大背景下,将民国时期电影资料中的有声方言语料运用数字化手段将其提取出来,建立一个“民国时期东北方言有声语料库”,完全可以将其作为一类特殊的语料补充到国家语言资源数据库中。这样不但可以实现“古今”两种方言口语语料的历史性交汇,而且还能透视两者之间的异同,从而梳理其中某些方言成分的历时发展脉络。从社会服务角度来说,这些民国时期的有声方言语料,还可以通过网络媒介传播给社会公众,让人们能切身感受那个年代的口语。例如,几年前一段民国时期不同地区人用方言介绍中国传统服饰的有声视频就在各大媒体上成了热搜,网友们对此保持了浓厚的兴趣。由此可见,其传播价值和娱乐价值也得到了彰显。

(三)印证或纠正现代方言研究中的一些理论和观点 目前学界发表了很多关于民国时期某地方言语音、词汇和语法方面特点的论著,里面有的观点是通过逻辑推理得来的,缺乏真实的语言学证据。其中的某些观点可能是错误的。在这种情况下,根据民国时期有声电影中的方言口语,就可以在一定程度上去印证或者纠正其中的某些观点。例如,有人曾发文讨论民国时期东北方言平翘舌音合流问题,作者依据有关字书辞书认为民国时期的东北方言没有翘舌音,相应的字音都归平舌,并且指出出现翘舌音应该是上世纪40年代以后的事。若干年前,随着一批记录上世纪20-30年代沈阳、长春一带百姓生活和军事政治记录片的解密,其中的一些片段流传到了网络上。人们透过这些片段中的东北方言对话语料发现,那个年代的东北方言中就已经有翘舌音,而且存在平翘混读的现象,这就用最鲜活的例子从客观上纠正了一些学者的错误观点。语言学大师赵元任先生在他的《现代吴语的研究》中,就罗列了不少民国时期拍摄的电影中的上海方言口语来印证现代吴语在半个世纪中的某些变化情况,[3](P52-53)有理有据,十分具有说服力。

当然,不只是民国时期的方言录音资料才有上述语料价值,建国后的一些有声资料同样具有同类价值。例如1977年,吕叔湘先生就以1958年录制的话剧《茶馆》为语料来源,研究了建国初期北京话口语的语调问题,陈建民先生、孟琮先生则根据这些语料研究了当时北京话的口语语法。[7]由此可见,任何一阶段的方言录音资料,只要选择了恰当的研究视角,它们都具有研究利用的价值,特别是在方言日渐萎缩的今天,这些有声资料的价值更是显得弥足珍贵。

三、整理民国时期电影资料中方言口语的思路

民国时期有声电影资料中的方言口语作为一类特殊的语料,其价值不言而喻。对于它们而言,重点应该在于整理,然后才是研究。在整理时应当遵循如下基本思路:

(一)对记录有方言口语的民国时期电影资料进行搜集和筛选 民国时期的电影资料大部分都保存在国家和地方的博物馆、影视艺术馆、档案馆、图书馆等机构中。其中故事片类电影主要保存于博物馆或艺术馆,例如中国电影博物馆官网、中国电影资料馆官网就对民国时期的电影进行了编目,里面对电影的语言配音类型进行了“国语”“粤语”之类的标注,检索起来非常方便,而且部分电影还能在线观看。民国时期的纪录片资料一般都是作为历史资料保存在档案馆或专题博物馆当中,例如位于长春的伪满皇宫博物馆就保存有大量的伪满时期的有声影像资料。因此搜集记录有民国时期方言口语的电影资料,要重点去上述网站或机构中查阅。当然,随着今天网络媒体技术的发展,很多民国时期的旧电影和纪录片都已经走入互联网,通过各大搜索引擎可以搜索到这些资料,然后再借助下载工具即可实现下载。

(二)对民国时期电影中的方言口语进行提取和处理 民国时期流传至今的电影资料,有关机构在收藏时一般都已经对它们进行了数字化处理,也就是把胶片中的内容已经转化为可供各类播放器播放的数字视频。[8](P233-235)因此我们收录到的资料一般都是数字化的资料——视频。要提取其中的方言音频资料可通过两种方式:一是信号转录,即借助录音设备将电影中的声音转录出来,这种方式操作简单但在转录过程中容易丢失部分音频信号。二是转码提取,即利用格式工厂、暴风影音等软件,对视频中的音频进行转码提取,这种方式能够有效地保留原来的语音信号。将方言口语音频提取出来后,要对其进行编目处理,建立基础音频档案,以便于查找。由于民国时期录音技术尚不完善,流传至今的有声影像资料中的语音很多都有瑕疵,主要表现为声音小、噪声大、音质差。我们有必要对提取出来的音频进行进一步的加工,以满足研究的需要。处理的主要内容包括:对声音过小或者过大的地方,用软件语音信号进行增强或减弱处理;对噪声大的地方进行降噪。语料的提取和处理属于技术层面的工作,借助现代信息处理技术和多媒体技术就能实现,此不赘述。

(三)基于语料建立民国时期方言口语有声语料库

对提取出来的方言口语材料进行了必要的处理后,接下来的核心工作就是利用这些语料建立“民国时期方言口语有声语料库”。这种语料库不同于现代方言语料库,后者在建立之前会根据设计好的方言采集模块进行方言采集,例如采集单字音、词汇音、句子音、语篇或者语段音等。而从民国时期电影资料中提取出来的方言语料,基本上都是句子或者语篇,因此必须对这些句子进行切分处理才能获得单字音和词汇音。建立“民国时期方言口语有声语料库”,其内容至少应该包括四个方面:一是单字音库,也即将提取出来的口语语料进行切分,提取出单字音频,建立一个单字音频库;二是词语音库,也即运用前一种方法提取词语音频,建立一个词语音频库;三是句库,这个相对容易,因为从电影中提取出来的语料基本上都是句子,直接建库即可;四是语篇库,也即长短话语语库,可以选取民国电影中那些话语比较长的音频片段建立。在建完库后,还应当对这些字词句和长短语料进行必要的转写和标注——用今天的普通话进行对译,并用音标标音。只有这样才是一个完整的语料库。这个语料库一旦建成,能为语言研究者特别是方言研究者提供丰富的素材。近年来,随着语保工程的完工,中国语言资源数据库即将建立,本着语言记录和保护这一价值取向,“民国时期方言口语有声语料库”理应进入这个大型数据库中。

四、余论

民国时期保存至今的有声电影资料众多,对其进行整理是一项巨大的工程,因为它不仅仅涉及语料的搜集问题,还涉及到语料的整理、撰写、标注等一系列复杂的过程,这些工作不是凭一己之力就能实现,而是需要跨部门、跨人员的协作。除此之外,这类资料的保存分布也往往比较分散,它们保存在不同的地区。例如民国时期上海一带拍摄的电影资料多保存在上海、南京,伪满时期拍摄的电影资料多保存在长春、沈阳,而华北一带的军事题材电影资料则多保存在北京。还有大量有声影像资料则保存在国外,至今尚未得到整理。这客观上给了我们三点启示:首先,方言研究者要注意充分利用自己生活和工作地的条件,注意前往当地的档案馆、资料馆、博物馆搜集整理民国时期本地的有声电影资料,发掘其中的方言素材。其次,不同地区的方言研究者,在收集到当地民国时期有声电影资料后,应当尽可能实现资料共享,让那些零散的素材实现资源的整合,焕发其历史的光彩。再次,在国家推进语言资源保护的大背景下,一些高校或语言文化研究机构已经开始建立了语言博物馆,这些部门应当重视对民国时期电影资料中方言口语的采集,将其纳入到语言博物馆中,使语言的历史文化属性得到有益的彰显和推崇。

需要特别指出的是,民国时期拍摄的故事类有声电影,尽管大部分采用的是“国语”配音,但当时的“国语”并不等同于今天的普通话。“国语”不管是在字音上还是词汇和语法方面,都具有鲜明的民国时期特色。因此,也应该重视对这些电影资料中“国语”的研究,它们为研究那个年代的“普通话”以及同现代普通话的比较提供了鲜明的有声语料,同样是汉语历史上一笔珍贵的语言遗产。

猜你喜欢
语料语料库音频
On Doors
Egdon Heath (Extract from The Return of the Native)
海量标注语料库智能构建系统的设计与实现
基于语料库的清末民初日源外来词汉化研究
柏韵音频举办Pureaudio 2021新产品发布会
浅谈视频语料在对外汉语教学中的运用
可比语料库构建与可比度计算研究综述
运用语料库辅助高中英语写作
语料库与译者培养探索
英语教学中真实语料的运用