新时期《人民日报》新闻标题用字调查研究

2017-06-15 16:25邹晓玲
长春师范大学学报 2017年5期
关键词:常用字用字共用

邹晓玲

(湖南科技大学 外国语学院,湖南 湘潭 411201)

新时期《人民日报》新闻标题用字调查研究

邹晓玲

(湖南科技大学 外国语学院,湖南 湘潭 411201)

新时期《人民日报》新闻标题在不同区间段用字存在较大共性,这在总字种数、高频字、共用字、常用字等方面有突出表现。各区间段前10个高频字、部分共用字、独用字以及超纲字的字义特征体现了新时期《人民日报》新闻报道较强的时政色彩,以及新闻标题制作对人物、地点要素的重视。此外,标题字频与其它6种字频统计成果的比较显示,汉字字频受语料性质的影响。立足于新闻标题的字频统计结果不仅有别于综合性语料的字频,而且有别于新闻语篇的字频统计结果。

新时期;《人民日报》;新闻标题;汉字;使用

现代汉字统计历史悠久。自1928年陈鹤琴先生编写《语体文应用字汇》以来,学界对现代汉语常用字、通用字分别进行了定量研究,相继产生了系列成果。如:《印刷通用汉字字形表》(1965)、《汉字频度表》(1976)、《信息交换用汉字编码字符集·基本集》(1981)、《社会科学、自然科学综合汉字频度表》(1985)、《1986年度新闻信息流通频度(6001字)》(1987)、《现代汉语常用字表》(1988)、《现代汉语通用字表》(1988)等[1]。其中,《1986年度新闻信息流通频度(6001字)》全部取材于新闻语料。郭冶方先生曾对其给予较高评价,认为“新闻信息中汉字流通频度统计,有助于我们摸清汉字在新闻信息中的流通规律,有助于汉字规范化的工作,对新闻出版、编码设计、教学、语言文字的研究、信息产业的建立等都有重大意义。”[2]

自2005年以来,教育部、国家语言文字工作委员会每年定期向社会发布年度语言生活状况绿皮书,其中包括大众传媒用字用词情况调查研究。相比于以往有关字词统计研究来说,其规模更大、技术更先进、成果更丰硕、影响更深远。然而,在对现代汉字的统计研究中,专门针对新闻标题汉字使用状况的研究文献目前尚没有。因此,本文将以1978年以来《人民日报》新闻标题为语料,对其用字情况展开相关研究。

由于时间跨度较大、语料规模大,我们将采用构造周抽样法①,一年构造两个抽样周②。为尽可能兼顾语料的同质性,在坚持新闻标题抽样的同时,我们也考虑了语料的稳定性、不重复性等原则③。在此基础上,累计抽样了745349个字符的新闻标题语料,其中汉字共计706636字次(不包括标点符号、阿拉伯数字、西文字母等字符),字种数共计3977个。同时,为了解不同时间段标题用字的异同,在尽可能兼顾历史分期、语料数量的平衡性以及《人民日报》版面沿革的情况下,我们将《人民日报》新闻标题语料分成三个区间段。其中第一区间段(1978-1989)语料容量为232149字符(占比31.15%);第二区间段(1990-2003)语料容量为251069字符(占比33.68%);第三区间段语料容量为262131字符(占比35.17%)。

文中所有字频均由专门的字频统计工具统计。相关统计术语遵照《中国语言生活状况报告(2009)》(下编)。

一、不同区间段《人民日报》新闻标题用字比较

(一)不同区间段标题用字总体概况

统计显示,第一至三区间段总字种数依次为3267、3224、3282个,总字次分别为225051、239466、242119次。其中三区间共用字有2595个,分别占第一至三区间段字种数的79.431%、80.490%、79.068%,覆盖了99.414%、99.362%、99.369%的区间语料。任意两区间部分共用字分别占第一至三区间段字种数的12.152%、12.593%、12.462%,依次覆盖了0.406%、0.507%、0.452%的区间语料。

这表明,不同区间段《人民日报》新闻标题在用字上保持了较高的一致性和稳定性。首先,各区间总字种数相差不大,都保持在3200~3300个字种以内。其次,各区间段共用字字种数多、覆盖率高。两种类型的共用字累计在92%左右,覆盖了各区间段约99.762%~99.914%的语料。

(二)不同区间段高频字比较

1.前10个高频字比较

各区间段使用频次最高的前10个高频字依次为,第一区间段:“国、会、的、中、人、大、一、工、在、行”;第二区间段:“国、会、中、大、人、的、行、发、一、工”;第三区间段:“国、会、中、的、人、大、发、年、行、全”。

其中“国、会、大、人、中、行”6个高频共用实字主要涉及国家、会议、大会、人、行动(包括某人某地之行)等,并且“国、会、人”3个高频共用字在各区间段的频次序位完全一致。这不是偶然,体现了不同时期《人民日报》新闻报道重点的一致性。同时,这类高频共用字的使用初步体现了新时期《人民日报》新闻报道对时政要闻投入了较高关注度,反映了我国党报新闻报道的现状。

2.不同阈值下高频字共用与独用情况比较

不同区间段在高频字方面共性比较大。表现在,17.355%~17.432%的高频字种就能覆盖80%的语料,其中有14.107%~14.361%的三区间共用字;27.300%~27.518%的高频字种能覆盖90%的语料,其中有22.821%~23.232%三区间共用字;63.467%~64.187%的高频字种能覆盖99%的语料,其中有53.473%~54.435%的三区间共用字。这说明新时期《人民日报》不同区间段新闻标题高频字使用效率比较高,并且用字情况比较稳定,共性比较大。

当覆盖率增加时,独用字数量明显上升。这说明随着汉字在语料中覆盖率的递增,标题用字共性减少,差异增大。这主要是受低频字的影响。相对来说,高频字部分比较稳定。

相同覆盖率下,较之另外两个区间段,第二区间段两种类型的共用字比例均最高,独用字比例均最低。这说明《人民日报》新闻标题在20世纪90年代至本世纪初期,标题用字共性最高,与之前的80年代和最近十来年标题用字的关联度最大,稳定性最强。

(三)不同区间段共用字比较

1.任意两个区间段部分共用字比较

部分共用字数量不多,三个区间段累积606个,只覆盖了0.406~0.507%的语料。其中第二、三区间段共用的汉字最多(209个),第一、三区间段次之(200个),第一、二区间段最少(197个)。

各区间段使用频次相对最高的前5个字依次为:“耿、飚、粗、滦、倪”;“镕、岚、琛、尉、璇”;“篪、岐、弘、炬、璇”。结合区间语料可知,14个相对高频部分共用字④中有9个字涉及国家前领导人名字,“璇”为运动员姓名用字,“炬”也与我国近几年体育赛事中的“火炬”有密切关系。这说明《人民日报》新闻标题用字具有较强的时代特征以及对国家领导人活动的较高关注度。同时,部分共用字中人名用字的相对高频出现,体现了新闻标题制作对人名的较高关注。

2.三区间共用字比较

在各区间段语料中,三区间共用字有2595个字种,占各区间字种数的80%左右,分别覆盖了99.40%左右的区间语料。这些数据也表明,《人民日报》新闻标题在不同时期用字比较稳定,各区间段用字共性比较大,且共用字使用频率高。另外,从2595个三区间共用字在各区间段平均频次来看,第三区间段最高(92.713%),第二区间段居中(91.691%),第一区间段最低(86.217%)。

(四)不同区间段独用字分析

《人民日报》新闻标题中不同区间段独用字累积776个,分别占各区间段字种数的8.418%、6.917%和8.470%,累积覆盖了各区间段不足0.2%的语料。其中各区间段使用频次位列前十的独用字为,第一区间段:“篡、僚、纫、丕、赳、栈、鹑、剖、掖、彗”;第二区间段:“珮、崭、喉、抒、岱、贬、坻、柕、飒、纭”;第三区间段:“咋、擎、晒、隽、靓、凸、娥、蓬、琨、嫦”。

参照各区间段语料发现,各区间段前10个独用字有着鲜明时代特点,部分独用字的使用有一定的偶然性。各区间段均有国家前领导人姓名用字,如“丕”(第一区间段)、“珮、杼”(第二区间段)、“隽、琨、蓬”(第三区间段)。第一、二区间段均有地名用字,如“掖、岱、坻”。另外还有其它专名用字,如“鹑”(鹌鹑)、“彗”(哈雷彗星),星体名称用字“娥”、“嫦”(嫦娥一号/二号人造卫星)。此外,还有反映改革开放初期社会生产生活原貌的“纫”(缝纫机)、“栈”(贸易货栈)等。这些独用字再次体现了新时期《人民日报》新闻报道较强的时政色彩及标题制作对人名、地名的较高关注度。

不过,与前两个区间段明显不同的是,第三区间段前10个独用字中出现了方言字、网络热字⑤,如“咋、靓”为方言字;“晒”属于旧字翻新,特指将东西拿出来与人分享,在语料中有“晒账本、晒三公、晒家底”等搭配。方言字、网络热字在标题中的出现,反映了近年来《人民日报》用字用语的变迁。尽管其使用频次不多,但对我国传媒语言,特别是党报语言的发展和走向具有重要影响。囿于篇幅,这方面内容我们将另撰文探讨。

(五)不同区间段常用字分布情况

将不同区间段汉字与《现代汉语常用字表》比较后可知,《人民日报》各区间段在汉字的使用上都坚持常用性为主。各区间段均有86%以上的字种属于常用字,累积覆盖了各区间段99.302%~99.441%的语料,其中70%属于一级常用字,累积覆盖了各区间97.291%~97.629%的语料。其余不足14%的超纲字⑥仅覆盖了不足0.7%的区间语料。

相比而言,第一区间段常用字字种数相对最多(86.808%),常用字语料覆盖率也最高(99.441%);第三区间段其次(86.319%、99.413%);第二区间段常用字字种数最少、语料覆盖率最低(86.012%、99.302%)。

不同区间段《人民日报》新闻标题中常用字和超纲字的分布特征体现了“文字使用的有限性和层级性”[3],即在具体语料中汉字的使用量是有限的,这些有限的汉字又按照常用程度分成了一级常用字、次常用字、超纲字等不同层次。

陈原先生曾认为,“常用字2500应在小学毕业时掌握,次常用字1000应在初中毕业时掌握”[4]。不同区间段《人民日报》新闻标题中常用字字种多、频次高、覆盖率高这一用字特征也说明,作为中共中央机关报,《人民日报》并没有将自己的读者群简单定位于机关企事业单位领导及职员,而是关注到不同文化层次下更广泛的读者群和新闻受众。在当前传播主体多元化以及网络文化、异文化不断渗透的新形势下,《人民日报》新闻标题这一用字特征对抵制大众传媒中乱用生僻字、简化字、繁体字、外来字、网络符号等不良现象具有积极的示范和引导作用。

二、新时期《人民日报》新闻标题超纲字、高频字研究

(一)超纲字的使用规律

将《人民日报》标题语料3977个汉字与《现代汉语常用字表》比较后得知:3977个汉字中,有817个(占20.543%)超纲字,累积覆盖了0.616%的标题语料。虽然其整体使用频次偏低,但具有鲜明特征。下面我们以使用频次最高的前50个超纲字为例。

前50个超纲字依次为:圳、镕、埔、岚、迪、琛、肇、喀、邹、耶、韦、璇、磋、暨、弘、茨、挝、篪、姬、圭、兹、斌、岐、汶、厄、俞、汕、廖、邯、蔡、崛、弗、鄂、炳、斐、郸、襄、亟、阜、沂、鳌、槛、奎、郝、柯、邵、曝、烯、赣、昊。

周有光先生曾提出,“现代汉语用字中有‘特种用字’,包括科技新字、人地名专用字,等等。它们的特殊之处是,用途极狭,只在特定场合应用。”[5]周先生在文中提到以下几类特种用字:科技专用字、民族和宗教专用字、人地名专用字、行业专用字、译音和象声专用字、方言专用字、外族汉字。根据以上特种用字的分类,我们结合标题语料对前50个超纲字考察后发现:

(1)全部为地名专用字,如:圳、埔、喀、挝、汕、郸、阜、沂、赣。

(2)全部为人名专用字,如:镕、琛、篪、斌、俞、廖、炳、昊。

(3)人名、地名混用字,如:岚、邹、韦、茨、圭、岐、汶、邯、蔡、奎、郝、邵、兹。

(4)科技专用字,如:烯。

(5)人地名专用字与其它专名用字,如:弗、璇、柯、鄂。

(6)专名用字(主要为人地名专用字)为主,偶有其它普通用法,如:鳌、襄、迪、肇、耶、姬、斐、厄。

(7)普通用字为主,偶为专名用字,如:弘、暨。

(8)全部为普通用字,如:磋、崛、亟、槛、曝。

以上8小类中,只出现于人地名及其它专名用字中的超纲字35个;专名用字为主,偶有其它普通用法的超纲字8个;普通用字为主,偶有专名用法的超纲字2个;只有普通用法的超纲字5个。

前50个超纲字中绝大部分为特种用字,特别是人名地名专用字的状况是新闻标题独特性的鲜明体现。作为新闻事实六要素之一,“何地”、“何人”是新闻的重要构成要素。为了准确、鲜明地报道新闻事实,在有“文眼”之称的新闻标题中适当运用表地点、人物类的专名,对提高新闻报道效果以及观众的阅读效率具有积极意义。当然,相对于语料中其它汉字的分布情况而言,标题中特种汉字字种数并不多,且绝大多数特种字使用频次也不高。

(二)高频字的鲜明特征

陈原先生曾将7种汉字字频统计成果⑦中前10个最高频汉字与美国“AHI:Rank list”(1971)测定的10个英语最高频字归在一起,认为“如果把各次测量出来频率最高的汉字加以比较研究,是很有意义,很有启发的。”[4]受该观点启发,我们从中选择6种字频统计成果,辅以本研究汉字频次统计结果,对这7种统计成果中前10个高频汉字进行比较(表1)。

表1 7种字频统计成果中前10个高频汉字表

比较发现,除了本研究统计的标题语料汉字频次表外,其余6种汉字字频统计成果中位列第一位的高频汉字均为功能字(词)“的”。而在本研究《人民日报》新闻标题语料中,位列第一位的高频汉字为“国”,“的”则位列第四⑧。我们还注意到,除《1986年度新闻信息流通频度(6001字)》(以下简称为《1986年字表》)与《<人民日报>新闻标题语料汉字频次表》(以下简称为《<人民日报>字表》)外,其余5种字频表前10个高频汉字中均出现了可单独成代词或动词的“我、他、这、是、有”。

不同统计结果中高频汉字的差异说明:首先,汉字频次与语料性质有密切关系。以上7种汉字字频统计成果中,《1986年字表》和本研究《<人民日报>字表》均取材于新闻语料,其余均为综合性语料。语料性质的差异造成了汉字频次统计结果的差异。一般而言,新闻语料的新闻性、即时性与文学语料的文学性、科技语料的专业性、政论语料的思辨性等有明显差异,这种差异必然在汉字使用上有所表现。以上7种字频统计结果中前10个高频汉字的差异即是语料性质差异的反映。

其次,标题与语篇字频统计结果同中有异。这在同样取材于新闻语料的两份字频表中得以充分体现。将《<人民日报>字表》与同样取材于新闻语料的《1986年字表》前10个高频字进行比对不难发现,两表有“国、的、中、一、人”5个共用字。特别是高频字“国”在其它综合性语料前10个高频字中均未出现,但在《1986年字表》中频次仅次于“的”,位列第二。此外,在其它5种汉字表中均出现的可单独成代词或动词的“我、他、这、是、有”均没有出现在两份取材于新闻语料的前10个高频汉字表中。这表明新闻语料的特征决定了字频统计的某些共性。

新闻语篇与新闻标题字频统计结果也存在差异。表现在虽然两表前10个高频字中有5个共用字,但两表中的独用字非常值得我们关注和思考。

《1986年字表》前10个高频汉字中的独用字为“十、在、和、了、年”;《<人民日报>字表》前10个高频汉字中的独用字为“会、大、行、发、工”。两表高频独用字不仅在单个汉字上不同,而且在语法特征上差别明显。其中《1986年字表》前5个高频独用字中有3个虚字(均可独自成词),分别为“在、和、了”;而《<人民日报>字表》前5个高频独用字均为实字。两表高频独用字语法特征上的差别,体现了标题体与篇章体的差别。一般而言,标题受空间因素制约,尽可能采用表意实在的实词,虚词则能省则省;篇章则不然,一些在标题中简省的成分,我们在篇章中均可找到完整的叙述。

以汉字“了”为例,该字有时态助词、动词、语气词以及构词等作用,其中在动词后作时态助词用法在语篇中非常常见。对比以上字频统计成果发现,“了”字除了没有出现在本研究《<人民日报>字表》前10个高频字中外,在其余6个汉字字频统计成果(包括取材于新闻语料的《1986年字表》)中前10个高频汉字中均出现。在我们所统计的《<人民日报>字表》中,“了”字的序位为第197位(899次)。

“了”字的序位在不同语料来源的汉字频次统计成果中出现巨大差异,重要原因在于标题语言对时态助词“了”的排斥。尹世超先生从音节、语法句式、语用等方面探讨多数报道性标题中不用“了”的原因,他将语用因素看作根本原因,认为“只有删除‘了’,才能使一个言语片段由句中解脱出来,实现有界向跨界、由入句到超句的过渡,获得概括全篇的能力和资格。”[6]

标题语言对时态助词“了”的排斥,造成了汉字“了”在本研究中的频次序位不仅有别于以上5种综合性语料的汉字频次统计成果,而且有别于取材于新闻语篇的《1986年字表》。

三、结语

标题是文章的眼睛,在新闻报道中有重要的意义和价值。《人民日报》新闻标题在不同区间段用字上较高的共性,体现了党报新闻用字的稳定性。同时,标题中领导人姓名用字及地名等特种用字的相对高频出现,反映了《人民日报》新闻报道的价值取向及标题制作特征。这些对党报标题制作与宣传有积极的参考价值。此外,《人民日报》新闻标题字频与其它语料字频统计成果的异同,显示了语料性质对字频统计的影响以及标题用字与篇章用字的差异,再次验证了语言研究中语体区分的必要性。

[注 释]

①构造周抽样法的定义,及其相比于其它抽样方法如简单随机抽样、连续日期抽样的优势等,可参看任学宾《信息传播中内容分析的三种抽样方法》,载《图书情报知识》1999年第3期。

②具体依据可参看Riffe D,Aust C.F.,Lacy S.R.The effectiveness of random,consecutive day and constructed week sampling in newspaper content analysis[J].Journalism Quarterly, 1993, 70(1):133-139.

③稳定性原则体现在以政治法律社会、教育科技文化体育各方面内容为主(均以《人民日报》当日所注版名为依据)。这是因为从历时角度来看,《人民日报》以上版面稳定性较高;不重复性原则,即前6版以外,相近或相同版面只选择靠前的一版(近年来前6版有重复版名,但考虑到其重要性,我们特殊对待,不排除)。如2010年以来国际版常有两个版面,我们只抽取其中靠前的一版。再比如,如果同一天既有“国民经济”版面,又有“经济专页”或“经济周刊”版面,我们只抽取其中靠前的一个版面进行统计。

④“璇”在二、三区间段同。

⑤实际上这几个字在语料中均独立成词使用。

⑥指超过了3500常用字外的汉字。

⑦经核对,我们对原文中部分字频统计成果的名称及年限有所补充与更正,具体参见表1。

⑧这在本文上一节各区间段前10个高频字中也有较为一致的体现。

[1]傅永和.现代汉语常用字表的研制[J].语文建设,1988(2):22-25.

[2]郭冶方.新闻信息汉字流通频度统计[A].陈原.现代汉语定量分析[M].上海:上海教育出版社,1989:96.

[3]王敏.新中国常用字问题研究概述[J].语言文字应用,2007(2):12-18.

[4]陈原.系统整理汉字的一个里程碑——谈常用字表的制定[J].语文学习,1989(3):2-3.

[5]周有光.现代汉语用字的定量问题[J].辞书研究,1984(4):2-12.

[6]尹世超.标题语法[M].北京:商务印书馆,2001:134.

Study on Chinese Character of thePeople’sDailyHeadlines in the New Period

ZOU Xiao-ling

(Foreign Language Department, Hunan University of Science &Technology, Xiangtan Hunan 411201, China)

Characters of thePeople’sDailynews title in different period are concentrated and stable, they have the same characteristics as follow: total species, high-frequency words, common words, frequent words.The semantic character of the former ten high-frequency words of different interval period, partial common words, seperate words and super class words reflects that: thePeople’sDailynews reports in the new period is full of distinct era characteristic and political, but also reflects the high attention to people, places elements of headlines. In addition, the comparison of the top ten high frequency characters of seven kinds of Chinese statistics results shows that the frequency of Chinese character is influenced by nature of the corpus. The frequency statistics which is based on news title is not only different from the word frequency of comprehensive corpus, but also different from the word frequency statistics of news discourse.

the new period;People’sDaily; news title; Chinese character; usage

2016-12-19

湖南省教育厅科研项目“新时期以来《人民日报》新闻标题用字用词情况调查研究(1978-2015)——我国党报语言变迁的一个视角”(15C0573)。

邹晓玲(1979- ),女,讲师,博士,从事传媒语言、现代汉语词汇学研究。

H0-05

A

2095-7602(2017)05-0065-06

猜你喜欢
常用字用字共用
容易混淆的词语
《汉语大字典》“人名用字”考误举隅
科技论文表格的编排要求(五):用线和用字
GSM-R网络新设共用设备入网实施方案研究
关于常用字覆盖率统计算法的研究
解决因病致贫 大小“处方”共用
辽代避讳用字“元”
谈常用字词的选取及其等级划分
北京地铁1号线四惠试车线多线共用解决方案
同时进行