文/中共锦州市委党校 刘美伯
公文是具有特定效力和规范体式的文书,是重要的信息载体,在各单位之间与单位内部公务活动中均发挥着重要作用。因此,公文应能做到准确表达写作意图,以便顺利推进相关公务活动。
公文写作意图的准确表达离不开词的运用。词是最小的能够独立运用的有音有义的语言单位[1],是基础的语言材料,每一篇公文都是由词按照相关语法规则组合成句、缀合成篇。准确用词才能准确表义,因此,公文用词研究十分必要。本文通过搭建小规模语料库进行研究,运用定量和定性相结合的研究方法对语料库内的文本内容进行统计分析,得出直观的公文词频统计数据,并通过数据分析,寻找公文语言的客观使用规律。
语料库语言学是语言研究与相应的计算机技术相伴相生的产物,是语言研究中定量和定性方法相结合的典范[2]。研究中的客观数据可以作为原有直觉经验的有益补充,更直观地体现公文用词情况及内在规律。选取合适的文本建立语料库,需对自然语料文本进行收集、整理、处理。语料库建成后,再对其中大量且真实的语料按需进行统计,最终得出相关数据。本文侧重于对语料库中各词词频数据的统计,以找到其中频次较高的词语。
(一)语料库的建立。语料库建设的关键在于如何选择恰当的语料,所选语料需要具有代表性和准确性。《中华人民共和国国务院公报》集中、准确地刊载了:国务院公布的行政法规和决定、命令等文件;国务院批准的有关机构调整、行政区划变动和人事任免的决定;国务院各部门公布的重要规章和文件;国务院领导同志批准登载的其他重要文件[3]。其内容代表性强、准确性高,是构建语料库合适的公文材料,因此,本研究选取2022年《中华人民共和国国务院公报》作为自然语料文本建立小型语料库。2022年《中华人民共和国国务院公报》包含公告、函、决定、令、批复、通报、通知、意见等法定公文文种,以及讲话等事务文书文种。在处理语料文本时,选取公文正文内容作为自然语料文本,删除题目、发文字号、署名、成文日期等内容,避免统计结果存在误差。一方面,建立综合语料库,涵盖上述所有文种,语料库近70万字;另一方面,选取其中文字量大,实际公文写作过程中接触较多的通知、意见、事务文书语料,建立了三个独立语料库,以便分析各文种用词规律的异同。
(二)词频统计。第一步,运用国家语委语料库的分词系统,对综合语料库和独立语料库中的内容进行分词处理,同时标注词性。例如,“加强组织领导”通过分词处理将变为“加强/v”“组织/n”“领导/n”。第二步,将分词结果以词为单位全部导入Microsoft office excel软件,运用数据透视表工具,分别统计综合语料库和各独立语料库内各个词出现的频率。第三步,进行数据核查,删除其中的“,”“。”“、”“!”等标点符号,整理综合语料库和各独立语料库的词频统计结果,并按词频数从高到低进行排序。
(一)综合语料库统计结果。根据词频高低,选取综合语料库频次最高的40个词汇总成表,从高到低排序,见表1。
表1 综合语料库词频统计结果
(二)独立语料库统计结果。1.通知语料库。根据词频数值,选取通知语料库频次最高的20个词汇从高到低排序,词语及对应词频分别为:的(865次)、和(650次)、各(415次)、等(363次)、工作(245次)、管理(228次)、机构(228次)、对(223次)、发展(205次)、加强(199次)、要(198次)、国务院(185次)、部门(160次)、国家(156次)、落实(155次)、负责(152次)、局(147次)、建设(146次)、在(143次)、为(142次)。2.意见语料库。根据词频数值,选取意见语料库频次最高的20个词汇从高到低排序,词语及对应词频分别为:的(3343次)、和(2639次)、等(1727次)、服务(1475次)、发展(1110次)、建设(988次)、加强(933次)、工作(871次)、推进(853次)、管理(776次)、国家(682次)、企业(669次)、各(659次)、对(656次)、部门(626次)、要(598次)、推动(584次)、在(564次)、机制(534次)、支持(529次)。3.事务文书语料库。根据词频数值,选取事务文书语料库频次最高的20个词汇从高到低排序,词语及对应词频分别为:的(3419次)、和(1566次)、发展(1100次)、中国(805次)、在(655次)、是(617次)、要(597次)、我们(581次)、了(580次)、新(517次)、为(508次)、人民(500次)、国家(459次)、经济(452次)、建设(439次)、坚持(423次)、合作(420次)、党(410次)、推进(334次)、推动(303次)。
词语出现频率能够在一定程度上体现相应的语言运用规律。上述词频统计表中均包含了实词和虚词。通过对词频较高的实词进行分析,可以了解词在不同公文文种中的常见搭配,了解常见的用词方法;通过对词频较高的虚词进行分析,能够通过虚词掌握其在公文中构成的常用句式。词频统计分析结果可以帮助写作者更好地掌握用词方法。
(一)搭配分析。从各数据库词频统计表中可以看出实词占比较大,其中动词和名词较多,形容词较少,体现了公文不注重形容词修饰,更注重实意表达的特点。综合语料库词频排在前三位的实词分别是“发展”“建设”“服务”,这三个词语均是表示行为的动词,通过不同语料库中这三个词语的词频对比分析及词语搭配对比分析,可以发现同一词语在不同文种中的重要性差异和常见搭配的异同。1.发展。“发展”一词在综合语料库中排在第3位,频次为2729;在通知语料库中排在第9位,频次为205;在意见语料库中排在第5位,频次为1110;在事务文书语料库中排在第3位,频次为1100。通过分析词频及其排序位置,可以看出“发展”在各语料库中都是核心词汇,尤其是在事务文书语料库中频次排名第3,位于前列。在通知语料库和意见语料库中,“发展”的常见搭配包含“高质量发展”“新发展理念”“新发展格局”“经济社会发展”“发展战略”“发展规划”“发展阶段”“发展理念”“发展格局”“健康发展”“创新发展”等。事务文书语料库中的搭配除了上述内容外,还包含了“全球发展”“发展中国家”“可持续发展”“和平发展”“繁荣发展”“融合发展”“发展合作”等。2.建设。“建设”一词在综合语料库中排在第5位,频次为1822;在通知语料库中排在第18位,频次为146;在意见语料库中排在第6位,频次为988;在事务文书语料库中排在第15位,频次为439。“建设”一词在各语料库中的排序稍有不同,在意见语料库中排序更加靠前,说明该词在意见文种中更为常用。“建设”在通知和意见语料库中搭配相近,常见搭配为“设施建设”“体系建设”“能力建设”“生产建设”“建设项目”“队伍建设”“加快建设”等。略有不同的是,通知语料库中“生产建设”出现频次较高,意见语料库中“设施建设”“体系建设”出现的频次较高。其在事务文书语料库中的常见搭配与上述二者区别较大,常见搭配为“全面建设”“建设社会主义现代化国家”“现代化建设”“加快建设”等。3.服务。“服务”一词在综合语料库中排在第7位,频次为1776;在意见语料库中排名较为靠前,排在第4位,频次为1475;在通知语料库中和事务文书语料库中排名稍后,频次也较低,排名分别为25和104,频次分别为135和112,这些数据表明“服务”一词在意见文种中更为常见。其在意见语料库中的常见搭配为“政务服务”“公共服务”“服务事项”“服务平台”“服务体系”“服务中心”“服务机构”“服务设施”“服务能力”等。
(二)句式分析。各数据库词频统计表中也包含了部分虚词,排在前列的是“的”“和”“等”“为”“在”,其中,“为”和“在”均能构成公文中的常见句式。1.“为”字句。“为”在综合语料库中词频为1793,排在第6位,在法定公文和事务文书中都较常出现。通过对综合语料库中的语料进行归纳整理,可以看出“为”可以位于句中,也可以位于句首。“为”字句表义大致可分为两类;一类表示行为的对象,通过“为”的使用,突出行为指向的客体,如“坚持为人民服务、为社会主义服务方向”;一类表示原因、目的,这类“为”字常出现在句首,表明一篇公文或某一段落的写作目的,为后面的具体行文内容做铺垫,如“为适应‘十四五’时期的新形势新任务新要求”。2.“在”字句。“在”在综合语料库中词频为1602,排在第9位,可见其在公文成句行文过程中发挥着重要作用。通过对语料进行汇总整理,可以得出“在”字句的使用规律和表义特征。“在”字句中,“在”往往组成介词短语,位于句首时后接动词短语,位于句中时接在动词短语之后。“在”字句在表义上侧重于突出和强调重点内容,限定工作范围或前置条件。这样的表达有助于受文者准确了解公文意图,提高公文信息传递效率。将表义细分,大致可分为四类:第一,表示事件发生时间,如“在今年9月举行的上合组织撒马尔罕峰会上,各方就上合组织发展达成新的共识”;第二,表明行为发生的处所,如“把矛盾隐患化解在当地、解决在基层”;第三,明确行为所限范围,如“在专利转化专项计划实施中予以倾斜支持”;第四,限定相关条件,如“在人民的壮阔奋斗中,随处跃动着创造历史的火热篇章,汇聚起来就是一部人民的史诗”。
词是语言的建筑材料,是构成公文语言的重要基本单位,也是公文研究领域的重要研究对象,因此,公文词语及用词研究十分必要。语料库研究是一种较好的词语研究方法。通过建立小型公文语料库,采用定量研究的方法开展词频统计,获取数据统计结果。在此基础上,进一步采用定性研究方法分析数据,结合语料能够发现语料库内公文文本中的实词和虚词的客观用词规律。相关研究结果也可以推广到公文语言的运用过程中,帮助写作者在写作活动中准确、灵活用词,为公文写作活动提供助力。