陈齐金 王昌喜
(浙江《东阳市志》编辑部 浙江 东阳 322100)
方志资料记述,靠文字显性,凭图片定形,更依赖确切的数据定量。确保所用数据资料的准确性,是保证志书质量的前提条件。二轮志书要反映社会由计划经济向市场经济转型及经济体制改革,由于经济成分多元,企业利益追求各异,数据统计本身就十分困难,其准确性更是缺乏保障。考证方志数据资料的准确性是志书资料编排无法绕开的一项极其重要的工作。
如何考证方志数据资料的准确性呢?首先要确立方志所用数据都必须经过认真考证的指导思想。不管是旧方志或报纸上刊载的、相关单位上报的数据,还是各级政府统计部门发布的数据都要进行逐项考证。虽然统计部门的数据统计具有面对本行政区域全社会全方位、覆盖面广、内容深入的特点,是方志编写的首选数据资料,但由于经济转型,统计口径、范围时会发生变化,再加上统计人员素质、工作态度的差异,统计数据信度同样会产生各种各样的问题。
其次,考证方志数据资料的准确性,要掌握一些基本方法。下面笔者以某县级市统计局《1949—2008新XX六十年》(下面简称《新六十年》)381页关于1997年至2006年婚姻登记情况的表格为例,作一介绍。
11-9 婚姻登记情况
事物的发展都有一定的规律,有时数据错误,会使事物发展过程的记载显得不合情理。上表中1997年的“申请离婚数”是120对,而“准予登记离婚数”却有130对。从情理分析,上世纪90年代,民政局负责婚姻登记的干部接待前来要求离婚的夫妻,先要填写申请离婚登记表,然后做大量的思想工作,劝其和好;实在不能劝和的,再办理离婚手续。但这里却记载有10对没有经过申请离婚就“被离”了,显然有悖情理。经查该市民政局《1997年婚姻登记和收养登记工作统计表》,申请离婚数实际为170对。
在一般情况下,相同的地方,相近的时间段,调查同类的对象,所得出的统计数据应该相差不大;如果差额过大,就可能存在数据错误。上表中,该市一般年份的“准予登记结婚”数在6000对上下,而2003年只有常年的一半,2000年只有常年的二十分之一,显然有问题。经查《2003年浙江民政统计资料汇编》第382页,该市2003年的正确数据为:准予登记结婚数6249对,初婚数11667人,再婚数831人,准予登记离婚数396对。再查《2000年浙江民政统计资料汇编》第363页,2000年的正确数据为:准予登记结婚数5890对,初婚数11277人,再婚数503人,男260人、女243人,准予离婚数210对。
统计分组表,分为封口组和开口组两种。封口组的各项数字之和应当等于合计数。开口组不设“其它”栏,各项之和允许少于合计,但不能相差太多,要符合实际。这种关系可以通过求“和”(或差)的办法分辨真伪。有时表中的数字还有“积”(或商)的关系。例如上表中前三栏的关系大体是:(初婚人数+再婚人数)÷2=准予登记结婚对数,一般年份都合乎这个算法。只有2004年,按格式计算应是(13196+46)÷2=6621,比原表中的“准予登记结婚对数”6618对多3对。还有2005年按格式计算为(10002+788)÷2=5395,比原表中的“准予登记结婚对数”5878对少了483对,可以判断有问题。经查该市民政局婚姻登记处《2005年民政事业统计年报》,正确数据确实是5395对。
上面,我们采用了多种方法分析数据,而最基本的是类别比较法。我们拿到各种同类的调查统计表时,如果发现应该相同的数据变得不同了,应该相近的数据相差太远了,我们就应该认真复查核对,看看相应数据是否真实可信,认真查明原因,加以纠正,既不能马虎了事,又不能主观乱改。方志志稿中的数据主要来自政府统计部门的资料,而这些资料又是有关单位上报的,如果发现统计部门资料有问题,就要查考各单位的原始资料,如发现原始数据有误或几处来源不一致时,应对数据作更深入的考证。
《新六十年》第450~452页2006年至2008年《乡镇基本情况》的总户数、总人口有误,与该市公安局《人口及其变动情况统计年报表》不一致。2006年的统计数据应以2006《XX统计年鉴》分乡镇总户数、总人口数为准,2007年的统计数据应以《XX改革开放三十年统计资料1978~2007》第49页分乡镇总户数、总人口数为准,2008年的统计数据应以《新六十年》第261页2008年分乡镇总户数、总人口为准。
《新六十年》第33页1991年夏秋玉米面积310公顷,单产36800公斤。每亩单产竟高达2453公斤,不合情理,可以断定数据有误。那么确切数据应该是多少呢?
经查《XX统计年鉴1990—1995》,第23页记载1991年夏秋玉米总产量11408吨,第25页记载1991年夏秋玉米单产3630公斤,依据“总产量÷单产=公顷数”的公式,“11408吨÷3630公斤=3142公顷”。而查第21页,1991年夏秋玉米面积为0.31千公顷,相当于310公顷,大概是在将“公顷”数转换为“千公顷”数时弄错了小数点的位置。随后《XX五十年1949—1998》25页和《新六十年》33页面积又照抄错数,单产重新计算错为36800公斤,致使统计年鉴和汇编里的数字发生一系列错误。
讲到计算核对,这里介绍两种简单易行的方法,在检查数据时或许用得上。
1.检查各项之和是否等于合计数,可先采用尾数(指个位数)相加检验法,如每个数字的尾数相加之和的尾数与表上原合计数的尾数不同,则原合计数肯定有误。
2.在检查统计表的合计数时,如果将正确数字和错误的数字相减,差是9(或90)的倍数,那么可能在计算时将某个数字的个位与十位(或十位与百位)的数字颠倒了。现在多采用电脑编纂、排版,这种问题出现的几率增高,应充分关注。例如有以下一组数字:
424 362 543 192 725 268 124 267表中原合计数为2932。
首先检查尾数之和,4+2+3+2+5+8+4+7=35,和的尾数是5,和原表合计数的尾数“2”不同,说明原合计数有误。要进一步查清问题所在,还应将全部数字相加,求得和是2905,与原来合计数相减,即2932-2905=27,差是9的倍数,那么,我们就只要找出个位、十位换位后,相差27的数字,大概就是725应该换成752了。经过核查,确实如此。如果差是90的倍数,就要检查十位和百位的数字换位的问题,以此类推。
识别和校核数据正确与否是极为重要的,但在识别和校核时还应注意:
在《新六十年》中,有几个街道和镇乡的统计数字变化很大,和这几个街道及镇的管辖范围的变化紧密相关。区划变了,即统计范围变了,统计数据肯定要随之变化,如果简单地套用上面的差额审视法等,就会犯瞎子摸象的错误。
还有《新六十年》第82页,“工业企业单位数(乡及乡以上、规模以上)”一栏的数据,1997年为274个,1998年为127个,是不是1998年突然压缩了一半多?其实不然,1997年及以前的数据为乡及乡以上的企业数字,而1998年及以后为规模以上的企业数字,因此1998年的工业企业单位数比1997年减少了53.6%,其实整个市的企业数和工业总产值是持续增加的。可见,分析记载的角度或口径变了,数据也会随之变化。我们切不可将正确的误判为错误的。
发现数据错误,难;纠正数据错误,更难。审核发现错误只是发现问题,纠正错误才能解决问题。我们应该端正态度,遵循严谨科学、全面系统的原则,运用正确有效的方法,认真分析、把握数据资料,确保所用数据达到真实准确、彰明因果的要求,为编写精品佳志打好资料基础。