于媛慧,张海涛,李滨江,周翠宁,刘 武
(1.中国水利水电科学研究院,北京 100038;2.清华大学,北京 100084;3.中国水利水电科学研究院流域水循环模拟与调控国家重点实验室,北京 100038;4.黑龙江省水文局,哈尔滨 150001)
加强用水总量统计工作是落实最严格水资源管理制度的重要任务,是最严格水资源管理考核工作的重要支撑,是水资源管理的一项重要基础性工作[1]。自1997年以来,水利部每年编制发布《中国水资源公报》,逐年统计并发布全国、各流域、各区域和各行业用水量情况;各流域机构和各省级行政区均开展了本流域和本区域年度水资源公报编制工作等,这些工作为加强用水总量统计奠定了良好的基础。2010-2012年,我国开展了第一次全国水利普查,进行了经济社会用水情况的调查,水利普查经济社会用水调查为加强用水总量统计工作提供了重要经验。
目前我国用水量统计主要采用区域定额估算的方法,相对比较粗放,其精确性有待提高。针对用水统计的问题,本研究利用统计学方法,以黑龙江省为用水调查对象,对其生活、农业、工业用水统计进行误差分析,选择适当的抽样方法,进而提高抽样效率与抽样精度。
根据2015年水资源公报,黑龙江省总供水量为355.26 亿m3,其中,地表水供水量为196.72 亿m3,地下水供水量为157.74 亿m3,其他水源供水量为0.80 亿m3。黑龙江省总用水量为355.26 亿m3,其中,农田灌溉用水量为303.02 亿m3,工业用水量为23.84 亿m3,城镇公共用水量为3.12 亿m3,居民生活用水量为13.09 亿m3,林牧渔畜用水量为9.55 亿m3,生态与环境补水用水量为2.64 亿m3。
本研究对目前已开展调查的对象数量进行用水量统计误差测算。全省选取生活用水调查对象总户数为2 510户,常住人口有7 439人。其中:城镇居民常住人口有3 858 人,农村居民常住人口有3581人。农业样本灌区有449个,重点灌区216个,样点灌区233个。工业用水调查对象有1 281个,工业总产值4 292.48亿元,工业取用水大户804个。
(1)农业结构特征。黑龙江省2015年全年农业总产值5 044.9 亿元,粮食产量6 324 万t,农作物总播种面积1 479.5 万hm2,粮食作物播种面积1 432.8 万hm2。
根据水资源公报,全省农业灌区的实际灌溉面积456.6 万hm2,灌溉用水量303.02 亿m3,平均用水量6 786.9 m3/hm2,各地级行政区在3 000~9 963 m3/hm2之间。
(2)人口结构特征。根据黑龙江省2015统计年鉴,黑龙江省总户数为1 490 万户,总人口为3 747.0 万人。其中城镇人口1 841.7 万人,占总人口的49.15%;农村人口1 905.3 万人,占总人口的50.85%。城镇化率为49.15%,城镇人口和农村人口数量基本平衡。
(3)工业结构特征。黑龙江省传统产业居主导地位,数量多、比重大、覆盖面广。根据统计年鉴的汇总,全省工业规模以上的企业数量为4 113个,其中哈尔滨市企业个数最多,为1 397 个,占规模以上总数的33.97%。黑龙江省2015年工业总产值为11 607.93 亿元,其中大庆市的工业产值最多,为3 321.40 亿元,占总产值的28.61%。
抽样误差是由于样本随机抽取造成的样本值与总体值之间有差异而导致的误差[2]。在抽样调查过程中,由于抽样调查为非全面调查,其抽样误差不可避免。尽管抽样误差无法避免,但是可以通过改变样本量的数量对其计量并加以控制。抽样误差与样本量的平方根呈反比关系,在其他条件相同的情况下,样本量越大,抽样误差越小,如图1所示。
图1 抽样误差与样本量的关系图
本文主要采用常规的抽样方法进行误差分析,其主要包括简单估计抽样、比率估计抽样和分层抽样。全省用水总量误差采用对各行业的抽样误差加权分析的方法进行计算。
由于规模以上的取用水大户全部入样,抽样误差为0,规模以下的误差则与选取的样本量有关。以用水量作为总体目标的话,一个行业用水的抽样误差为规模以上抽样误差和规模以下抽样误差的水量加权平均值。而对于国民经济行业全口径用水量的抽样误差为分行业抽样的水量加权平均值。那么,全口径用水量误差的分析公式为:
(1)
本文以第一次全国水利普查的取用水户为对象,对黑龙江省农业、工业、生活等行业进行误差分析。
农业用水采用简单估计和比率估计的方法进行误差分析对比研究。
(1)简单估计抽样。简单估计抽样是以样本均值的N倍作为总体总量的估计,根据均值估计量与样本总体个数的乘积获得用水量的估计量。
(2)比率估计抽样。比率估计抽样根据均值估计量与辅助变量的乘积获得用水量的估计量。比率估计量是有偏的,当样本量n较大时,估计量的偏倚会趋于零,此外由于比率估计利用了总体的辅助信息,往往能提高估计的精度。一般情况下,对于水源工程或者用水户的数量较大,可认为比率估计是无偏的。
双侧分位数t取1.96时,农业用水的抽样误差与样本量的关系表达式为:
(1)简单随机抽样:
(2)
(2)比率估计抽样:
(3)
根据表达式绘制误差曲线,如图2所示,相同样本量情况下采用比率估计的误差较小,当选取449 个灌区作为样本时,采用简单估计和比率估计的抽样误差分别为26.2%和4.25%,采用比率估计法抽样误差降低了6倍。由此说明,对农业用水进行抽样,采用实灌面积进行比率估计比简单估计的抽样效率要高很多。因此,农业用水推荐使用比率估计的方法进行误差计算。
图2 农业用水抽样误差与样本量关系图
对于工业用水的误差分析,简单估计和比率估计的计算方法与农业用水相同,分别为11.8%和18.0%,但推求的误差没有较大差距,主要有两个方面的原因:一个方面是工业行业包括的行业类别较多、用水工艺相差很大,即便是同一个行业用水效率相差较大,在空间分布比较离散,不容易选样;另一方面,由于产值信息与企业的税收有直接关系,很多企业不愿提供真实的数据。因此工业用水必须采取分层抽样才能有效降低抽样误差。一般情况下,采用分层是降低误差的最佳途径。本文按照工业行业大类分层进行抽样误差估算,由于采用简单估计的误差较小,因此选择简单估计的分层抽样设计抽样方案。
分层随机抽样有二个必要条件:①每层都进行抽样,使得样本在总体分布中更加均匀、更具代表性;②抽样应在每一层中独立进行。
根据样本个数进行分层抽样计算的各项参数见表1。
根据表1的统计参数,双侧分位数t取1.96时,根据样本个数进行分层,工业用水的抽样误差与样本量的关系表达式为:
(4)
经过分层抽样分析,变异系数为0.63,误差值为5.6%。
通过对简单估计、比率估计和分层估计分别所推求的误差结果进行对比可知,采用分层抽样的误差减小较明显。由此说明,对工业用水采用分层抽样的方法可以较明显的提高抽样效率。对比情况见图3。
表1 黑龙江省工业用水分层抽样统计参数
图3 工业分层抽样与简单估计抽样关系比较图
对生活用水采用简单抽样、按户籍人口比率抽样和按常住人口比率抽样的方法进行误差分析。
双侧分位数t取1.96时,生活用水的抽样误差与样本量的关系表达式为:
(1)简单随机抽样:
(5)
(2)比率估计抽样(户籍):
(6)
(3)比率估计抽样(常住):
(7)
根据表达式绘制误差曲线,如图4所示,比率估计明显比简单估计的抽样误差要小,以常住人口为7 439 人为样本时,采用简单估计、户籍人口比率估计和常住人口比率估计的抽样误差分别为17.28%、0.63%和0.38%。由此说明,对生活用水进行抽样,采用人口进行比率估计比按照户数进行简单估计的抽样效率要高。因此,推荐使用常住人口比率估计的方法进行误差计算。
图4 生活用水抽样误差与样本量关系图
黑龙江省农业总用水量303.02 亿m3,占全省总用水量的89.14%,通过误差加权计算分析,采用简单估计和比率估计的方法得到的农业用水误差分别为16.99%和2.76%;工业总用水量23.84 亿m3,占全省总用水量的7.01%,通过误差加权计算分析,采用简单估计、比率估计和分层抽样的方法得到的工业用水误差分别为4.60%、7.02%和2.18%;生活总用水量13.09 亿m3,占全省总用水量的3.85%,通过误差加权计算分析,采用简单估计和比率估计的方法得到的生活用水误差分别为17.28%和0.38%。
根据误差分析结果可知,农业用水和生活用水推荐使用比率估计的抽样方案进行误差分析,工业用水推荐使用分层抽样的方案进行误差分析;因此,全省总用水量的误差分析推荐综合使用农业用水和生活用水的比率估计的误差与工业用水的分层抽样误差进行加权计算,其用水误差为2.63%。
分行业用水量误差分析结果见表2。
表2 黑龙江省分行业用水量占比和误差值汇总
(1)本研究主要选用简单估计、比率估计、分层抽样等统计学方法对黑龙江省各行业用水进行误差分析,遴选适合的分析方法。通过分析可知:农业用水误差分析采用实灌面积进行比率估计的方法;工业用水误差分析采用按行业分层抽样的方法;生活用水误差分析采用常住人口进行比率估计的方法。
(2)对农业用水、工业用水和生活用水选取的抽样方案所得的抽样误差进行加权计算,得到用水总量误差,提高了样本整体的误差精度。由此说明,省级用水误差分析的样本量基本可以满足抽样误差的需求,用水总量误差分析应综合考虑不同行业采用的抽样方案,进而提高抽样效率。
本文论述了用水统计误差分析的理论与方法,定量分析用水量统计数据存在的误差范围,基于分行业取用水户的分布特征研究了用水量统计的抽样误差分析方法,实现了常规用水量统计无法推断误差到可定量分析分行业用水量抽样误差的转变,为逐步提高用水统计的抽样精度、抽样效率和科学性有重要的意义。
□
参考文献:
[1]国务院关于实行最严格水资源管理制度的意见[Z].国发[2012]3号,2012.
[2]何晓群.现代统计分析方法与应用[M].2版.北京:中国人民大学出社, 2010.
[3]甘泓, 游进军, 张海涛.年度用水总量考核评估技术方法探讨[J].中国水利, 2013, (17) : 25-28.
[4]陈家琦, 水文与水资源文选[M].北京:中国水利水电出版社, 2003.
[5]金勇进, 杜子芳, 蒋妍.抽样技术[M].3版.北京:中国人民大学出社, 2012.
[6]Industrial Water Use[M].Statistics Canada,2012.
[7]Estimated Use of Water in the United States in 2005[Z].U.S.Department of the Interior & U.S.Geological Survey,2009.
[8]第一次全国水利普查领导小组办公室.第一次全国水利普查公报[N].2013-03.
[9]曾五一.统计学概率[M].北京:首都经贸大学出版社, 2013.