浅谈造价指标编制中常用的三种统计参数

2014-12-13 02:54孙良辰宋国红张优张若斯
中国科技纵横 2014年17期
关键词:算数置信区间数组

孙良辰 宋国红 张优 张若斯

(中国石油集团工程设计有限责任公司北京分公司,北京 100101)

浅谈造价指标编制中常用的三种统计参数

孙良辰 宋国红 张优 张若斯

(中国石油集团工程设计有限责任公司北京分公司,北京 100101)

本文介绍了在造价指标编制中可以采用的算数平均数、中位数及方差三种最常用的统计分析参数

指标编制统计参数平均数中位数标准误差

各类造价指标是常被工程造价人员在估算、概算或预算的编制、校对及审核中使用的重要工具之一。当前,造价指标的编制主要依靠经验估算法及类比法进行编制,这两种方法的应用不仅仅要求编制人员具有一定的经验,而且受到造价人员主观经验的影响,编制出指标的准确性也存在一定的争议。相比经验估算法及类比法,使用统计分析编制指标的方法不仅减少了人为因素对指标的影响,更使得指标编制对编制人员经验的依赖大大降低。下文将介绍在统计分析法中最常用的三种统计分析参数:平均数、中位数、标准误差。

1 算数平均数及中位数

算数平均数是一组数据之和除以数据的个数所得的参数。算数平均数是被造价人员最广泛应用的描述数据资料综合集中趋势的统计参数,例如,在指标编制过程中,编制人员常常以同样设备材料的不同价格数据的算术平均数估算该设备材料价格。当数组中的数据间差值较小的时候,如表1中数组1的数据,算术平均数确实可以反映出数组的集中趋势,但是在数列中出现了极端变量值的情况下,如表1中数组2的数据所示,算术平均数则存在一定的误差,在这种情况下,中位数则更适合用于反映数组的集中趋势。中位数,是指将统计总体当中的各个变量值按大小顺序排列起来,形成一个数列,处于变量数列中间位置的变量值就称为中位数,相比算数平均数,中位数不受数组中极端变量的影响。

表1

表2

图1

表1中的两组数据分别为实际项目中,工程施工费用占工程总投资比例。从右侧的图1及图2中可以看出,数组1中数据间的差异较小,集中在30%至50%之间,且没有异常值的出现,然而数组2中的数据差异较大,且存在少量的异常值。因此,根据上文所述,数组1更适合以算数平均法测算施工费用投资比例的控制指标,而数组2则应以中位数测算。

表2即为测算的结果。数组2的算术平均数由于受到低于20%水平的极端变量值的影响,明显低于数组的集中趋势,而中位数则更为公正的反映出数组的趋势。

2 标准误差

虽然,对中位数的应用可以提高测算数据集中趋势的准确度,但是无论是用平均数或中位数测算的指标都没有为指标和实际数据中可能存在的误差建立区间。然而,对于标准误差的应用则可以弥补这一点。

标准误差是通过方差计算的、用于衡量数据间差异大小的统计参数。标准误差的计算方法是是方差的平方根,n是数组中数据个数。有了标准误差,就可以计算出平均数在不同程度下的“置信区间”,表达式为

置信区间的范围是由置信度决定的,而置信度则要通过Z值的控制而确定。使用者可在标准正态分布表中按置信度查找对应的Z值。需要说明的是,置信度并不是区间所能覆盖的范围,如置信度是90%,这并不说明区间具有90%的准确性或置信区间覆盖了数组中90%的数据。置信度是测算者对于置信区间的精确度的设定,而非区间的准确度,置信度越高,区间的范围则越大。以数组1及数组2为例,数组1的95%及90%置信区间分别为:(36.9%,41.0%)和(37.3%,40.7%);数组2为(30.6%,40.6%)和(31.5%,39.8%)。在实际操作中,数据间的差异越大,设定的置信度则越高。一般常用的置信度为95%和90%,对应的Z值分别为1.95及1.69。

相对文中所介绍到的另外两种参数,标准误差(或方差)的计算方法相对繁琐。在现代统计中,分析者通常使用各类软件对参数进行计算。造价人员最常用的Excel就提供了以上三种参数的计算功能。

3 结语

综上所述,算术平均数和中位数都是描述数据资料综合集中趋势的参数。算数平均数适用于数据间的差异较小且没有异常值的情况,而当数据间的差异较大且有异常值时,则应选用中位数。通过标准误差所建立的置信区间则是综合了数据资料中实际存在的和测算中可能产生的误差。三种参数在指标编辑中的应用,不仅减少了人为因素对指标的影响,更使得指标编制对编制人员经验的要求大大降低。

图2

猜你喜欢
算数置信区间数组
定数截尾场合三参数pareto分布参数的最优置信区间
JAVA稀疏矩阵算法
p-范分布中参数的置信区间
多个偏正态总体共同位置参数的Bootstrap置信区间
JAVA玩转数学之二维数组排序
一屋三室
说话要算数
秋天不会算数
列车定位中置信区间的确定方法
人生没有白走的路,每一步都算数