魏同利 ,郝惠娟
(1.北方民族大学,宁夏 银川 750021;2.宁夏大学,宁夏 银川 750021)
等间距线性数据的标准偏差
魏同利1,郝惠娟2
(1.北方民族大学,宁夏 银川750021;2.宁夏大学,宁夏 银川750021)
摘 要:对大学物理实验中两种不同类型的等间距线性数据进行了区分。第一类线性数据中,等权独立的误差来源于对每一位置的测量而与其它位置的测量无关,应该把每一测量点对最佳直线的偏离作为研究对象,其它参量的标准偏差应该从该对象的标准偏差为出发点求得;第二类线性数据等权独立的误差来源于每一次测量过程的增加量,应该把每一次测量的增加量同最佳增加量的偏离作为研究对象,其它参量的标准偏差应该从此对象的标准偏差为出发点求得。针对这两类数据,分别按照算术平均值法、逐差法和最小二乘法的原则进行处理,给出了符合其数据类型对象的最佳斜率表达式和它们的标准偏差表达式.给出了它们的比较:第一类线性数据的最小二乘法处理的最佳斜率的标准偏差最小;第二类线性数据的算术平均值处理给出的标准偏差最小。
关键词:算术平均值法;逐差法;最小二乘法;标准误差;标准偏差
关于线性数据处理的三种方法平均值法、逐差法和最小二乘法的理论和实践方面的讨论已经持续了一些时间[1-12]。杨卫群提出了“用逐差法处理数据不科学[5]” 的提法,潘克宇和杜金潮则提出相反的意见,认为“逐差法弥补了算术平均法处理数据的不足[6]”;单明和聂燕萍论证了用逐差法求得斜率B的估计值bz,虽然不是B的方差最小最佳估值,但也是一个较好的估值,因其方差已接近最佳估值bl的方差.由于逐差法只需用简单的代数运算就可以得到相应的结果,因此物理实验教学中全部以最小二乘法取代逐差法是不妥的[7];也有一些作者认为“逐差法处理同一组实验数据时相对一般算术平均法能减小线性系数b的标准偏差,相对最小二乘法计算过程更简单[8]”;高永祥认为“普通最小二乘法与加权最小二乘法的前提条件和基本假定是不相同的,不能在相同模型下比较普通最小二乘法和逐差法(加权最小二乘法)的优劣,否则,方法和模型会产生矛盾,得出错误结论”,给出不能否定也不能滥用逐差法的论断[9]。也有一些同志重点讨论了逐差法的独特优越性:吕大韵提出“就其本质而言,逐差法主要是为了减小系统误差的影响[10]”;左安友、余兰山和李兴鳌提出“逐项逐差”的结果, 能及时检查数据规律,发现有无系统误差[11]。
但是现行的研究相对局限在对方法本身“好或不好”的讨论上,而对所处理的“对象(数据)”缺乏深入的研究。我们认为每种方法都有其适用的范围,方法是否合用,在于该方法的假定和具体数据之间的贴近程度。故我们认为需要对数据本身作深入的研究,本文以牛顿环实验和迈克尔逊干涉仪测激光波长两种典型的线性数据为例,讨论了两类不同假设的数据类型.一类数据假设每一个测量点对客观直线的偏离是等权的,应该选择各点到直线的距离的标准偏差最小的直线,任一点的标准偏差就是各点到最佳直线的距离的标准偏差;另一类假设等量增加Δx时所对应的Δy的误差是独立且等权的,应该选择一个合适的Δy,以使得各个Δyi对其偏离的方差最小,任一Δyi的标准偏差以选定的最佳值Δy进行计算,其它量的标准偏差的计算都应该以此标准偏差为单位进行计算。
粗看这两种假设是等价的,但在我们对最佳斜率b的标准偏差的计算中可以看出,不同假设下的结果完全不同。第一种类型的数据,完全符合最小二乘法的假定,经计算,最小二乘法得到的最佳斜率的标准偏差最小;第二种类型的数据符合算术平均值法的假定,通过运算,此法所得的最佳斜率的标准偏差最小.故所谓方法的优劣不是绝对的,针对特定的数据类型选用合适方法是一种自然的做法。针对这两种类型的线性数据,最小二乘法的适应性最好,由最小二乘法得到的最佳斜率b的标准偏差分别为最优(最佳结果)和次优(最佳结果的1.095 4倍);逐差法也是不错的,由其所得的最佳斜率b的标准偏差都为最佳结果的1.154 7倍。
1线性数据的分类及其研究对象
在数据之间,若理论上满足线性关系y=bx+a,依据误差来源的不同,我们认为存在两种典型情况:
νi=yi-bxi-a
(1)
若假设任一yi的标准误差与位置无关,则各νi等权且独立,其标准偏差可计算为[2-4,12-13]
(2)
其中b为最佳直线的斜率,而a为最佳直线的截距.这种类型的线性数据的处理方法与最小二乘法的处理原则是一致的:以S(y)来衡量每次测量的随机误差.该类型数据的测量过程中,其x的正确性来源于每次测量的读取,而与历史无关。
另一种类型的误差来源有所不同.这种类型的线性数据的测量过程表现为,在已经测得的数据(xi-1,yi-1)的基础上,增加Δx,测量xi+Δx所对应的yi.每增加一个Δx,理论上应该在前次的测量值yi-1的基础上增加一个客观存在的Δy,所以已经测得的yi-1对yi的测量值有直接的影响.这种测量类似于通过使用某种量具,每次量取对应固定变化量Δx 的Δy,其误差来源于每次测量中的量取误差,每次的量取误差是等权的,所以我们认为在这种数据中,应该把各个Δyi的测量误差看作等权且独立的误差来源。在迈克尔逊干涉仪测激光波长的实验中,每“涌出”或“缩进”ΔN 个干涉圆环,读取一次M1 镜的位置,是这种线性数据的典型代表。我们选取增加特定Δx所增加的Δy为研究对象:
Δyi=yi+1-yi
(3)
其标准偏差为
(4)
Δym为Δyi的某种加权平均,其值应该使得S(Δy)最小。该类型数据的测量过程中,其x的值为xi-1+Δx,xi-1依赖于历史测量,Δx依赖于当次测量。
2第一种类型线性数据的不同处理方法下其最佳斜率的标准偏差
第一类线性数据的处理原则和最小二乘法的处理原则完全一致.在我们讨论中,为了方便比较,假定存在有2n组数据,且x等间距变化。其每一点的y的标准偏差调整为
(5)
斜率b的计算公式[1-4,12]为
(6)
最小二乘法方法处理下最佳斜率b的标准偏差计算如下
(7)
对于逐差法,其最佳斜率的计算公式为
(8)
斜率的标准偏差S(bz)可以很容易的求得
(9)
对于算术平均值法,其斜率的表达式为
(10)
标准偏差S(bm)为
(11)
3第二种类型线性数据的不同处理方法下其最佳斜率的标准偏差
对于第二种类型的数据,其每次的增加量之间互相独立且具有相同的标准误差。故第二种类型的数据的处理原则和算术平均值法的原则完全一致。其“最佳”斜率的公式可写成如下形式
(12)
易得其标准偏差为
(13)
对于逐差法,其最佳斜率经计算可得
(14)
斜率的标准偏差S(bz)可以求得
(15)
目前逐差法常用的关于不确定度的一些相关计算,对于第二种类型数据是错误的。如迈克尔逊干涉仪测激光波长的数据处理中,把ΔDi=dn+i-di看作等精度的独立测量量,实际的情况是ΔDi之间并不独立,因为在它们之间是有共用数据的(ΔD1和ΔD2之间就有d2.到dn+1之间的数据共用),不独立的数据不能直接使用求方和根的方式求得其标准偏差。
对于最小二乘法法,经计算,其最佳斜率的表达式为
(16)
标准偏差S(bl)的计算结果为
(17)
4结论
具体的测量中,必须仔细分析误差的性质和来源,以确定线性数据的种类,选用合适的处理方法。第一种类型的线性数据,最小二乘法得到的最佳斜率的标准偏差最小,逐差法结果与其比较接近(1.154 7倍);第二种类型的线性数据,三种处理方法所得到的最佳斜率的标准偏差相差不多,算术平均值法的结果稍小一些,最小二乘法和逐差法的结果是其1.095 4倍和1.154 7倍。
参考文献:
[1]俞大刚.线性回归模型分析[M].北京:中国统计出版社,1987.
[2]朱鹤年.物理实验研究[M].北京:清华大学出版社,1994:83-103.
[3]朱鹤年.再谈物理实验中的直线拟合[J].工科物理,1994(3):23-26.
[4]成正维,王玉凤,李朝荣,等.大学物理实验[M].高等教育出版社,2004(6):35-36.
[5]杨卫群.用逐差法处理数据不科学[J].大学物理实验,2001,14(2):46-48.
[6]潘克宇,杜金潮.逐差法弥补了算术平均法处理数据的不足[J].大学物理实验,2003,16(1):60-62.
[7]单明,聂燕萍.线性拟合中的逐差法和最小二乘法的比较[J].大学物理实验,2005,18(2):68-70.
[8]潘小青.逐差法及其应用探讨[J].大学物理实验,2010,23(2):86-87.
[9]高永祥.对逐差法拟合直线的讨论[J].大学物理,2010,29(11):31-34.
[10] 吕大韵.对逐差法处理实验数据的讨论[J].物理通报,1999(10):39-41.
[11] 左安友,余兰山,李兴鳌.再论用逐差法处理实验数据[J].大学物理实验,2003,16(2):64-65.
[12] 刘渊.误差理论与数据处理[D].大连:大连理工大学,2008:79-84.
[13] 陈奎孚,李岩峰.从逐差法到对差法[J].大学物理实验,2015(5):118-122.
The Standard Deviations of Linear Dates with Equal Intervals
WEI Tong-li1,HAO Hui-juan2
(1.Beifang University of Nationalities,Ningxia Yinchuan 750021;2.Ningxia University of Nationalities,Ningxia Yinchuan 750021)
Abstract:Two types of linear dates have been distinguished.The standard deviation has been calculated by method of the mean values,the successive minus and the least squares respectively,there comparison has been given.For the first kind of linear dates,the independent errors with equal rights is derived from the measures of the locations and has nothing to do with the position measurement in different place,the method of least squares gives the minimal standard deviation.For the second type of linear dates the independent errors with equal rights is derived from the increment in the process of measuring,the method of arithmetic mean gives the minimal standard deviation.
Key words:method of arithmetic mean;method of least squares;method of successive minus;standard errors;standard deviation
收稿日期:2015-11-27
基金项目:宁夏哲学社会科学规划项目(15NXBYJ06)
文章编号:1007-2934(2016)02-0106-04
中图分类号:O 4-33
文献标志码:A
DOI:10.14139/j.cnki.cn22-1228.2016.002.028