朱晓东, 鲁铁定, 陈西江
(东华理工大学测绘工程学院,江西抚州 344000)
正交多项式曲线拟合
朱晓东, 鲁铁定, 陈西江
(东华理工大学测绘工程学院,江西抚州 344000)
介绍最小二乘法拟合曲线的原理并且找出这种拟合方法的不足,针对这种不足提出另外一种新的拟合方法正交多项式拟合。这种方法能弥补最小二乘拟合中的x拟合y和y拟合x出现的曲线不一样的现象。这种方法经过数据实验精度比最小二乘法拟合更高,而且这种方法中的多项式系数 a可以根据自己的精度需要来自主选择迭代的次数,使得结果更加精确。
最小二乘拟合;正交多项式;随机误差;残差
在曲线拟合中一般都是以 x或 y为因变量,以y或 x为自变量应用最小二乘法来处理。但是用这种方法来处理有一个前提,自变量和因变量两者中必须有一个量是没有误差的精确值。在工程测量中所得的测量数据是不可能绝对准确、没有误差的,显然与这种情况不符,自变量的误差常常被忽略。当自变量的误差较大时,在曲线拟合中就应该加以考虑。笔者利用MATLAB设计正交最小二乘法拟合的程序来验证,运用间接平差原理来详细推导了相关模型和公式 (鲁铁定等,2009)。实例计算结果显示正交最小二乘法拟合曲线的效果优于普通最小二乘拟合法。
在科研计算和统计研究中,往往要从大量的实验数据 (xi,yi)(i=0,1,…,m)中寻找其函数关系y=f(x)的近似表达式 y=P(x)。但由于实验数据存在误差,所以只能用连续的曲线近似地描述平面或空间中的离散点组所表示的坐标之间的函数关系,其目的是根据实验建立因变量与自变量之间有效的经验函数关系。它包括拟合曲线模型的选取及拟合标准两个方面的问题。给定一系列的测点 (xi,yi),要求在给定的函数类φ中寻求一个最佳的函数,近似代替函数拟合函数 y=f(x),ri=yiφ(xi)为 i点的拟合残差 (陈基伟,2007)。拟合的最终目标是使得拟合的曲线最大限度逼近,并且使得拟合后的曲线与实际点的拟合残差总体上尽可能小,这种方法称为最小二乘法拟合曲线 (文世鹏,2005;张可村,2003),这里不再详细介绍。但是用这种方法来拟合的曲线经过实际数据验证发现用 x拟合 y和用 y拟合 x两个曲线相差很大并且精度也相差很多,出现这种情况的原因是因为拟合时这两种方法都是按照 x或者 y方向来处理的 (图 1),只是保证了在这一个方向上残差最小,并没有保证是该点到曲线的正交距离最小。因此需用另外一种方法来拟合 ——正交多项式拟合 (潘国荣等,2008)。
图 1 x拟合 y和 y拟合 x的曲线图Fig.1 The curve of x fitting y and y fitting x
在实际测量工作中所测得的一系列坐标点 x,y必然都存在随机误差,如果只用普通的多项式最小二乘法来拟合显然就有较大误差了。对于给定的点组,假设 xi,yi的随机误差分别为σi,γi,考虑到自变量的误差,拟合的函数模型可以表示为
其实残差 ri是到过曲线某点切线的垂直距离,拟合的准则为所有坐标点到拟合曲线的正交距离平方和最小。因此这种拟合方法称为正交距离回归 (丁克良,2010)(图 2),又称正交多项式最小二乘拟合法。拟合曲线的观测方程可以表示为
图 2 点到曲线的正交距离Fig.2 Po int to the curve of the o rthogona l distance
根据测量平差原理的间接平差方法对上述误差方程进行求解得
本算例的目的在于比较验证笔者介绍的这种方法来拟合曲线与普通最小二乘法拟合曲线的精度。
表 1 离散点的坐标Tab.1 The coo rdina te s of discre te po ints
由表 1中给出的数据分别用两种方法进行拟合并且比较两种拟合方法的精度,使用的两种方法都是拟合二次曲线。
表 2 普通最小二乘拟合与正交多项式最小二乘拟合Tab.2 O rdina ry lea st squa re s and o rthogonal lea st squa re s po lynom ia l fittin
表 2中普通最小二乘拟合与正交多项式最小二乘拟合的拟合结果和精度显示:
(1)本算例共取了十个点,分别采用普通最小二乘法和正交最小二乘拟合选取两次的多项式模型来拟合曲线,分别计算出多项式的系数和中误差来比较。普通最小二乘法是使拟合的曲线在 x方向上的残差的平方和最小。但从两种拟合方式的多项式系数来看,两者的拟合参数有明显的差别,就精度而言,正交最小二乘法综合考虑了自变量和因变量的误差 (刘海香,2004)。
(2)这两种结果显示后者的精度更高一些。但是拟合一个曲线并不是次数越高越好,因为次数越高曲线的振荡性特别大,因此在实际的操作中要根据所选的次数和所得曲线的中误差σ0来比较选择一种最合适的。
(3)在正交多项式拟合中,从式子中可以看出多项式系数可以任意给出,赋予一定的值,在计算过程中可以得到多项式系数的改正数。因此还可以采用多次迭代的方式来求得方程的系数αk。
从上述的实例分析可以看出,正交多项式最小二乘拟合的精度优于普通最小二乘拟合,因此在曲线拟合中这种方法更有适用性。
(1)在实际工作中观测量的误差很小可以忽略时,还是应该采用普通最小二乘法来拟合曲线,这种方法简单实用计算量比较小,因而应用比较广泛。
(2)在正交多项式最小二乘拟合中可以看出这种方法顾及了自变量和因变量的误差,从理论上来讲这种方法拟合的曲线更合理。但是这种方法在具体计算中怎样批量的导入数据并且计算出结果来还需要编一个程序来计算。
陈基伟.2007.工程测量中一类参数曲线的拟合[J].大地测量与地球动力学,27(1):100-103.
丁克良.2010.整体最小二乘法直线拟合[J].辽宁工程技术大学学报:自然科学版,29(1):44-47.
刘海香.2004.平面上散乱数据点的二次曲线拟合[J].计算机辅助设计与图形学学报,6(11):1594-1598.
鲁铁定,周世健,朱煜峰,等.2009.间接平差与矩阵 QR分解[J].东华理工大学报:自然科学版,32(2):381-384.
潘国荣,陈晓龙.2008.空间圆形物体数据拟合新方法[J].大地测量与地球动力学,28(2):92-94.
文世鹏,张明.2005.应用数值分析[M].北京:石油工业出版社.
武汉大学测绘学院测量平差学科组.2006.误差理论与测量平差基础[M].武汉:武汉大学出版社.
张可村,赵英良.2003.数值计算的算法与分析[M].北京:科学出版社.
Orthogonal Polynom ial Curve Fitting
ZHU Xiao-dong, LU Tie-ding, CHEN Xi-jiang
(Faculty of Geomatics,East China Institute of Technology,Fuzhou,JX 344000,China)
This paper introduces principle of least-squares fitting curve and finds their shortages.In view of these shortages,putting in a new least squares fitting of orthogonal polynomial.Thisway can compensate a phenomenon that the consequence is different in least-squares fitting curve while x fitting y or y fitting x.This degree of precision ismore higher than least-squares fitting curve,and this method of polynomial coefficients according to their accuracy can independently choose the iteration times,make more accurate results.
least-squares fitting orthogonal polynomial random error residual
O241
:A
:1674-3504(2010)04-398-03
10.3969/j.issn.1674-3504.2010.04.017
2010-06-25
东华理工大学研究生创新项目“基于 3S技术在水土流失评价中的应用——以抚州为例”(DYCA10007)
朱晓东 (1987—),男,硕士生,大地测量学与测量工程专业,研究方向:数据处理理论。