王建军 章重阳
(清远市土地整理中心, 广东 清远 511500)
全球定位系统(Global Positioning System,GPS)以其高精度,低成本,使用方便,不受气候因素影响等优点在地理测绘、气候监测、交通运输等各个行业得到了广泛应用[1-2]。GPS能够提供二维平面信息和高程信息,其中二维平面信息的精度已达到毫米量级,能够满足绝大部分工程应用,但是由于基准面不同,GPS所测得的大地高与工程应用中的正常高之间存高程差(高程异常),因此如何将大地高转换为正常高,即求出对应的高程异常值是GPS高程信息得到有效使用的前提,也是当前研究的热点问题[3-5]。
目前精度最高的GPS高程拟合方法为物理大地测量法,该方法利用大量高精度重力测量数据和地形数据,根据地球重力场模型反推出不同观测点的GPS高程异常值,但是高精度的重力测量数据和地形数据在实际工程实践中很难获取,限制了该类方法的使用场景[6]。几何解析法根据部分已知观测点的GPS高程异常信息采用多项式曲线拟合,多项式插值等数学模型计算得到未知待测点的GPS高程信息,该类方法原理简单易懂,运算量小,在地势平缓的地区可以获得较高的拟合精度,但是当地势复杂,数据波动较大时,该类方法的拟合精度不能满足实际工程使用要求[7]。近年来随着信息技术的发展,将模式识别理论与传统GPS数据分析处理方法相结合而兴起的人工智能GPS高程拟合法逐渐吸引了广大学者的关注,该类方法作为一种数据驱动方法,不依赖于精确的数学模型,而是利用神经网络等自适应学习算法,根据已有训练数据直接对未知观测点进行拟合,由于具备任意非线性函数的逼近能力,因此该类方法相对于几何解析法具有更强的适应性。文献[8-9]将BP神经网络,RBF神经网络应用到GPS高程拟合中,并采用某市区GPS网格数据从拟合残差,内外拟合精度等维度对该类方法的拟合性能进行评估,结果表明该类方法的性能优于传统曲线和曲面拟合法。文献[10]利用支撑向量机(Support Vector Machine, SVM)模型对某矿区的GPS高程数据进行研究,并比较了不同SVM模型参数下的拟合性能,结果表明SVM模型参数的选取对拟合精度影响较大,而目前采用的交叉验证法存在运算量大,容易陷入局部最优的问题。
本文在上述研究的基础上,针对SVM高程拟合模型的参数自适应选择问题,利用粒子群(Particle Swarm Optimization, PSO)算法对SVM模型进行优化,提出一种PSO-SVMGPS高程拟合方法,该方法利用PSO的全局寻优能力自适应对SVM的核函数和惩罚因子进行优化,提升算法收敛速度的同时确保获取全局最优解,基于2例实测GPS数据开展试验,结果表明相对于交叉验证法所提PSO-SVM方法拟合精度更高,收敛速度更快,并且在地势起伏较大的情况下具有更好的适应性。
SVM是以统计学习理论中的结构风险最小化和Vapnik-Chervonenkis dimension(VC维)为基础发展起来的一种模式分类方法,由于其面对小样本和非线性高维模式分类问题时表现出了特有的优势,因此得到了广泛应用。SVM的核心是利用核函数将低维空间中的线性不可分问题映射到高维空间,转变为线性可分问题。表1给出了常用的SVM核函数,其中C为惩罚因子,σ为核参数。
表1 SVM常用核函数
对于线性拟合问题,SVM的拟合函数为[11]:
(1)
从式(1)可以看出,SVM拟合函数的输出值与xi和x的内积相关,因此对于非线性拟合问题,可以通过引入满足Mercer条件的核函数可以将式(1)转化如下的非线性拟合函数[12]:
(2)
PSO算法模拟的是自然界中鸟群觅食行为,鸟群中的每只鸟被抽象为算法中一个只有速度信息V=[v1,v2,…,vD]T和位置信息X=[x1,x2,…,xD]T的粒子,算法迭代的任意时刻,群体中的每个粒子都在追随当前的最优粒子,因此整个群体的运动是由无序逐渐向有序转变,从局部最优向全局最优发展。迭代过程中,PSO算法根据如下式(3)对每个粒子的速度和位置信息进行更新[13-14]:
(3)
合作结构的建立,需要合理分组作为打破传统教学方式格局,实现学生交流面扩展,营造合作学习良性氛围,实现学生物理理论知识教学和实验教学效果最大化.通过合作学习实现学生面对面交流,同时有均等的价值参与社会实践,并在学生自信和交流能力上具有同步提升价值.为保证合作活动有效、公平的开展,需要师生共同制定规范约束小组成员在合作当中的行为,且需要严格执行.
根据上述分析,SVM模型具有较强的适应性和泛化推广能力,但是其性能与核参数σ和惩罚因子C密切相关,而PSO算法收敛速度快,全局搜索能力强,因此本文利用PSO算法对SVM参数进行自动寻优,所提PSO-SVM模型如图1所示,包含六个步骤:
图1 PSO-SVM算法流程图
(1)将SVM惩罚因子C和核参数σ网以实数向量的形式进行编码作为PSO的粒子,初始化粒子的初始速度信息、位置信息、惯性因子等参数;
(2)计算得到当前状态下的每个粒子的适应度函数值,从而确定当前的局部最优粒子位置Pg和全局最优粒子位置Pi;
(3)根据式(3)对每个粒子的速度信息和位置信息进行更新;
(4)计算当前的粒子适应度值;
(5)对比步骤2和步骤4中获得的适应度值,选择更优的作为当前值;
(6)判断是否满足迭代终止条件,若满足,迭代终止,输出当前参数作为SVM模型参数。否则转至步骤3继续迭代。
在开展拟合试验前,首先需要确定对不同方法拟合性能优劣进行定量评估的准则,本文定义拟合残差(式(4))和残差均方根(式(5))两项指标对所提PSO-SVM模型(记为:PSO-SVM)和传统基于交叉验证的SVM模型(记为:SVM)的拟合性能进行比较。
(1)拟合残差:
(4)
(2)残差均方根:
(5)
为了验证PSO-SVM模型对GPS高程数据的拟合性能,采用某区域D级GPS控制网内16个均匀分布的GPS水准点数据开展试验,试验中将1~8点位数据作为训练数据,用于对PSO-SVM模型的构建和训练,剩余9~16个点位数据作为测试数据,用于验证模型的拟合性能。表2给出了这16个点位的平面分布情况及对应的高程异常值。试验中PSO算法的初始种群规模设置为10,加速因子c1=c2=2.06,算法的最大迭代次数设置为50,根据PSO优化的参数个数将粒子位置信息设置为2,初始粒子速度为0.3。
图2(a)和(b)分别给出了PSO算法迭代过程中核参数σ和惩罚因子C的变化曲线。可以看出,经过大约7次迭代,2个参数收敛,其中核参数收敛于0.9,惩罚因子收敛于256。利用优化后的模型对训练数据和测试数据进行高程拟合得到的结果如表3和表4所示。可以看出所提PSO-SVM方法对训练样本得到的最小和最大残差分别为0.102和0.762,残差均方根为0.203;对测试样本得到的最小和最大残差分别为0.023和0.834,残差均方根为0.253;训练样本和测试样本的残差均方根之差为0.05。而利用交叉验证SVM方法对训练样本得到的最小和最大残差分别为0.134和1.004,残差均方根为0.259;对测试样本得到的最小和最大残差分别为0.463和1.514,残差均方根为0.683;训练样本和测试样本的残差均方根相差0.424。上述结果表明PSO-SVM方法相对于传统SVM方法能够获得更高的拟合精度和更强的稳健性,更适合于实际工程应用。
表2 GPS水准点数据 单位:m
图2 迭代过程中模型参数变化曲线
表3 不同方法对训练集的高程拟合结果 单位:mm
表4 不同方法对测试集的高程拟合结果 单位:mm
算例1中给出的GPS水准点分布区域较为平坦,波动不大。在实际工程应用中,存在着对地势较为复杂地区的GPS高程拟合需求,这就对高程拟合方法对不同地形的适应性提出了要求。因此在算例2中,我们选取地势较为复杂的某趋于20个GPS水准监测点数据开展试验,表5给出了这20个GPS水准点的高程异常数据。同样选择其中1~10期作为训练样本,剩余11~20期数据作为测试样本,验证PSO-SVM模型的拟合性能。PSO算法的初始化参数与算例1一致,即初始种群规模设置为10,加速因子c1=c2=2.06,算法的最大迭代次数设置为50,粒子位置信息设置为2,初始粒子速度为0.3。
表5 GPS水准点数据 单位:m
图3(a)和(b)分别给出了迭代过程中核参数σ和惩罚因子C的变化曲线。可以看出,随着数据的波动性变大,PSO算法迭代过程也变得复杂,经过大约25次迭代,2个参数实现收敛,其中核参数收敛于0.52,惩罚因子收敛于556.5。利用优化后的模型对训练数据和测试数据进行高程拟合得到的结果如图4(a)和(b)所示。PSO-SVM模型对训练样本得到的最小和最大残差分别为0.157和0.764,残差均方根为0.349;对测试样本得到的最小和最大残差分别为0.221和0.882,残差均方根为0.467;训练样本和测试样本的残差均方根之差为0.118。而利用交叉验证SVM方法对训练样本得到的最小和最大残差分别为0.253和1.338,残差均方根为0.552;对测试样本得到的最小和最大残差分别为0.575和1.739,残差均方根为0.863;训练样本和测试样本的残差均方根相差0.311。
图3 迭代过程中模型参数变化曲线
图4 GPS高程拟合结果
同时对算例1和算例2的结果进行对比可以看出,随着数据波动性地增加,两种方法的拟合精度都出现了不同程度的下降,但是PSO-SVM方法性能下降更小。上述结果表明对于地势较为复杂情况下的GPS高程拟合问题,PSO-SVM方法相对于传统SVM方法能够获得更高的拟合精度和更强的适应能力。
针对传统SVM模型GPS高程拟合性能受核参数和惩罚因子选取影响较大,传统交叉验证方法运算复杂,易陷入局部最优的问题,本文提出一种PSO算法优化SVM的PSO-SVMGPS高程拟合模型,利用PSO的全局寻优能力对SVM模型参数进行自适应优化,确保迭代能够收敛于全局最优解的同时增加了模型对不同数据的适应性和鲁棒性。最后采用2例工程实例对PSO-SVM算法的GPS高程拟合性能进行验证,结果表明PSO-SVM方法相对于传统交叉验证SVM方法能够提升50%的拟合精度,并且当地势复杂导致GPS数据波动较大时,该方法具有更强的泛化能力,更适合于实际工程应用场景。