基于改进人工鱼群算法的回归模型参数估计

2018-12-20 07:20于卓熙靳雨佳
统计与决策 2018年22期
关键词:参数估计鱼群步长

于卓熙,靳雨佳

(1.吉林财经大学 管理科学与信息工程学院;2.吉林省互联网金融重点实验室,长春 130117)

0 引言

多元线性回归分析[1]是一种重要的数据分析方法,广泛应用于工业、农业、医学、社会调查、生物信息处理等领域。多元线性回归分析的重点是参数估计问题。如今,解决参数估计问题最常用的方法是最小二乘法,但是由于该方法的计算过程复杂且程序不具有通用性,对于结构复杂、规模较大等特征的数据具有一定的局限性。近些年,随着遗传算法、群智能技术的飞速发展,将智能优化算法应用于回归模型的参数估计已经越来越受到欢迎。刘锦萍等[2]应用改进的粒子群算法对多元线性回归模型进行参数估计,通过测试实验表明,估计结果显著提高;杨兆军,杨川贵等[3]将粒子群算法和支持向量机结合,应用于回归模型的参数估计研究;张姣玲等[4]应用人工蜂群算法估计多元线性回归参数;彭宇文,郭莉莎等[5]将改进的模拟退火算法应用于线性和非线性回归模型的参数估计。然而,遗传算法在编码和解码环节复杂繁琐,在处理复杂数据时优化效率会降低;粒子群优化算法往往会由于初始化参数设定问题,使算法在寻优过程中易陷入局部最优解,而搜索不到全局最优解。

针对人工鱼群算法在寻优过程中获取精确解方面存在不足,本文通过对人工鱼群算法的参数和鱼群行为进行改进,将改进的人工鱼群算法应用于回归模型的参数估计中,并通过对比实验,表明改进的算法有效、实用且简单。

1 模型与算法介绍

1.1 多元线性回归模型

在多元线性回归分析中,对随机变量y进行预测时,往往有多个因素影响着其未来值的变化,当 y与x1,x2,…,xn(n≥1)之间基本存在线性关系时,需要用多元线性回归法进行预测。在n个自变量的情况下,多元线性回归模型为:

其中,β0,β1,β2,…,βn是 n+1个待估参数。

1.2 人工鱼群算法

人工鱼群算法[6](Artificial Fish-swarm Algorithm,AFSA)是李晓磊等通过长期观察鱼的活动规律及特点,提出的动物自治体优化方法,它是一种群智能的高效寻优方法。

人工鱼群的状态可以用向量 Xi=(x1,x2,...,xn)表示,其中 xi(i=1,2,3,...,n)表示欲寻优变量;人工鱼当前所在位置的食物浓度表示为Y=f(Xi),其中Y为目标函数;人工鱼个体之间的距离表示为;Visual表示人工鱼的感知范围;Step表示人工鱼移动的步长;δ表示拥挤因子。人工鱼群算法的基本思想是选择部分人工鱼完成初始化操作,通过觅食行为、聚群行为和追尾行为不断更新自己,以迭代的方式寻找最优解。

2 改进的人工鱼群算法

2.1 算法参数的改进

本文引入内核函数对人工鱼的视野和步长进行自适应调整[7],无需对算法整体做大规模变动。具体方法是应用内核函数对时间参数进行调整,分别带入到下面视野和步长的函数中,对它们做动态性调整。

其中,Visualmax为最大视野,Stepmax为最大步长。设定算法运行初期人工鱼的视野和步长最大,使算法在运行初期能够快速收敛,突破局部极值的限制。算法在运行过程中,K(x)逐渐减小,直到趋于零,此时,视野和步长均为最小值,使算法在运行后期能够获取到全局精确解。

2.2 聚群行为的改进

对鱼群的聚群行为进行改进[8],设定Xi(t)为鱼群的当前状态,第i条人工鱼代表一个可行解向量Xi,Xi=,nf为人工鱼视野内的同伴数量,Xc(t)表示鱼群的中心位置。若f(Xc(t))·nf<δ·f(Xi(t)),则意味着人工鱼邻域内同伴鱼群中心食物浓度较高且拥挤度较低,人工鱼向全局最优位置Xbest和伙伴的中心位置的向量和的方向前进一个步长;若f(Xc(t))·nf>δ·f(Xi(t)),则人工鱼执行觅食行为,表达式如下所示:

2.3 人工鱼个体与适应度函数定义

利用改进的人工鱼群算法进行多元线性回归参数估计[9]。把多元线性回归模型中的一组参数看作一条人工鱼,种群中的每一条人工鱼代表模型估计问题中的一个候选解,第i条人工鱼Xi表示为

应用适应度函数来评价种群中的每条人工鱼,定义如下:

对适应度函数求极值,可以得到一组参数估计量,即为最优解。

2.4 改进的人工鱼群算法步骤

应用改进的人工鱼群算法进行参数估计的主要步骤流程图如图1所示[10]:

图1 改进的人工鱼群算法流程图

3 仿真实验及结果分析

为了验证本文提出的改进的人工鱼群算法在多元线性回归模型参数估计中的应用,选取了表1中所示的数据,已知变量y,受变量x1,x2和R2的影响,建立多元线性回归模型如下:

表1 参数估计的数据

表2是改进的人工鱼群算法,人工鱼群算法和最小二乘法进行参数估计的对比结果,包括线性回归模型的参数估计值,残差平方和,最优解和运行时间。

表2 算法参数估计对比结果

从表2可以看出,应用改进的人工鱼群算法进行参数估计的结果优于人工鱼群算法和最小二乘法的结果,而且在寻找最优值上有所提高,加快了运行时间。

应用人工鱼群算法和改进的人工鱼群算法得到的一次典型实验曲线分别如图2和图3所示。

图2 人工鱼群算法的典型实验曲线

图3 改进的人工鱼群算法的典型实验曲线

从图2和图3的对比来看,使用人工鱼群算法进行参数估计时在124.588处陷入到局部最优解。然而,改进的人工鱼群算法能够突破局部极值,搜索到全局最优解。

4 结束语

针对人工鱼群算法在获取精确解时的局限性,本文首先对算法参数做出了改进,并利用改进的人工鱼群算法对多元线性回归模型的参数进行了估计,通过与人工鱼群算法和最小二乘法的参数估计结果进行对比,应用改进的人工鱼群算法得到的参数估计结果和运行时间都有所提高,而且改进的算法运行时间短这一优势会随着参数个数的增加而越发明显,可以将此方法推广到对一般回归模型的参数估计中,本文提出的改进的人工鱼群算法为回归分析中参数估计问题提供了一种新的有效解决方法。

猜你喜欢
参数估计鱼群步长
中心差商公式变步长算法的计算终止条件
基于新型DFrFT的LFM信号参数估计算法
基于Armijo搜索步长的BFGS与DFP拟牛顿法的比较研究
误差分布未知下时空模型的自适应非参数估计
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
基于随机森林回归的智能手机用步长估计模型
人工鱼群算法在雷达探测器射频端电路设计中的应用
鱼群漩涡
朱梦琪??《鱼群》
浅谈死亡力函数的非参数估计方法