基于CFOA优化模糊支持向量机的上证综指趋势预测研究

2021-06-04 03:14闫雅雯
微型电脑应用 2021年5期
关键词:股票价格果蝇向量

闫雅雯

(咸阳师范学院 经济与管理学院, 陕西 咸阳 712000)

0 引言

随着市场经济的发展和监管制度的完善,中国股票市场的发展和管理越来越规范化、制度化。从20世纪90年代初期开始至今,中国股市股票交易过程中产生和积累了大量数据,面对这些海量数据集,能否有效利用可靠的技术手段分析和预测股市的发展趋势,及时和实时掌握股市行情,对投资者和经营管理者至关重要,同时对股票市场的正确经营具有重要参考作用。随着智能技术的不断发展,越来越多智能条件下的优化选择方法(诸如移动平均法、马尔科夫法、灰色预测法、BP神经网络和支持向量机等)被用于股市行情的预测及分析,这些算法获得了大范围的应用且取得了较好的成果[1-5]。然而这些方法都存在各自的缺点,如移动平均法和马尔科夫法虽然简单,但存在平稳性限制;BP神经网络短期预测效果较好,但泛化能力较差;支持向量机所使用模型简单,非线性预测能力较强,但往往这种条件下的预测结果与具体参数的选择存在离散化关系。为弥补该领域问题,本文提出一种CFOA优化FSVM的股票价格预测方法。通过CFOA对FSVM模型的参数Gamma、b自适应寻优,从而实现股票价格的预测研究。研究结果对于实现上证综指趋势预测,掌握股市发展趋势具有重要决策意义。

1 改进果蝇优化算法

1.1 果蝇优化算法

国外学者受果蝇觅食行为启发,提出了一种新的群智能算法-果蝇优化算法(Fruit Fly Optimization Algorithm, FOA),该算法具有控制参数少、收敛速度快的优点,但其存在局部难以实现最优的问题[6]。而以此为基础,为解决该问题,提出一种基于逻辑回归模型的果蝇优化算法,该算法可有效解决果蝇优化算法存在的局部难以实现最优的问题,改进后的算法流程具体为:

(1) 定义果蝇群体的整体数量popsize以及算法的循环计算次数Iteration,此外,通过随机向量对果蝇群体的起始位置(X_begin、Y_begin)进行初始化;

(2) 对果蝇个体在最优化过程中的距离和行动方向进行计算,如式(1)、式(2)。

xi=X_begin+Value×rand()

(1)

yi=Y_begin+Value×rand()

(2)

式(1)和式(2)中xi和yi分别为果蝇个体在i时刻的所在位置坐标;Value为果蝇个体运动到该位置搜索后产生的距离。

(3) 对初始位置及果蝇个体间的距离di进行计算,如式(3)。

(3)

(4) 对果蝇个体的味道浓度si进行分析,如式(4)。

si=1/di

(4)

(5) 将式4计算后获得的si代入,获得果蝇个体在i时刻的味道浓度,为式(5)。

Smelli=Function(si)

(5)

(6) 迭代循环寻找果蝇整体最优位置及最优味道浓度,最优位置由式(1)及式(2)获得,最优味道浓度由式(5)获得。

(7) 记录果蝇群体的最优位置以及最优味道浓度之后,果蝇群体整体向已记录的最优位置行进;

(8) 迭代寻找最优解,以此类推,重复迭代(2)-(6)步骤,并分析每次迭代后获得的味道浓度是否优于之前记录的味道浓度;如优于之前记录的味道浓度,则执行步骤(7),记录新的味道浓度。

1.2 Logistic混沌系统

Logistic混沌系统如式(6)[7-8]。

x(n+1)=ux(n)(1-x(n))x(n)∈[01]

(6)

式中,u为算法的控制参数,当u=4时,表示该逻辑回归算法处于混沌状态;n表为循环次数;

此外,该算法的混沌变量Cxi存在以下变换式,为式(7)。

Cx(n+1)i=4Cx(n)i(1-Cx(n)i)i=1,2,…,N

(7)

式中,Cx(n)i表示混沌映射的第i个混沌变量Cxi在第n步混沌变量之后的值,当Cxi∈[01]并且Cxi∉{0.25,0.50,0.75}时,逻辑回归算法处于混沌状态。此外式(7)的优化控制参数xi∈[aibi],通过混沌变量Cxi∈[01]进行彼此之间的映射转化,为式(8)、式(9)。

Cxi=(xi-ai)/(bi-ai)

(8)

(9)

1.3 混沌果蝇优化算法

针对果蝇算法存在局部难以实现最优的问题,本文将Logistic混沌理论引入果蝇优化算法中,得到了一种基于Logistic混沌的改进的果蝇优化算法,具体算法流程如下所示。

(1) 定义果蝇群体的整体数量popsize以及算法的循环计算次数Iteration,通过随机向量对果蝇群体的起始位置进行初始化,使果蝇群体的起始位置整体处于[0-1]位置之间,该位置用向量zi进行表示;

(2) 应用式(8)将分量zi映射转化为混沌变量Cz(n)i,Cz(n)i=[01];

(3) 使用式(7)对混沌变量Cz(n)i混沌映射;

(7) 在算法迭代过程中,为了确保所获得的参数为最优解,可进一步将迭代循环值控制在尽可能小的范围内,若搜索参数大于0时,则B∈[01]。通过反复试验及进一步优化可知B=0.25时,算法最优,将此种状态下味道浓度Sg运用式(10)生成最小扰动条件下的果蝇种群,同时运用式(10)计算适应度f(Si)并获取果蝇种群整体的最小适应度的f(Si),并使Bestsmell=min(f(Si)),若Bestsmell

Si=Sg+2B×rand()-B

(10)

(8) 进行二次迭代循环寻找最优解,并记录新的味道浓度Si;

(9) 当算法满足收敛条件时,输出Smellbest,P=Sg。

2 模糊支持向量机

若训练样本集为(x1,y1,μ(x1)),…,(xn,yn,μ(xn)),xi∈RN,yi∈{-1,1},0<μ(xi)≤1,并将z=φ(x)定义为训练样本由起始空间RN位置映射转化至高维度的空间特征值Z之间的映射变换关系。此时算法的模糊隶属度μ(xi)为上述选取的样本隶属关系的可靠度;i为算法随机目标函数中的计算误差参数;而μ(xi)ξi为此时算法的加权误差参数。此时算法得到的最优解[9]为式(11)。

(11)

式中,惩罚因子C为常数;w为函数yi的权系数。SVM模型函数式为式(12)。

(12)

式中,K(xi,x)表示核函数。文中采用高斯核函数,如式(13)。

(13)

式中,Gamma表示高斯分布宽度[10]。

3 基于CFOA_FSVM的上证综合指数趋势预测

3.1 目标函数

(14)

针对股票价格预测问题,实际股票时间序列长度为n,运用CFOA优化FSVM的参数Gamma,b,使得FSVM的实际股票价格和预测股票价格之间的差值的平方和最小[11],CFOA优化FSVM的目标函数,如式(15)。

(15)

3.2 预测算法的流程

CFOA优化FSVM的股票价格预测算法流程如下:

(1) 对股票价格的样本进行初始化处理,分别建立算法训练样本以及测试样本;

(2) 定义果蝇群体的整体数量popsize以及算法的循环计算次数Iteration;

(3) 将已建立的算法训练样本输入至FSVM,并代入式(15)获取果蝇个体的适应度,搜索果蝇种群整体的最优位置;

(4) 更新果蝇个体位置;

(5) 获得果蝇个体的适应度同时更新果蝇个体的位置;

(6) 若gen>Iteration,保存此种条件下所获得的最优解;若gen=gen+1,重新回到步骤(4);

(7) 运用CFOA函数对FSVM进行优化以获得最优参数Gamma,b,从而完成对股票价格的预测。

4 实验分析

4.1 数据来源

为了验证算法的有效性和可靠性,本文选取上证交易所2010年3月30日—2020年3月20日的上证综合指数开盘价为研究对象,其综合指数的时间序列图,如图1所示。

图1 上证综合指数的时间序列图

4.2 评价指标

为了进一步对算法对股价预测的有效性进行分析验证,本文将上证交易所2010年3月30日—2020年3月20日数据的均方误差作为预测结果如评价指标,均方误差,如式(16)[12]。

(16)

4.3 实验结果

选择2010年3月30日—2020年3月20日的上证综合指数为研究对象,采用滚动预测的方式进行上证综合指数预测研究。选择Matlab2015(a)为仿真平台,计算机操作系统为Windows7,处理器为Intel(R) Core(TM) i5-4460 CPU@3.20 GHz,内存4 GB,硬盘500 G,操作系统64位。将FOA算法参数最大循环次数设置为100次,种群数量设置为20,其所获得的预测结果分别如图2-图6所示。

图2 模糊化结果

图3 归一化结果

图4 CFOA_FSVM预测结果

图5 CFOA优化路径图

图6 CFOA和FOA迭代收敛图

为了验证CFOA-FSVM算法的优越性,将CFOA-FSVM算法、FOA-FSVM和FSVM算法[13-15]的预测结果运行10次进行对比,其对比结果如表1所示。

表1为CFOA-FSVM算法、FOA-FSVM和FSVM预测结果与实际情况的MSE误差对比结果,该结果显示CFOA-FSVM算法的预测效果优于FOA-FSVM和FSVM模型,FOA-FSVM的预测效果优于FSVM,如表2所示。

表2 CFOA-FSVM、FOA-FSVM和FSVM预测时间对比(单位/s)

由表2 CFOA-FSVM、FOA-FSVM和FSVM预测时间对比结果可知,CFOA-FSVM的预测时间最短快于FOA-FSVM和FSVM模型,而FOA-FSVM的预测时间短于FSVM。

5 总结

为了提高股票市场价格预测精度,针对传统方法存在预测误差大、泛化能力差的缺点,通过CFOA最优化选择FSVM参数,实现上证综合指数预测。实验结果表明,本文算法具有预测精度高和速度快的优点,为及时和实时掌握股市行情提供科学决策的依据。

猜你喜欢
股票价格果蝇向量
向量的分解
果蝇遇到危险时会心跳加速
基于GARCH族模型的重庆啤酒股票价格波动研究
2021年大樱桃园果蝇的发生与防控
聚焦“向量与三角”创新题
小果蝇助力治疗孤独症
果蝇杂交实验教学的改进策略
上市公司财务指标与股票价格的相关性实证分析
员工持股计划对股票价格的影响
向量垂直在解析几何中的应用