基于BP神经网络模型的股票价格研究

2018-09-10 18:03刘佳祺刘德红林甜甜
中国商论 2018年8期
关键词:遗传算法主成分分析

刘佳祺 刘德红 林甜甜

摘 要:本文将BP神经网络模型与主成分分析法和遗传算法相结合,建立了预测股票价格变化的动态PCA-GA-BP模型。该模型能改善BP神经网络模型运算速度缓慢和易陷入局部最小值的缺点,弥补传统股票价格预测方法的不足。

关键词:BP神经网络模型 主成分分析 遗传算法 PCA-GA-BP模型

中图分类号:F832 文献标识码:A 文章编号:2096-0298(2018)03(b)-029-02

股票的价格走势不仅可以从一定程度上体现宏观经济的发展状况,而且与每个投资者的经济利益相关,因此研究我国股票市场的可预测性非常有意义。股票价格的预测方法主要分为两类:第一类是基于线性模型的传统统计经济学方法,第二类是采用人工神经网络模型的非线性方法。然而股票市场是一个复杂的系统,它具有非结构性、非线性、高噪声的特性,使用传统的方法建立精确、有效的模型比较困难。研究结果表明,BP神经网络模型能有效地考虑到影响股票价格的各种非线性因素,在股市预测方面效率和精准度相对较高。

1 BP神经网络模型

BP神经网络是由Rumelhart和McClelland为首的科学家提出的概念,是一种按照误差逆向传播算法训练的多层前馈神经网络,是目前应用最广泛的神经网络。

1.1 BP神经网络模型原理

BP神经网络模型主要包括三个部分,分别是输入层、隐含层和输出层如图1所示。学习样本从输入层经各隐含层传向输出层,最终在输出层的各个神经元收到来自输入层的信息。之后,系统以减少输出值与期望值的误差为目标,从输出层开始经过各个中间隐含层修正各连接权值,最后回到输入层。随着这种修正传播的不断进行,网络调整权值直至误差达到理想值。

1.2 BP神经网络模型优缺点

首先,BP神经网络模型具有非线性映射能力强、自适应性和自学习能力强、容错能力强等优点,能通过网络训练储存网络权值中的学习内容,较好地处理内部作用机制复杂的非线性函数,从而准确地预测数据。

但是在实际应用中,BP神经网络模型存在着隐含层节点难确立、变量选择困难、运算速度缓慢等缺点。针对这些问题,作者对BP神经网络进行了改进,使其能准确、高效地预测股票价格。

2 BP神经网络模型的改进

2.1 BP神经网络与主成分分析结合

对股市未来趋势进行预测的基础是股市大量的历史数据,虽然这些数据简单明了,但直接将这些数据作为模型的输入样本是错误的,因为这组数据之间存在相关性。而主成分分析法能将一组互相影响的输入因子转换成两两不相关的、变量数少的综合指标,尽可能反映原指数信息的实际需求,揭示影响股价信息的一般因素和特殊信息。所以应先对数据进行主成分分析,选取足够的主成分数,从而作为输入层数据代入BP神经网络模型。

主成分分析对BP神经网络的改进主要体现在它可以有效地降低输入变量的维度,提取原指标的主要信息,减少模型的训练学习时间。但是,主成分分析不能捕捉股价因素之间的非线性关系,不能直接用于股票价格预测,而BP神经网络模型能很好地处理内部作用机制复杂的非线性关系。由此可知,主成分分析和BP神经网络模型的功能可以进行互补,整合各自的数据处理优势,从而对股价进行准确预测。

2.2 BP神经网络隐含层单元数的确定

在BP神经网络模型中,研究的问题本身已经确定了输入单元数和输出单元数。因此,模型成功的关键在于如何精准确定隐含层的层数和相应的单元数。因为一个隐含层就可以训练BP神经网络无限接近某一目标非线性函数,所以本文将网络层数确定为3,即只有一个隐含层。相反,确定隐含层的单元数是个十分复杂的问题。一方面,过多的单元数会影响网络的概括推理功能,另一方面,过少的单元数则会影响模型训练和预测的精度,降低实证效果。本文采用沈花玉等提出的BP神经网络隐含层单元数的改进方法,该方法基于3种基本确定单元数途径,即:

其中为隐含层单元数,n为输入单元数,m为输出单元数。

笔者提出综合这三种方法来确定最佳隐含层单元数的边界值,然后按照单元数范围从小到大依次对数据进行训练,根据训练误差和对应的测试误差,选择隐含层的最佳数目。

2.3 BP神经网络与遗传算法结合

遗传算法是一种自适应优化搜索算法,其思想来源于生物遗传学和适者生存的自然规律。遗传算法以期望的函数为目标,评价每个向量的适应度,然后根据该适应值实施变异、交换、选择等操作。在这过程中,适应度高的元素被留下来并传给下一代新的数据组,而适应度低的元素则被淘汰。

遗传算法具有较强的全局搜索能力,能弥补BP神经网络模型具有易陷入局部最小值的缺陷。将BP神经网络和遗传算法结合,可以充分发挥两者的优点,使新算法既有神经网络的学习能力和鲁棒性,又有遗传算法的强全局搜索能力。

3 PCA-GA-BP模型的股票预测

采用PCA—GA—BP模型预测股票价格流程如下:首先,选取股票交易的历史数据,用主成分分析法对数据进行预处理,消除数据间的冗余,以达到降维的目的;其次,利用本文2.2节所述方法选取合适的隐含层单元数,构建BP神经网络模型;再次,将输入变量分为训练段和预测段两部分,确保训练段数据尽量拟合,从而确定遗传算法相关参数;最后,训练改进后的BP神经网络,并用其预测股价。具体算法,如图2所示。

4 结语

PCA—GA—BP模型改进了BP神经网络隐含层节点难确立、变量选择困难、运算速度缓慢等缺陷,能准确预测具有非线性和随机性的股票价格,使预测值的误差达到最小值,实现更好的预测效果。

参考文献

[1] 齐晓娜,程维刚.基于遗传LMBP神经网络模型的股票预测[J].无线互联科技,2016(3).

[2] 黄宏运,朱家明,李诗争.基于遗传算法优化的BP神经网络在股指预测中的应用研究[J].云南大学学报(自然科学版),2017(3).

[3] 刘永福,李建功.利用BP神经网络预测上证指数[J].商務周刊, 2003(10).

[4] 柏丹,靳鑫,孙方方.BP神经网络的股票价格预测模型建立[J].科技创业月刊,2013,26(1).

猜你喜欢
遗传算法主成分分析
基于遗传算法对广义神经网络的优化
基于遗传算法对广义神经网络的优化
基于遗传算法的临床路径模式提取的应用研究
基于遗传算法的临床路径模式提取的应用研究
遗传算法在校园听力考试广播系统施工优化中的应用
物流配送车辆路径的免疫遗传算法探讨
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用