杨嘉庆 周俊峰
摘要:本文系统地介绍了神经网络模型中径向基函数网络模型的数学理论,包括他的原理,算法步骤和实证过程。
关键词:神经网络模型 径向基函数网络
人工神经网络是一种基于脑与神经系统的仿真模型,它是模拟人的神经结构思维并行计算方式启发形成的一种信息描述和信息处理的数学模型。它具有自我学习能力,从一组输入数据中学习,然后不断调整模型参数,以建造更合适的模型。因此,神经网络的工作过程一般来讲包含两个阶段:
训练阶段:主要是调整网络神经元间的連接权值和连接方法等,因为事实上正是连接方式和连接权值决定了神经网络的信息处理能力,所以训练过程至关重要。同时,神经网络因为具有自学习和自组织的显著特征,它既可以有导师也可以无导师的自主学习,从而能够适应外界环境的复杂变化。
验证阶段:在这个阶段网络的各项已经训练好的参数都不会发生变化,此阶段的工作过程主要体现在建立输入数据,然后根据已经训练好的最有参数建立系统模型,然后再得到输出数据,最后比较实际数据与输出数据的误差。
人工神经网络在数学上已经得到证明,当条件允许时,它可以无限可能地逼近实际函数,这意味着无论反映实际规律的函数有多复杂,形式有多不规范,神经网络都能逼近那些并不“友好”的函数,这样得天独厚的特点对于复杂多变的股票市场无疑具有特别实际的意义,也因此使得神经网络在许多领域都得到了成功应用。
目前学界比较重视同时实际应用中也比较广泛的神经网络预测方法有前馈式神经网络(BP网络),径向基函数网络(RBF),反馈式网络等。目前BP神经网络在各个领域中得到较多的应用,但是BP神经网络也有一个比较致命的弱点,就是网络收敛过程常常难以超越局部极小范围而无法最终收敛到全局最小。径向基函数网络是一种三层前馈式神经网络,包括输入层、隐含层和输出层,在RBF网络中,隐含层节点的作用实际上就是执行一种非线性变换,使当有外界输入后,它会利用基函数实现线性加权组合,从而达到从输入空间到隐层空间的非线性映射。它具有特别出众的非线性方面的拟合能力,理论上能够无限度的逼近任意给定的非线性函数。这样,径向基函数网络的学习过程可以看作是在高维空间中寻找对于一个已经指定训练数据而言的最优拟合超平面。
1.首先对原始数据进行归一化处理,然后构建训练集的输入向量和输出向量。以每5天的收盘价作为输入向量,这样的做的好处是能够使股票数据的趋势性规律更明显的显现出来,然后以第6天的收盘价作为输出向量。
2.确定最优隐节点数,通过不断的尝试,在1~50的范围内,40是最优隐节点数。
3.在确定好了隐节点数后,进行实际值得预测。测试集的输入向量是后20组的股票收盘价,直接采用MATLAB自带工具箱进行预测。
4.模型结果评价。得到预测数据之后,对测试结果进行分析评价,评价的指标即是上文所提到的均方根误差(RMSE)、平均相对误差(MAPE)和相关系数R,对同一个预测变量,其RMSE与MAPE取值越小,说明预测精度越高。R是对预测值序列和样本序列线性相关程度的衡量。相关系数有如下性质:若R的值越大,预测值序列与参考值序列线性关系越密切,预测精度也就越高。一般而言,线性相关系数越大,其均方根误差和平均相对误差越小,对各个不同的预测变量RMSE与MAPE相差很大,没有统一的标准,而R是一个标准的位于[-L1]区间的数值,便于分析比较。所以在本例中,使用相关系数R作为衡量模型预测精度的标准,RMSE与MAPE仅做辅助参考用。结果表明,神经网络模型的预测精度在预期范围内,不过模型结果仍需进一步完善。
总体来说,人工神经网络模型的预测效果还是比较可靠的,尤其针对小规模样本,而且神经网络的时间和内存空间的开销都极其有限,需要注意的就是如何选取对预测精度其重要作用的隐节点数。