摘要:该文运用几种常见数据归一化方法分别对自回归神经网络动态预测模型的预测性能进行分析,结果说明不同数据归一化处理对模型的性能影响非常明显,运用最大运算法进行归一化处理要优于其它几种常见归一化方法。
关键词:回归神经网络;时间序列;数据预测;归一化方法
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2014)07-1508-03
在工業、气象、金融、地理、医药、交通、环境等领域,都存在大量需要进行分析与处理的数据信息,在对这些数据信息进行挖掘分析的过程中,为了能提高分析效能与提高分析性能,在进行数据分析初期阶段需要对原始数据进行预处理,将原始数据值通过某种算法转化为所需分布范围数据,即数据标准化处理。
利用神经网络模型来进时间序列数据趋势预测是一个已经开展了很长时间研究的热门话题,这方面也有了许多研究成果。Connor[1]等运用非线性自回归平均移动预测模型来进行时间序列问题鲁棒预测,cheung[2]等运用神经网络模型对未来的金融数据进行预测,Wang[3]等设计出一种基于回归神经网络的多维并行预测模型,文献[4] 采用基于自回归神经网络进行多维动态预测。在运用神经网络预测模型进行趋势预测时,需要对时间序列数据进行缺失值及数据标准化处理,下文运用多维动态预测模型对几种常见的数据归一化方法进行分析。
1 回归神经网络预测模型
图一为基于回归神经网络的多维动态预测模型[5]。网络模型分为输入层、分配层、隐层与输出层四层;隐层为具有延迟一步功能的反馈单元,作用函数为Sigmoid函数,输出层作用函数为线性累加函数。
2 数据归一化方法
数据归一化方法很多,用的较多的有线性归一化与非线性归一化两种方法。线性归一化方法主要运用极值或则均值通过线性运算公式对原始数据进行运算,将数据转换为[-1,1]区间内的数值;非线性归一化方法主要运用一些非线性行数对原始数据进行运算,将数据转换为一定分布范围数据。
从实验结果来看,初始数据的归一化处理方法对自回归神经网络预测模型的预测性能有明显的影响,线性归一化方法中最大值运算法要优于最大最小值法;非线性归一化方法中,对数运算法优于反正切运算法,总体来看,运用最大值运算法对初始数据进行归一化标准化处理适合于自回归神经网络预测模型。
4 结论
通过运用基于自回归神经网络的动态预测模型来分析几种常见数据归一化方法对模型预测性能的影响,结果表明,数据归一化方法的选择会对自回归神经网络预测模型性能有明显影响;对于自回归神经网络预测模型,运用最大值运算法来进行数据归一化处理要优于其它几种常见方法。
参考文献:
[1] Connor J T,Martin R. D,Atlas L E.Recurrent neural networks and robust time series prediction[J].In IEEE Trans. on neural networks,1994(5):240–254.
[2] Cheung Y M,Leung W M,Xu L.A RPCL-CLP architeeture for finaneial time series forecasting[C].Proceedings of IEEE International Conference on Neural Network,1995,2:829-832.
[3] Tianzhen Wang,Tianhao Tang.A Mult-dimension Predictor based on PDRNN[C].ICARCV 2004, 2004:1359-1364.
[4] 滕明鑫.基于神经网络的动态数据挖掘研究[D].重庆大学硕士学位论文,2008.