智能数据分析在投资预测中的应用

2018-01-15 10:18裴洪文裴铮
科学与财富 2018年35期
关键词:数学模型数据挖掘人工智能

裴洪文 裴铮

摘 要:本文对证券投资市场的数据背景进行了分析,目前证券市场有近四千家上市公司,非常需要利用人工智能的方法来处理数据并对市场的变化趋势作预测。对数据挖掘(获取)技术进行了分析,同时分析了数据挖掘过程和依据,研究了数据挖掘技术在证券投资市场上的应用,研究了时间序列模型预测和神经网络预测模型分析方法,并利用二种预测方法进行了软件模拟仿真,结果表明神经网络模型预测比较有效。

关键词:数据挖掘 ;数学模型 ;人工智能 预测

1研究背景及意义

证券投资可以实现资产增值,支持社会融资,化解供求双方的压力,传递经济优化配置等功能,已成了各级政府部门、众多企业和众多投资者关心并积极参与的经济活动。由于证券投资市场具有的投资收益和风险是正相关的,收益越高的投资则存在的风险也越大。近年来,证券投资已经成为人们日常经济生活的一个重要组成部分,证券市场的涨跌对人民生活、经济活动的影响日益增大,如果能有效预测证券市场股票价格的走势,将会对人们的投资理念、投资理财水平产生巨大的影响,还可以对国民经济的发展提供有价值的参考依据。

对证券市场的股票进行预测,主要利用三点基本假设:即市场行为涵盖一切信息;股价变化有趋势可以遵循;历史会重演。随着股市的发展,人们不仅探索其内在的有关规律,并对此进行逐步深入的研究,同时找出了许多对股市的预测方法。但影响股票价格的因素有许多:如政策、经济发展状况、股票投资者的心理因素等,这些因素相互交织,相互影响,相互约束,股票的价格波动表现出较强的非线性特征,仅用线性分析会产生较大的误差,同时股价的变化呈现出随机特性和时变特性,如何发掘股价的变化规律,是经济研究中的一个非常有意义的问题。

股票的分析涉及大量的复杂数据的提取,以及大量的数据运算,不可能单靠人工来完成获取数据,处理数据,传输数据,储存数据的过程,也不可能完成这些处理过程中涉及到的大量的数据的算术和逻辑运算。影响股票的走势因素太多,股票市场中的数据含有较多的干扰因素即噪声,在线性条件下,可以设计相应的滤波器将这些噪声部分清除,但在非线性条件下,难以用滤波器处理,要求股市的预测应当具有比较强大的非线性问题的处理能力。股市的数据有时反映了投资者的主观性,特别是投资者的心理因素影响很大,为了得到比较可靠和有效的股市模型及预测结果,人工智能的研究利用给我们提供了相应的解决方法。

2数据挖掘分析

2.1概念

随着国内证券市场的发展,股票市场提供的数据越来越多,激增的数据背后含有许多重要的信息,做分析决策对数据的依赖性和敏感度也越来越也高。数据挖掘技术作为股票市场的分析和决策工具已经得到越来越多的重视。

数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中 ,提取隐含在其中的、人们事先不知道的、潜在有用的信息和知识的过程。从证券市场应用的角度,根据预定的分析目标,对大量的上市公司数据进行必要的检索,抽取和适当的分析,揭示这些数据隐含的变化规律,并进一步将其模型化的先进有效的技术过程。数据挖掘是一门交叉学科,是人工智能中一个重要技术,集成了许多学科,包括数据库技术、统计学、机器学习、模型识别,人工智能、建模技术、电子技术,信息技术等成熟的工具和技术。

2.2数据挖掘过程

分为定义问题、数据的收集和预处理、数据挖掘、结果分析及知识的应用等五个过程。

(1)定义问题:清晰的定义出证券市场的问题,确定數据挖掘的目的。

(2)数据的收集和预处理:包括数据选择、数据预处理和数据转换、数据选择的目的就是确定数据挖掘任务所涉及的操作数据对象;数据预处理通常包括消除噪声、遗漏数据处理、消除重复数据、数据类型转换等处理。

(3)数据挖掘:根据数据功能的类型和数据的特点选择相应的算法,在净化和转换过的数据集上进行数据挖掘。

(4)结果分析:对数据挖掘的结果进行解释和评价,转换成为能被证券市场用户理解的知识。

(5)知识的运用:将分析得到的知识集成到业务信息系统的组织结构中去。

3数据挖掘技术在证券投资市场上的应用

3.1数据挖掘的依据

(1)关联:证券股票市场与当期的汇率变动情况,利率变动情况,国民经济的发展状况的关联,某一证券与该证券所属行业板块、所属区域板块及整个证券市场的相关分析,股价变化与关联因素影响分析,不同地域、不同行业的股票关联情况分析。

(2)技术:对各种指标和数据的排序、分类,研究它们具有的技术特征和影响程度,对股票价格波动的技术指引。

(3)在线投资分析:对成交量、板块进行分析,对预测结果进行验证,对股价的变动规律、未来行情走势做分类、探讨不同投资结合效果,提出构建综合的科学方案。作出必要的收益和风险的评判。

3.2时间序列模型预测分析

通过编制和分析时间序列,根据时间序列所反映出来的发展过程、方向和趋势、进行类推和延伸。从历史各个时间间隔的股票价格涨跌、交易量变动的交叉信息中,分析出大众的投资心理和投资趋向。

用T来表示长期趋势值,用S表示季节变动值,用I来表示不规则变动值,可以用两种方法计算未来的时间序列预测值Y:

加法模式Y=T+S+I

乘法模式Y=T×S×I

在股票预测常用的时间序列分析法主要利用建立自回归模型AR,移动平均模型MA,自动回归和移动平均模型ARMA和齐次非平稳模型ARMA,通过选择模型的参数和辨识模型的系数来实现对时间序列拟合的模型预测。

3.3神经网络预测分析

(1)人工神经元模型

4结论

本文利用数据挖掘方法中的时间序列分析方法及神经网络分析方法对同一股票,同一板块股票进行了预测。利用SQL平台建立时间序列预测模型和神经网络模型。对预测结果进行了对比,时间序列分析基本上能够预测出当时的收盘价走势,预测的二十只股票,有五只误差在5%以内,有七只误差在10%以内,其余在10%以上,而利用神经网络预测分析的二十只股票有八只误差在5%以内,有十只误差在10%以内,其余超过10%。可以发现时间序列预测方法相对较简单,利用的算法比较直观,但由于该算法的特点,预测误差有些大。人工神经网络方法预测结果相对较好,缺点是运算量过大,算法较复杂。

随着云计算、大数据及人工智能技术的发展,利用神经网络预测变得越来越方便,越来越精准,越来越有效。神经网络的预测技术将会更有发展前景。

参考文献 :

[1]邓松,李文敬等.数据挖掘原理与SPSS Clementine应用宝典[M] .北京:电子工业出版社 2009;

[2]廖芹,郝志峰等.数据挖掘与数学建模[M].北京:国防工业出版社 2010;

[3]Abarbanell,Bushee,Fundamental analysis ,future earnings and stock prices. Journal of Accounting Research,2012 , 35(1):88-90;

猜你喜欢
数学模型数据挖掘人工智能
AHP法短跑数学模型分析
活用数学模型,理解排列组合
探讨人工智能与数据挖掘发展趋势
2019:人工智能
数读人工智能
基于并行计算的大数据挖掘在电网中的应用
对一个数学模型的思考
下一幕,人工智能!
一种基于Hadoop的大数据挖掘云服务及应用
古塔形变的数学模型