数据挖掘在股票预测中的应用

2017-12-23 19:30
当代经济 2017年8期
关键词:决策树数据挖掘股票

(中国工商银行股份有限公司 温州分行,浙江 温州 325200)

数据挖掘在股票预测中的应用

张博凯

(中国工商银行股份有限公司 温州分行,浙江 温州 325200)

伴随着经济的发展以及社会的进步,全民炒股已经成为风尚,人们开始关注股票的预测效果,与此同时,数据挖掘技术和分析机制在不断升级,将数据挖掘技术应用在股票预测项目中,具有非常重要的实际意义,能在提高预测准确性的同时,进一步为行业管理效率的升级提供动力。本文从数据挖掘技术内涵分析入手,对数据挖掘技术和股票预测的关系进行了集中分析,并着重阐释了数据挖掘技术在股票预测中的应用策略,旨在为相关人员提供有价值的参考建议。

数据挖掘;内涵;股票预测;应用策略

对于股民来说,能准确地预测股票走势一直就是每一个投资者的愿望,多数投资者会利用不同形式对其走势规律进行分析,但是效果并不好。而随着科学技术的不断升级,预测模型不断增多,利用数据挖掘技术能在提高信息整合能力的基础上,对预测过程进行全面优化。

一、数据挖掘技术内涵分析

伴随着信息化时代的到来,各个领域内的数据呈现出大量且无规律的形态,无论是信用卡记录、通讯记录还是股票交易信息,都能借助数据挖掘技术进行深度处理和整合。因此,数据挖掘技术就是借助不同计算机理论,对知识和技术体系进行深度分析和研究,从而建立具有实效性价值的数据库,对相关数据理论进行集中的研究和探讨,从而保证数据处理效果的最优化。

在数据挖掘技术运行过程中,首先要收集数据,对不同领域内的信息和数据进行集中的整理,从而借助处理系统建构数据库。其次,要对数据进行整合分析,正是借助数据整理,能有效删除一些无用的干扰数据。再次,在树立数据挖掘目标后,对数据模型以及算法等进行集中处理和综合分析,借助数学参数模型对相关信息结构展开研究和分析[1]。最后,要对挖掘结果进行有效评估和处理,确保数据价值的同时,对评估方法和实际数据进行集中检验,有效评估实际数据和预测数据之间的差距。只有对数据进行深度处理,才能满足挖掘要求,从而确保数据管理维度和管理效果的最优化。

二、数据挖掘技术和股票预测的关系

1、数据挖掘技术在股票预测项目中的适用性

在数据挖掘技术应用过程中,要结合实际参数结构和管理框架,结合管理模型的同时,对相关数据进行深度处理。在对于股票行业,每天的交易信息和数据基数很大,在进入到股票存储仓库后,对其隐藏的相关信息进行集中处理,是实施数据挖掘技术的重要决策过程,在数据挖掘技术运行过程中,也能对股票项目进行有效的投资管理。之所以将数据挖掘技术应用在股票预测项目中,主要是基于股票分析的多样性以及隐藏性。其一,多样性特征的适用性。不同群体对于股票的分析方法很多,对不同股票的走势也有不同的见解,产生的分析方法也不尽相同。正是基于此,要利用数据挖掘技术,才能满足多样性的股票分析机制。其二,隐蔽性特征的适用性,在股票运行过程中,股价和企业原始数据间会存在关系模糊的情况,这就需要利用技术模型对其进行深度处理和细化分析,从而结合相关数据进行信息的集成和融合,一定程度上利用数据挖掘技术对其进行多角度多方位的分析,积极落实更加有效的系统化数据处理框架,确保能将一些隐蔽的信息进行综合和处理。

2、数据挖掘技术在股票预测形目中的应用方法

在股票预测项目中,利用数据挖掘技术,能有效地升级整体理论管理模型,并且深度管控数据的处理效果。在理论研究机制中,基本分析学派以及技术分析学派两者具有较为重要的意义。

第一,基本分析学派主要是利用数据挖掘技术能对股票价格的波动进行深度分析,由于其波动状态主要是受企业基本信息、经营业绩、政策、社会因素等因素的影响,因此,利用数据挖掘技术能对其中的规律进行有效分析和集中处理,针对工具模型以及股票运行走势,建立系统化的管控结构,从而积极落实图像分析机制,从数据分析中得出结论[2]。另外,技术分析学派在实际分析结果建立的过程中,主要是利用相关技术框架进行系统化管理和信息维护,利用数据挖掘既注重的统计分析,能对大盘中的成交量、开盘价、收盘价预计相关信息维度进行细化处理,利用相关指标对数据以及变化规律进行集中整合和数据分析,从趋势中寻找有效的数据管理维度,切实维护技术模型和技术运行维度,也能在优化整体技术模型和运行机制的同时,从股价的长期趋势层次进行系统化分析和处理。

第二,在数据分析机制建立过程中,也要有效使用相应的方法,提高分析和预测效果。其中,较为常见的是证券投资分析法、实践序列法、神经网络法预测机制以及定量预测法等,能对数据进行系统化分析和集中处理,确保数据框架结构真实有效。

三、数据挖掘技术在股票预测中的应用策略

1、数据挖掘技术之决策树应用在股票预测中

数据挖掘技术中,决策树分类算法能对相关数据进行有效地归纳和处理,采用的主要是一种自上而下传递结构的信息管理方式,从无次序以及无规则的数据中对相关信息进行有效推导,从而保证分类规则项目的贴合度[3]。并且对决策树顶点的信息层级开始,到决策树的叶子节点结束,整个数据收集和整合过程就是决策树运行过程,能保证数据离散和连续性不同数据的完整度,并且有效处理相关参数。在决策树结构中,首先要对样本集进行集中收集和整理,并且对不同属性进行综合取值,例如,成交量、活跃度、上涨类、下跌类等,对其进行交易数据的综合处理,从而建构有效的数据分析机制。在对相关数据进行分析后,能得出换手率的条件熵越小,得到的信息增益值就会增大,将换手率作为第一条属性测试项目,能得出相应的信息量,并对决策进行有效处理和系统化分析,确保不同训练样本能形成有效的子集结构,在形成两个分支后,对其进行数据整合。

结合决策树算法对股票进行系统预测,能在优化划分结构的同属,确保测试出的类别和项目因素进行决定,一定程度上决定了技术挖掘出的信息,只有在保证技术应用规范前提下,才能对信息进行有效递归分类。在实际数据处理和信息技术应用的过程中,有效拓展决策树算法,并建构更加贴合有效的训练样本分类处理模型,确保管理维度和管理框架体系的有效性。在数据最终选取的测试属性判定方面,相关技术人员要结合实际需求,建构更加系统化的结果对比。但是,决策树算法也并不都是优势,也存在一些亟待解决的问题,容易产生碎片问题、不稳定性等,都需要技术人员在应用将决策树进行股票预测建模时,要从属性以及决策信息准确性出发,落实不同的管理机制和控制措施,减小生成的决策树冗余。

2、数据挖掘技术之神经网络应用在股票预测中

数据挖掘技术中的神经网络算应用范围也较为广泛,主要是利用计算单元组合对其进行深度数据分析和综合处理,并且利用若干特征结合相关计算机计量数据对实际特征进行细化处理和综合分析。神经网络最大的特征就是自适应性强以及学习能力高。一般而言,将BP神经网络和径向基算法应用在股票预测项目中。

第一,利用BP神经网络进行股票预测,要按照标准化工序有序开展,在算法开始后,要对网络初始化进行处理,并且输入训练样本,以保证对隐层单元输出信息进行独立求解,并对输出单元量展开计算过程,从而判断两者之间的偏差,若是偏差符合标准,则信息处理技术结束。若是偏差不符合标准,就要对隐含层好输出层之间的连接权值进行以及输入层和隐含层连接权值的数据进行集中调整,确保数据维度和管理价值的最优化。通过相关数据显示,当隐含层数为15,且时,整体网络体系中预测误差数值最小,且精度也能保证最高,选取更加有效的神经网络预测模型对其神经结构进行处理,利用BP网络非线性映射力对隐含层进行非系统化分析,也能对连续函数等结构展开讨论,确保输出、输入、最优值等参数符合实际需求。

例如,初始化学习次数设定为,对以及等参数进行随机数分布,设定为(-1,1),则学习样本为,对输出值以及单元层输出值等进行计算,利用相应算法对误差进行修正。

第二,利用径向基网络算法进行股票预测,相较于BP神经网络算法,在径向基运行训练的过程中,要提高对分布密度的影响。在分布密度增大后,函数的拟合就会出现平滑趋势。在实际处理过后,要借助改变学习速率实现相应的管理要求,比较适用的隐层神经元也是整个系统中的重点。只有保证全面获取股票的预测值,才能一定程度上提高整体数据和信息处理的实效性,确保管理机制更加有效。在径向基神经网络训练时,通过改变函数的分布密度得出不同的结果,确保数据维度和数据管控机制的最优化。径向基的平均预测误差中,分布密度为0.1,则平均误差为0.178*10-14,;当分布密度为0.5,则平均误差为0.384*10-12;分布密度为1.0,则平均误差为0.357*10-10。值得一提的是,径向基神经网络收敛速度要高于神经网络,并且是整体数据处理后误差更小更加精确,需要相关部门提高认知和重视度。在股票预测项目中,借助不同的网络算法,对数据进行深度处理,从而保证数据框架结构贴合实际。

四、结束语

总而言之,在股票预测项目过程中利用数据挖掘技术,能在提高整体数据分析和运行维度管理的基础上,对相关信息和数据进行综合管控和集中处理,确保信息运行维度和实际管理模型之间的贴合度,也为冗余系统的优化奠定坚实基础,确保数据针对性以及股票综合分析的有效性,为数据处理框架展开实际管理,保证预测值和实际值之间更加地接近,从而真正发挥其实际效果,保证熵值的有效优化。只有建构系统化的数据管理机制,才能在提高数据分析能力的同时,满足数据挖掘技术的可持续发展。

[1]南晓莉:新媒体时代网络投资者意见分歧对IPO溢价影响——基于股票论坛数据挖掘方法[J].中国软科学,2015.15(10):155-165.

[2]王晓晔、王正欧:正则化训练的神经网络与粗集理论相结合的股票时间序列数据挖掘技术[J].电子与信息学报,2014.26(04): 625-631.

[3]陈艳、褚光磊:关联规则挖掘算法在股票预测中的应用研究——基于遗传网络规划的方法[J].管理现代化,2014.34(03): 13-15.39.

(责任编辑:孙茜茜)

猜你喜欢
决策树数据挖掘股票
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
信息时代基于决策树对大学生情绪的分类
简述一种基于C4.5的随机决策树集成分类算法设计
决策树学习的剪枝方法
软件工程领域中的异常数据挖掘算法
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票