摘 要:股市作为一个特殊的交易市场,具有变化多端的特点,在整体上很难进行把控。所以,股市上的盈利人员毕竟是少数的。为了可以在股市技术上进行深入的分析和了解,可应用数据挖掘算法来完成相关的操作,同时在多方面来观察股市的具体走向以及客观上的动态情况,避免错误的操作所引起的不必要的损失。文章针对数据挖掘算法及其在股市技术分析中的应用展开讨论,并提出合理化建议。
关键词:数据挖掘算法;股市;分析;技术
随着经济的发展和社会生活水平的提升,股市表现为一定的繁荣状态。但从股票的角度来分析,其作为一种虚拟的有价证券,本身并不是特别的稳定,很容易受到外界因素的影响,同时受到操控者的影响较大,波动性较强。有相当数量的股民,由于在股市技术分析上没有从客观情况出发,单纯凭借主观上的经验来完成,致使最终的损失较为严重。
一、概述
近年来,计算机网络发展较快,相关的内容及研究领域也在不断的拓宽。从客观的角度来分析,数据挖掘算法在目前是非常高度关注的算法技术,同时在很多方面都与股市技术具有密切的关系。数据挖掘算法在应用过程中,主要是根据数据所创建数据挖掘模型的一组试探法和计算。为了能够更好的创建模型,该算法可以首先分析固有的数据内容,同时查找特定的类型模式、相关趋势等等。由此可见,我们在股市技术分析过程中,有效的应用数据挖掘算法后,能够实现以下目的:第一,股市技术分析所提供的数据较多,涵盖了各个方面的数据,为算法的应用提供了较强的基础。第二,经过数据挖掘算法分析后,股市技术的趋向以及可能出现的情况,都会被人一目了然,避免了操作失误的现象,保护了股民的权益,减少了外部的影响和内部的操作水平。
二、数据挖掘算法在股市技术分析中的应用
针对股市技术的分析工作,必须要从客观实际出发,理论上给出的数据和信息,与现实其概况存在一定的差异,因此即便获得了正确的分析结果,依然不能将其应用到实践的股市操作当中。
1.实验数据
在本次实验分析当中,选择的股市技术数据,主要是从2000年1月--3月的某股市指数。在选择的时间段方面,选定周期为60分钟的股市指数走势图进行分析。在每一个交易日当中,选择了开市时间(9:30)、10:30、13:30、14:00以及收市时间(15:00)作为具体的指标进行分析。实验过程中,倘若具体的交易日数量设定为M,那么数据的总数则为5*M。分析认为,针对每一个型态的模版而言,可以应用一个一维的数据组进行相应的表示,这样就避免了数据的杂乱和信息的错误。建议在分析工作中,为了进一步发挥出数据挖掘算法的优势和功能,首先要将模版进行有效的划分,可以尝试将其划分为时间差异相等的10段,每段提取出1个具体的数字,也就是数轴上的具体高度。通过上述的操作方法,可以使用10个数字来表示每一个模版,得到的效果比较突出,操作简便。
2.算法的应用
数据挖掘算法在股市分析中的应用时,必须要做出一些假设,由此来配合股市的多变特点。在算法的处理、应用过程中,想要更加简单的处理数据的拟合问题,可通过“对称形式”的方法来进行解决,同时不建议做倾斜约束的限制。在本文当中,初始化的条件设定为:g(1,1)=2d(1,1)。通过分析和归纳,得到的动态规划方程如下:
经过相关的分析和处理后,窗口的调整条件确定为:j-r≤i≤j+r。时间规范化的距离设计和分析中,对整体的算法应用具有很大的影响。为此,将具体的距离控制为:D(A,B)=g(I,J)/N,在距离的条件当中,N=I+J。
实验中,给定的型态模板作为模式A,同时一段给定的走势曲线作为模式B。由于股市走势是市场各方力量的综合体现,股票在单个或连续若干个交易日的某个时间段更富规律性(如在1999年的519行情中,和1999年末2000年初网络股带动股市进入牛市中的行情中,某个交易日中指数下滑并不体现指数整体在攀升的情况)。故认为形态模板与走势的拟合应以形态模板缩放到N个交易日为准(N为正整数),才符合现实世界的规律(当然,N也不能很大)。把模板分成10段,同時用10个指数为一段的走势曲线与模板比较,与股市中一、两天就形成一种形态走势的客观事实相符。
3.实验结果及分析
数据挖掘算法在股市技术分析当中应用时,通过对固有的数据进行搜集和分析,从而能在很大程度上充分的掌握好股市发展趋势及具体的表现。在本次实验当中,选择了多个类型的模版进行系统的分析,包括潜伏顶、箱形整理等等。在最终的结果方面,每一个阶段的时间规范化距离,经过大量的比较发现,阴跌形态当中,其时间规范化的距离对比当中,基本上是最大的。除此之外,潜伏顶排列在第二位,证明阴跌、潜伏顶的时间规范化距离表现为较大的状态。分析原因为,该股市指数在1月份--3月份,主要表现出了牛市的状态,而阴跌和潜伏顶隶属于熊市的两种模块。综上所述,数据挖掘算法本身的优异性比较突出,能够在很多方面对股市技术进行分析,从而获得正确的走向及趋势。另外,将数据挖掘算法充分的应用后,减少了股民的损失,对于国家的宏观调控而言,也可以提供较多的数据与参考,实现了经济上的平稳运行。日后,可以深入分析数据挖掘算法的相关内容,加强对股市技术分析的掌控,在客观上和主观上,稳定国内的股市情况。
三、结语
本文对数据挖掘算法及其在股市技术分析中的应用展开讨论,从得到的结果来看,数据挖掘算法的分析结果及可行性,都比较符合客观上的需求,整体上获得了较高的保障,未出现恶性循环。另一方面,由于股市技术分析受到的影响较多,因此在应用数据挖掘算法时,还必须融入到其他的因素及相关的算法内容,避免造成分析技术的单一性。
参考文献:
[1]杨琬琪,高阳,周新民,杨育彬,商琳. 多模态张量数据挖掘算法及应用[J]. 计算机科学,2012,01:9-13.
[2]王权,王军,史子新. 数据挖掘技术与关联规则挖掘算法及其应用[J]. 计算机光盘软件与应用,2014,19:126-127.
[3]付海辰. 基于数据挖掘技术的聚类分析算法在异常入侵检测中的应用[J]. 软件导刊,2011,05:73-74.
[4]张铭. 数据挖掘技术及其在中药分析中的应用[J]. 中医杂志,2011,13:1105-1107.
[5]杨秀萍. 数据挖掘技术及其在收视行为分析中的应用[J]. 福建电脑,2013,04:124-126+59.
作者简介:陈格(1992-),男,广东省吴川市人,民族:汉,广东金融学院应用数学系,学生, 学历:本科,研究方向:数学与应用数学(金融数学与金融工程)。