基于事件的证券市场状态变化规则挖掘

2016-05-14 16:43姜丽
科技创新与应用 2016年9期
关键词:事件证券市场数据挖掘

姜丽

摘 要:文章在前期市场状态研究的基础上,重点研究了三类影响市场状态的事件,建立了事件模型,并采用改进的ID3数据挖掘算法,得到了一组市场状态在事件刺激下的转化规则。最后,文章对得到的规则进行了分析。

关键词:事件;证券市场;数据挖掘;ID3算法

1 概述

证券市场在国家金融体系中占有举足轻重的地位。对证券市场的运行状态的研究,能够为市场监管部门进行有效的市场监管提供依据。在前期的研究中,我们通过聚类分析的方法,将证券市场划分成五个状态:

低迷态:市场波动不大,流动性很差,收益率很低。低健康态:市场波动不大,流动性较差,收益率较低,但是换手率、波动率较高,中小盘股交易较为活跃。健康态:市场波动平稳,流动性高,收益率较高。亢奋态:市场有一定的波动,流动性很高,收益率非常高,大量资金流入市场。灾难态:表现为市场波动非常大,常常伴有千股跌停或者千股涨停的现象,流动性丧失,收益率低,市场极为不稳定。

但是证券市场的状态显然是动态演化的,尤其当发生了某种敏感的事件刺激时,市场的状态就可能发生变化,演进到下一个状态。文章着眼于影响证券市场的事件,挖掘事件导致的市场状态变化的规则。

2 影响证券市场的事件模型

影响证券市场的因素很多,比如国家的政策调整,上市公司的季报、年报,各类交易规则,散布的各类消息、公告,也包括内幕信息等等。把这些影响证券市场状态的因素统称为“事件”。有些事件来源于正常渠道,比如上市公司季报、年报,按照交易规则对上市公司采取的各种措施等。而另外一些事件的来源就不那么明确,比如散布的各种消息,内幕信息,甚至某些人为的预测、评价等。文章的目的在于研究事件对市场状态的影响,因此选取了影响力最大的三类事件:利率变动,汇率变动,通货膨胀率变动。

3 证券市场事件影响规则挖掘

对事件建立模型后,进一步利用数据挖掘方法研究事件对市场状态的影响,建立市场状态在事件刺激下的转化规则。

3.1 数据准备

收集历年来利率、汇率、通货膨胀率的变化情况,以及事件发生前后,市场状态的差异情况,制成类似表1的形式。其中市场状态以月为周期。

3.2 改进的ID3规则挖掘算法

Gain(A)是指由于知道属性A的值而导致的熵的期望。熵是一个衡量系统混乱程度的统计量。熵越大,表示系统越混乱。对于决策树而言,最佳的分裂方案是使熵减少量最大的分裂方案。所以,最佳分裂就是使Gain(A)最大的分裂方案。

将ID3算法应用于事件影响规则挖掘的过程中,由于该算法标记叶结点的条件过于严格得到的规则过于细化,支持这一规则的样本数目很少。这样的规则没有实用价值。

文章对ID3算法进行了改进,使其能够适用于事件影响规则的挖掘。改进主要体现在两点:(1)柔性的叶结点标记规则。当子集中样本数过少时,合并相邻子集,生成唯一的叶节点,以优势属性值来标记该叶节点。(2)增加剪枝规则。当叶节点中的样本数过少,或者叶节点中的样本的决策属性发生矛盾时,删除该叶节点。

3.3 规则挖掘结果及分析

文章采用改进的ID3挖掘算法对采集到的数据样本进行规则挖掘,得到一组规则,选摘如下:(1)市场处于低迷状态时,若发生利率变动事件(利率下降),市场仍然处于低迷状态。(2)市场处于低健康状态时,若发生利率变动事件(利率下降),市场进入健康状态。(3)市场处于亢奋状态时,若发生利率变动事件(利率上升),市场进入健康状态。(4)市场处于健康状态时,若发生汇率变动事件(汇率下调),市场进入低健康状态。(5)市场处于亢奋状态时,若发生通货膨胀变动事件(通货膨胀率上升),市场进入健康状态。

……

对规则进行分析后,发现这些规则在一定程度上与现有的认知相吻合。比如一般利率下降时,股市上涨;利率上升时,股市下降。再比如国家的货币是实行升值的基本方针,股价就会上涨,一旦货币贬值,股价随之下跌。

但是,规则中也存在一些与现有的认知或者预期不吻合的情况。比如:市场处于低迷状态时,若发生利率变动事件(利率下降),预期市场应该好转,但规则显示市场大概率仍然处于低迷状态。可能有下面几种原因导致了这种情况:(1)影响市场的因素太多,其他为研究的因素干扰了事件规则的挖掘。(2)事件的影响要在一段时间后才显现出来,规则挖掘中状态周期应该针对不同的事件进行不同的调整。(3)周期事件的叠加影响要大于单一事件影响,而现有的规则挖掘算法中没有讨论事件叠加的情况。(4)市场状态的划分粒度不够细,导致规则的结果单一,缺乏多样性。

4 结束语

文章在前期市场状态研究的基础上,重点研究了三类事件模型,以及它们对市场状态的影响。文章为利率变动、汇率变动和通货膨胀率变动建立了事件模型,据此对采集到的数据进行了规则挖掘,得到了一组事件影响市场状态的规则。

文章最后对规则进行了分析,认为规则在一定程度上能够反映市场的状态变化,也对其中的误差进行了分析。今后,针对导致规则误差的原因,应该在调整市场状态周期的长短、细化市场状态的类别,考虑事件的叠加效应等方面深入研究。

参考文献

[1]胡美春,田大钢.基于修正参数简化标准的ID3改进算法[J].计算机与数字工程,2015(7):1182-1186.

[2]喻金平,黄细妹,李康顺.基于一种新的属性选择标准的ID3改进算法[J].计算机应用研究,2012,29(8):2895-2898.

[3]黎子良,邢海鹏.金融市场中的统计模型和方法[M].北京:高等教育出版社,2009.

猜你喜欢
事件证券市场数据挖掘
个人投资者特征对股票投资的影响
数据挖掘综述
软件工程领域中的异常数据挖掘算法
保罗·利科的“话语事件”思想
授之以鱼,不如授之以渔
热点事件中的“舆论搭车”现象探析
证券市场信息披露存在的问题及对策
嵌入式系统课程“中断、异常与事件”教学实践及启示
基于R的医学大数据挖掘系统研究
数据看股市