基于主成分分析和聚类分析的股市板块流动性分析

2018-03-06 05:09邬伟杰
经济研究导刊 2018年4期
关键词:负荷量对数价差

邬伟杰

(西南交通大学数学学院,成都611756)

一、流动性与主成分分析方法

流动性是股票市场的生命力所在。流动性作为资本市场的重要因子,是指资产能够以合理价格以及较低的交易成本迅速地转换成其他资产的一种能力,是用来评价证券市场运行质量的重要指标之一,备受学术界的关注。在流动性充足的市场,证券的买卖成本较低,市场比较稳定,投资者对市场有信心,资源的配置效率也会提高。所以,进行流动性研究对于股票市场具有重大意义。

流动性通常是指一种资产能以比较低的交易成本和合理的价格迅速转换为其他资产的能力。股票市场流动性研究并不是一个单一的概念,不能仅仅使用一维变量来度量,在流动性的研究中,常用是用速度、紧度、深度和弹性四个维度来刻画。由于用维度刻画时需要多个度量指标,每个指标间可能也存在共线性,所以利用主成分分析法来对选取的指标进行降维处理。

主成分分析是一种通过降维技术把多个变量化为少数几个并且反应原始变量的绝大部分信息的统计分析方法。主成分分析方法不仅可以保留原始指标的主要信息,每个指标都不相关,而且比原始指标具有某些更优越的性质,使得在股票流动性研究时抓住主要方面。胡克等利用主成分分析方法进行股票流动性的度量以及排序。聚类分析是将样本个体或指标变量按其具有的特性进行分类的一种统计分析方法,本文基于主成分分析和聚类分析对股票流动性进行研究。

二、流动性评价指标体系

流动性定义有很多种,Amihud和Mendelson认为,流动性即在一定时间内完成交易所需要的成本,或寻找一个理想的价格所需要的时间。Glen把流动性界定为迅速交易且不造成大幅度价格变化的能力。Schwartz认为,流动性是以合理的价格迅速成交的能力。从上面的定义来看,刻画流动性不能使用一维变量来度量,流动性实际是包含了四个方面的内容:速度、紧度、深度和弹性,即交易时间、交易成本、交易数量和弹性。

由于数据获取的限制,本文只选择了15种度量方法,即15个度量指标:成交量(Q)、成交金额(V)、市场深度(D)、对数深度(Dlog)、绝对价差(Sabs)、对数绝对价差(LogSabs)、相对价差(SrelM)、用最后交易价格计算的相对价差(SrelP)、对数价格的相对价差(Srellog)、对数价格的对数相对价差(LogSrellog)、有效价差(Seff)、用最后交易价格计算的相对有效价差(SeffrelP)、报价斜率(QS)、对数报价斜率(LogQS)、换手率(TR)。

主成分分析法要求指标具有同趋势性,本文选取的15个指标中,成交量、成交金额、市场深度和对数深度这4个指标的数值越大,代表股票流动性越好,而其他11个指标则越小其代表股票流动性越好,所以为了保证同趋势性,将成交量等4个指标进行了先取对数再取倒数。另外,为了保证量纲一致,将所有指标准化处理。

三、主成分分析方法与聚类分析方法

主成分分析是一种通过降维技术把多个变量化为少数几个并且反映原始变量的绝大部分信息的统计分析方法。但是,研究某一问题所涉及的众多变量之间具有相关性,鉴于这一点,通过对原始变量相关矩阵或协方差矩阵结构关系进行研究,利用原始变量的线性组合形成几个综合指标(即主成分),保留了原始变量的主要信息,彼此之间也不相关,使在研究问题时抓住主要矛盾,这就是主成分分析方法的思想。

聚类分析是将样本个体或指标变量按其具有的特性进行分类的一种统计分析方法。依照事物的数值特征,来观察各样品之间的亲疏关系是其基本思想。而样品之间的亲疏关系则由样品之间的距离衡量,一旦样品之间的距离定义之后,则把距离近的样品归为同一类,这就是聚类分析方法的思想。

四、实证结果及分析

1.样本数据选取及来源。本文选取深圳A股29支股票作为研究对象,对2016年1月4日至11月4日的15个指标数据利用主成分分析方法进行分析。数据来源于通达信软件。

2.对标准化数据进行主成分分析得到特征值和方差贡献率(见表1)。

共有15个特征值,其中有4个大于1的特征值,第一个特征根是6.54,它解释了方差贡献率的43.603%;第二个特征根为3.851,它解释了方差贡献率的25.673%;第三个特征根为1.82,它解释了方差贡献率的12.137%;第四个特征根为1.26,它解释了总变异的8.399%,此时累计方差贡献率达到89.811%,故取前4个主成分。

表1 特征值和方差贡献率

3.对成分矩阵的第i列的每个元素分别除以第i个特征根的平方根,得到主成分分析的第i个主成分的系数(见下页表2)。

根据表2,得到各主成分与原始指标的线性表达式为:

表2

(1)主成分因子Z1中,Sabs,Log Sabs,和QS的因子负荷量远大于其他指标的因子负荷量,所以Z1主要是绝对价差、对数绝对价差和报价斜率4个指标的反映,它主要刻画股票的绝对价差。(2)主成分因子Z2中,SrelM、SrelP、Srellog、LogSrellog和LogQS的因子负荷量远大于其他指标的因子负荷量,所以Z2主要是相对价差、用最后交易价格计算的相对价差、对数价格的相对价差、对数价格的对数相对价差和对数报价斜率5个指标的反映,它主要刻画股票的相对价差。(3)主成分Z3中,1/Q、1/V的因子负荷量远大于其他指标的因子负荷量,所以Z3主要是成交量、成交金额2个指标的反映。它主要刻画的是交易数量,即深度。(4)主成分Z4中,TR的因子负荷量远大于其他因子负荷量,所以Z4主要是换手率这个指标的反映,它主要刻画股票交易的速度。

五、板块流动性分析

根据2016年1—11月份的30支股票所得4个主成分得分情况,利用SPSS软件对29支股票进行聚类分析,结果(见下页图)。

由图可知,股票分为四类:第一类包含股票吉林化纤,特点是价差小,换手率高,深度数值大,经计算得整个类得分是3.881859319;第二类包含股票苏泊尔、黄山旅游和美的集团三个股票,其特点是价差小,换手率高,深度数值高,经计算得整个类得分是3.847384883;第三类包含股票深康佳A、太平洋、华侨城A、西南证券、深圳能源、皖能电力、宝新能源、天山股份和海通证券,这类股票价差较大,换手率较低,深度数值较低,经计算整个类得分15.89090295;剩余股票都为第四类,其特点是价差相比于第一、第二类股票大,换手率相比于第一、第二类股票低,经计算得整个类得分为68.20483347。

由计算每个类股票得分可以看出第一、第二类股票得分低,流动性好,交易数量多,交易速度快。与第一、第二类股票相比,第三、第四类股票得分高,流动性差,交易数量相对较少,交易速度较慢。

六、结论与建议

本文通过基于主成分分析方法和聚类分析方法对深圳A股的29支股票进行研究分析,每个类别的得分显示,第二类流动性最好,其次是第一类,第四类流动性最差。第二类包含旅游业板块和电器行业板块,旅游业和电器行业正处于发展上升期,行业发展好,股票流动性好;第四类包含金融行业板块、能源行业板块、公共交通行业板块和建材行业板块,金融业发展成熟,能源行业、公共交通行业和建材行业板块发展稳定,流动性不是特别好;第一类中只有吉林化纤1支股票,吉林化纤股份有限公司通过积极推进重点项目建设,培育新的增长点,积极调整产品结构,加快新品生产,提高产品差别化率等一系列措施不断发展创新,提高了股票的流动性,在化纤行业股票流动性处于领先地位;其他行业板块还需要加快发展,不断发展创新,以达到提高股票流动性的目的。

[1] 王春峰,梁崴,房振明.利用主成分分析方法对流动性统一度量的研究[J].西北农林科技大学学报:社会科学版,2007,(3):29-30.

[2] 胡克,曾志坚.基于主成分分析的股票流动性的度量[J].财经理论与实践(双月刊),2005,(26):49-52.

[3] 谢赤,张太原,曾志坚.中国股票市场存在流动性溢价吗?[J].管理世界,2007,(11).

[4] 王沁,文慧敏,郑兴,周思娟.基于时序全局主成分分析的四川省区域经济协调发展水平研究[J].经济研究导刊,2016,(6):57-58.

[5] 韩春,田大钢.聚类方法对股票市场文本挖掘信息的分析[J].中国集体经济:财税金融,2008,(21).

猜你喜欢
负荷量对数价差
明晰底数间的区别,比较对数式的大小
体育教学运动负荷的调整与控制的探讨
利多卡因负荷量在分娩镇痛中的效果观察
比较底数不同的两个对数式大小的方法
浅析学校体育课中的运动训练负荷
舞蹈训练负荷对学生机体产生的影响及负荷量安排建议
活用对数换底公式及推论
神奇的对数换底公式