张慧媛 冯婧 刘天生 王蕊 雷亮
【摘要】随着中国金融市场的迅速发展,股票已经成为广大投资者投资组合的主要方式,如何选择表现优秀的股票、规避风险等成为投资者普遍关注的问题。本文从大数据角度,以中证800指数2011年~2015年的股票数据为基础,将其细分为33个行业,建立股票组合投资模型。首先设计MATLAB快速算法计算各行业的Pearson相关系数进而整合出行业组合;然后通过研究股票涨跌幅、开盘价和收盘价等指标,计算出各行业及内部股票表现力指数;拟合行业内部股票涨跌的时间分布图。投资者进而根据行业表现力指数,选择对应的行业组合,结合各行业代表性股票时间分布图选出科学的股票投资方案,规避传统经验选股方法的不足。
【关键词】因子分析 Pearson相关系数 股票组合投资
股票组合投资模型的建立与求解
一、数据的预处理
(1)对数据进行分析,发现中证800共有33个行业,531只股票。我们将每个行业有股票分别对应。
(2)由于考虑到531只股票。根据2010~2015的日数据,利用MATLABB编程,建立快速算法,计算出每只股票的年收盘价均值。并算出年涨跌幅。
(当前交易日最新成交价(或收盘价)-前一交易日收盘价)/前一交易日收盘价
(3)计算行业指数,经查阅资料,我们发现以收盘价的比值计算出的涨跌幅可以较准确表示为行业指数。行业指数是反映不同时点上股价变动情况的相对指标。
行业指数=n个样本行业指数之和/n
二、根据年均涨跌幅择出优秀行业
因子分析是一种有效的降维和信息浓缩技术,是主成分分析模型的进一步推进。为了精确分析2011-2015年各个行业涨跌幅,选择因子分析模型。
设xi(i=1,2,...,p)p个向量,如果表示为:即X=AF+?着F1,F2,...,Fm称为公共因子,是不可观测的变量,A=(aij)p×m称为因子载荷阵,aij表示第i个变量在第j个因子上的载荷,?着i是特殊因子,是不能被前m个公共因子包含的部分,并且满足Cov(F,?着)=0,F,?着不相关。
三、强弱的时间分布特征
利用Excel绘制各个行业以及中证800从2011到2015的年涨跌幅,通过不同行业在不同年度涨跌幅与中证800的比较,得到行业强弱的时间分布特征:
(1)2011年:相对上年,中证800下跌,各行业表现有增有减,其中化工原料、小金属、汽车配件、工程机械、水泥等表现优秀。
(2)2012年:相对上年,中证800下跌,行业表现整体呈下降趋势,各行业在此时都处于弱势。
(3)2013年:中证800上涨,行业表现整体呈上升趋势,各行业情况好转。但其中,煤炭开采、小金属、有色金属、服饰、工程机械、水泥、普钢这几个行业相对上年下跌。
(4)2014年:中证800下跌,行业表现大都呈上升趨势,其中软件服务、通信设备、汽车配件、专用机械、港口等行业的涨幅较大,表现较好。
(5)2015年:中证800上涨,所有行业表现均有上升好转。其中,软件服务、证券、建筑施工、火力发电、区域地产处于优势地位。
四、根据年均涨跌幅分析各个行业的相关性
影响股票价格的因素繁多导致股票市场变动的的不可预测。本文选取Pearson相关系数模型分析同一板块中不同行业的相互影响,继而判断各个行业之间关系的强弱。设yij为每个行业的年均涨跌率,i为年数,j为行业数。然后建立Pearson相关系数模型。Pearson相关系数的计算公式:
共有33个行业,使用每个行业五年的年均涨跌幅利用MATLAB编写程序得出33个行业之间的两两关系建立的相关性矩阵,每个行业选取相关性排名前2位的行业进行分析。
五、科学选股及模型的应用
本文采用短线交易,短期持仓的方式,由相关性排名前两名的行业,三个行业一组,作为股票的组合。随机抽取2013年股票组合33为例,以历史涨幅作为制定权重的主要指标,计算利润,如下表:
参考文献
[1]汪晓银,周保平.数学建模与数学实验[M],北京:科学出版社.
[2]王学民.因子分析在股票评价中的应用,中图分类号:0212 ,文献标识码:A.
作者简介:张慧媛(1994-),女,内蒙古自治区巴彦淖尔市人,民族:蒙古族,学历:大学本科在读 ,研究方向:金融工程、数学建模,计量经济学。