主成分分析法在股票研究中的应用

2010-01-07 03:06王玉玲马军海
现代管理科学 2009年11期
关键词:主成分分析股票评估

王玉玲 马军海 王 晶

摘要:文章利用主成分分析法对有色金属板块上市公司第一季度的经营业绩进行了评估。首先从有色金属板块中选择了16家上市公司,选择了9项财物指标,根据报表数据利用通过R软件进行主成分分析。自此基础上,利用主成分方法得出了一种综合排名。研究结果表明,评估比较合理,客观上能反映上市公司的综合水平。

关键词:主成分分析;股票;R软件;评估

中国股市迅速发展壮大是有目共睹的,随着中国的股市正在逐步走向完善,走向规范化,价格向其内在价值回归是未来股市发展的重要方向。股票的档次将不断拉开,成长率高的绩优股会越来越受到投资者的追捧,过去那种高投机、高市盈率、价格严重偏离其价值的现象将逐步纠正。理智的股票投资者,将会更加重视上市公司的经营业绩、重视股票自身的品质,即重视投资对象的选择。但是随着股市发展、投资手法和证券监管方法的成熟,以及上市公司数量的不断增多,如何科学合理的进行股票的分析和选择是每一个投资者所要解决的首要问题。

笔者选取16家上市中去,根据2006年度证券第四季度报告中的信息以及数据,选择每股收益、投资收益、净利润等9九项财物指标,对这些公司进行了主成分分析,试图对他们进行分类,为股票的分析和选择提供依据。

一、 R软件、主成分分析简介

1. R软件。R软件是一个开放的统计编程环境,是S语言(由AT&T; Bell实验室的Rick Becker, John Chambe- rs,Allan Wilks开发)的一种方言之一,它是集统计分析与图形直观显示于一体的统计分析软件。R作为一个计划,最早(1995年)是由Auckland大学统计系的Robert Gentleman和Ross Ihaka开始编制,目前由R核心开发小组(R Development Core Team-以后用R DCT表示)维护,他们完全自愿、工作努力负责,并将全球优秀的统计应用软件打包提供给我们使用。我们可以通过R计划的网站了解有关R的最新信息和使用说明,得到最新版本的R软件和基于R的应用统计软件包。R是完全免费的,R可以运行于UNIX, Windows和Macintosh的操作系统上,我们可以编制自己的函数来扩展现有的R语言。

2. 主成分分析法。主成分分析,也称主分量分析,其基本思想是通过原有变量的少数几个线性组合来解释原有变量所体现的样本变差。

设X1,X2,…,XP为原有的P个指标,X=(xij)n×p为其标准化观测矩阵,R=(rij)n×p为其相关系数矩阵,Li=(l1i,l2i,…,lpi)T(i=1, 2,…,p)为P个常数向量。考虑如下线性组合:Yi=■IkiXk(i=1, 2,…,p)为p个指标。Yi的样本方差为VarYi=LiTRLi,协方差Cov(Yi,Yj)=LiTRLj(i,j=1,2,…,p)。希望用较少的新指标代替原来的p各指标,就要求他们含有尽可能多的原指标信息且互不相关。指标信息量的大小通常用该指标的方差来计算,方差越大,信息量就越大,反之则越小。

设R的特征根和对应的正交化单位特征向量分别为 ?姿1?叟?姿2?叟…?叟?姿p?叟0和e1,e2,…,ep,则可以证明当Li=ei时,有VarYi=?姿i,cov(Yi,Yj)=0(i,j=1,2,…,p)。此时令:

bk=?姿k/■?姿j/,k=1,2,…,p(1)

ck=■?姿j/■?姿j,k=1,2,…,p(2)

则bk和ck分别称为第k个主成分的贡献率和前k各主成分的累积贡献率。累积贡献率表明了前k个主成分占有指标总信息量的份额,一般当ck=85%时,就可以用k个主成分来表示原有指标而不会损失多少信息。此时得到的综合评价函数为:

F(X)=b1Y1+b2Y2+…+bkYk=b1e1TX+b2e2TX+…+bkekTX(3)

在上述步骤中,首先需要对观测矩阵进行标准化处理,只有所有指标在同一个量纲范围内,比较才与意义。且有些指标存在正指标、负指标和区间指标的区别,因此标准化显得非常重要。目前标准化处理的主要方法有 值法、指数法、线性插值法、百分位法等。这里我们采用比较常用的正态标准化处理,即

Xij*=■,j=1,2,…,p

其中■j为指标j的平均观测值,?啄j为其标准差。

二、 实证分析

1. 样本的引入。根据2001年度证券中期报告中的有关信息,16个上市有色进入板块的各项指标及其数据如表所示:

指标体系:

X1——每股收益(元);X2——每股净资产(元);X3——净资产收益率;X4——主营业务净利润(万元);X5——股东权益(万元);X6——主营业务收入(万元);X7——主营业务利润(万元);X8——利润总额(万元);X9——净利润(万元)

数据如表1所示。

将这些原始数据输入到R软件中,命名为Zhibiao,采用R软件中的命令Zhibiao<-scale(Zhibiao)将原始数据标准化,利用命令Zhibiao.pr<-princomp(Zhibiao,core=TRUE) summary(Zhibiao.pr,loadings=TRUE)对数据作主成分分析,然后再用命令predict(Zhibiao.pr)计算各样本主成分的值。

从表2中可以发现,表中前面三个特征值的贡献率已经达到90.5%,因此只要选取3个主要成分因子就基本上能反映原指标的信息表4对应的是旋转主成分载荷矩阵。

由表3中可以看出,第一主成分中每股净资产收益率(X3)主营业务净利润(X4),主营业务利润(X7),利润总额(X8),净利润(X9)占的比重比较大。净资产收益率是公司税后利润出一净资产得到的百分比率,用以衡量公司运用自由资本的效率。主营业务收入反映了企业从事某种主要生产、经营活动所取得的营业收入。利润总额反映了企业所获得的收入减去成本后获得的利润,净利润反映了企业所获得的收入减去所有的成本包含机会成本后所获得的利润。总的来讲,上述五个指标主要反映了上市公司的综合实力,因此第一主成分可以命名为“综合实力”因子。第二主成分中每股收益(X1)、每股净资产(X2)、主营业务收入(X6)虽占的比重比较大,这几个指标主要反映近期上市公司的盈利水平,因此可以命名为“盈利水平”因子。第三主成分中股东权益(X5)所占的比重(下转第85页)非常大,达到了95.5%。而股东权益又称净资产,是指公司总资产中扣除负债所余下的部分。因此可以命名为“资产规模”因子。

根据表4,我们得到三个主分量分别为:

Y1=-0.293X1-0.213X2-0.364X3-0.337X4-0.126X5-0.329X6-0.406X8-0.411X9

Y2=0.479X1+0.536X2+0.253X3+0.243X4+0.118X5-0.371X6-0.270X7-0.270X8-0.249X9

Y3=0.191X1+0.197X3-0.103X4-0.955X5

于是我们得到股票的综合评价函数为:

F(X)=56.19%Y1+23.62%Y2+10.66%Y3

我们将16种股票标准化后的数据代入上面的公式进行计算,得到股票的一种综合排名次序,见表4。

分析表4的结果,豫光金铅一举成为综合排名首位,原因是显然的,表一中第四列,第七列,第九列具有较强的相关性,虽然厦门钨业在这些方面都高于豫光金铅,但其它指标都不如豫光金铅。

三、 结束语

本文采用主成分分析法对有色金属板块的部分上市公司进行了评估,得出了一种最终排名,研究结果表明,评估比较合理,客观上能够反映上市公司的综合水平。

实际上,主成分分析还可以推广到其他类似领域、比如大学排名、地质勘探、综合国力的测定和武器评估等方面。在建立模型前应该把握好几个环节,首先抽取有代表意义的指标,进一步分析数据是否具有相关性,如果相关性明显,采用主成分分析表较好,如果相关性不明显,则应考虑别的方法。

参考文献:

1. 柯冰,钱省三.聚类分析和因子分析在股票研究中的应用.上海理工大学学报,2002,4(24).

2. 张尧庭,方开泰.多元统计分析引论.北京:科学出版社,1982.

3. 薛毅,陈立萍.统计建模与R软件.北京:清华大学出版社,2007.

基金项目:国家自然科学基金(60472062);安徽省高等学校省级自然科学研究项目(KJ2009B213);天津商业大学应用数学重点学科资助。

作者简介:马军海,天津大学管理学院教授、博士生导师;王玉玲,天津商业大学讲师,天津大学管理学院博士生;王晶,硕士,蚌埠学院教师。

收稿日期:2009-09-07。

猜你喜欢
主成分分析股票评估
地方立法后评估刍议
评估社会组织评估:元评估理论的探索性应用
360度绩效评估在事业单位绩效考核中的应用探析
本周创出今年以来新高的股票
本周创出今年以来新高的股票
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票