基于熵度量风险的投资组合优化模型
——来自深证100的数据分析

2014-07-02 01:37山东财经大学财务处山东济南5004山东财经大学金融学院山东济南5004
山东财政学院学报 2014年4期
关键词:度量方差股票

郑 勇,刘 超(.山东财经大学财务处,山东济南 5004;.山东财经大学金融学院,山东济南 5004)

基于熵度量风险的投资组合优化模型
——来自深证100的数据分析

郑 勇1,刘 超2
(1.山东财经大学财务处,山东济南 250014;2.山东财经大学金融学院,山东济南 250014)

在马科维茨的均值—方差模型的基础上,将熵理论引入投资组合模型中,建立基于熵度量风险的均值—熵模型,并选取深证100中的10只股票进行实证研究,比较了所选股票的方差与初始熵值,验证了新模型建立的可行性以及必要性。通过matlab计算两种模型的投资方案得出:均值—熵模型较均值—方差模型在实际应用中更具有实用性,在同样收益率水平下能够为投资者提供具有较少证券数量的投资方案。这不仅节约了过度分散化给投资者带来的交易费用和管理费用,而且节省了信息资源,增强了投资者的信息处理能力。

熵;风险;投资组合;均值—方差模型

一、引 言

在经济全球化和金融一体化的影响下,我国金融市场也得到了快速的发展。但是资本市场存在如上市公司质量不高、财务信息造假、监管不严、行政化严重等问题[1],导致其在金融结构、市场机制、市场深度、市场文化方面距离成熟的资本市场还有一定的差距,市场波动性较大,因而证券投资的风险管理问题就比较突出,而建立科学有效的风险度量方法是进行风险管理的基础。马科维茨的均值—方差模型的提出是金融风险进入量化时代的标志,但是该模型假设条件过于苛刻,其实际应用受到很多学者的质疑,之后又有学者提出其他方法,到目前为止有半方差度量法[2]、VAR度量方法[3]、ARCH度量方法[4]、β系数度量方法[5]等。但是这些风险度量方法都存在一定程度的缺陷,如半方差只说明收益率的偏离方向,没有反映证券组合的损失到底有多大[6];而VAR度量方法是在假设收益服从正态分布的条件上成立的[7]。实际中证券的收益率是不服从正态分布的,有必要寻找一种广泛有效的风险度量方法。从内涵上来看,熵是不确定性的体现,并且在度量过程中无需对分布做任何假设,因此本文提出将熵理论引入投资组合模型中,来寻求更加实用的组合选择工具。

许国志、李凤章[8]将熵与决策行动的不确定性和风险相联系并用于决策分析中。顾昌耀、邱苑华[9]提出将熵引入到贝叶斯决策中,改进和完善已有信息价值度量,丰富和发展了贝叶斯决策理论。在理论引入基础上,很多学者建立了自己的模型。主要有两种方法,一种方法是计算每只股票的熵来代表每只股票的风险,并对股票风险进行排序,筛选出适当数量的股票进行组合,但是这种方法并没有给出最终的投资方案。姜丹、钱玉美[10]建立效用风险熵模型,考虑了随机事件客观状态的不确定性和结果价值两方面的因素,并且说明了用熵衡量风险的合理性。杨继平[11]通过期望—效用决策模型对股票进行筛选排序,并与二阶随机占优准则做了比较,得出期望—效用决策模型更具有实用性的结论,但是该模型计算量巨大并且未考虑投资者的风险偏好。袁博[12]建立最单纯的熵模型,并引入调节因子来度量股票投资风险,对原上证50的50只股票进行风险排序,筛选出20只目标股票。实证研究得出,熵模型在度量股票投资风险具有高效、便捷、实用性。另外一种方法是根据熵的定义,直接给出投资组合的熵值表达式,确定投资方案,但是这种方法没有考虑个股风险对于投资方案的影响。李华[13]利用熵的最大熵原理改变组合投资的目标函数建立了模型。李江涛[14]结合我国实际情况,考虑交易费用、限制约束、最小交易单位以及限制卖空等几个条件,构建了均值—熵模型,该模型与我国真实股票市场相接近,与实际更相符,但是没有通过具体数据进行实证研究。

综上,国内学者对于熵理论对金融风险的度量和管理的研究还处于起步阶段,在建立模型时单独使用个股熵值排序筛选法和计算组合熵值确定投资方案这两种方法,所以各模型都有不可避免的弊端,因此将这两种方法结合起来,用投资比例加权个股的熵值来表示系统的风险是一种新的研究思路和方法。

二、均值—熵模型概述

用熵来度量投资风险,对收益率的概率分布没有要求。在实际的证券市场中,各风险资产收益率的分布并不是确定的,投资者只关心的是实际收益率小于期望收益率时所面临的风险,因此用熵度量投资风险在实际应用中更具有实用性和价值意义。从熵的定义来看,熵描述的是一个系统的无序程度,而信息熵是将系统的无序程度与信息量有效结合,信息熵的数值越大,表明该值包涵的样本的信息量越大,样本的不确定性程度就越小。风险本质上看是表现投资者收益率的不确定程度。选择用信息熵来度量投资风险具有更加完善的理论基础。熵表现的是收益率概率分布的多阶矩特征,能涵括更多关于分布的信息,相比只能反映分布二阶矩特征的方差,能更加准确地衡量投资者面临的全部风险。用熵衡量投资风险更符合客观现实,误差更小。根据熵的定义及其性质可知,用熵函数度量投资风险与投资者对于风险度量的理解是相一致的,基于熵测度风险的资产风险排序,相比用方差度量更具有合理性。

根据信息熵的定义可知,单个证券的熵值可用H(X)=piln pi求出,可将此公式定义为证券的初始熵值,但是根据信息熵的性质可知,由于各证券的收益率不是相互独立的,因此不具有可加性。常用的办法是将证券的熵分解成受市场影响的系统风险熵和非系统熵。王博[17]提出用β系数加权的市场收益率的熵和残差项的熵的和来表示单个证券的熵,具体表示为H(S)=βH(rm)+H(εi),但是该模型假设残差项和市场收益率是不相关的,而在现实生活中,残差项和市场收益率是有一定关系的。所以在此基础上,引入条件熵对此模型进行改进。所有单个证券的收益率对市场收益率的条件熵都是独立的,这样单个证券的熵就能相加。单个证券的熵值公式表示为:

由以上定义可以看出,H(S)反映的是某资产的风险程度,H(S)的值的大小与其风险程度是正相关的。

基于以上单个风险资产的风险度量公式,可定义投资组合的熵值公式:

设投资者投资于n种证券,第i(i=1、2….n)种证券的投资比例为n)。则n种证券的组合投资风险为:

理性的投资者总是希望在一定的收益下,投资风险尽可能的小。从这方面看还需加入一个约束条件使得证券投资组合的期望收益率大于等于某一给定的值,得到的均值—熵模型为:

三、均值—熵模型的实证分析

(一)数据选择

由于投资资本的有限性,投资者在选取投资组合时既要兼顾分散风险又要考虑自身资本承受能力,因此投资组合中的股票数量不宜过多。由根据风险分散和投资组合原理以及对中国股票市场的调查研究得出的经验法则[12]可知,当投资组合中的股票数量超过12只时,组合对非系统风险的分散作用开始减弱。因此,在研究过程中可以选择10只股票,此时组合对非系统风险的分散作用较大。

从深证100中涉及金融、能源、交通、地产等行业中选取成长性好、业绩高、收益率稳定的10只股票进行研究[15]。所选股票见表1。

为了保证数据序列的平稳性,选择使用股票的对数收益率来研究。为了保证模型的时效性,选取2012年7月1日至2013年7月1日的日收益率来研究。

表1 选取股票名称及代码

(二)数据处理

我们可以根据这10只股票从2012年7月1日至2013年7月1日的收盘价数据分析来推断其未来的收益趋势,股票的对数收益率定义为:

公式中,rit表示第i只股票在第t个交易日的对数收益率,pit,pit-1表示第i只股票在第t-1,t个交易日的收盘价。在进行计算之前,通过计算收益率序列的均值、标准差、偏度、峰度及正态分布检验统计量来了解各只股票收益率序列的基本统计特征。各股票相关统计特征值数如表2:

表2 各股票收益率序列统计特征

续表2

表3 ADF统计

从表2可以看出,各股票收益率的均值都在零附近,峰度远大于正态分布下的K=3,表现出显著的尖峰厚尾的特征,且各股票收益率的J-B统计量都远大于零,说明收益率序列不服从正态分布。

作为时间序列,尽管不服从正态分布,但是仍有必要检验序列的平稳性,平稳性检验最常用的是ADF检验,各股票的单位根检验的数据如表3:

从表3可以看出,在置信度为0.05的水平下,10只股票的收益率序列都通过了平稳性检验,可以进行进一步的熵值计算。

(三)数据计算

根据股票日收益率的定义可求出每只股票的对数收益率序列,并将区间[min(r),max(r)]等分10个小区间,并用频率来代替概率,这样可得到10只股票收益率的分布率和每个区间的样本均值,如表4所示,每只股票的第一行为频率,第二行为中间值:

表4 10只股票概率分布

根据以上概率分布,可求出每只股票的期望对数收益率和初始熵值,具体如表5和表6所示:

表5 各股票期望对数收益率

表6 各股票初始熵值

表7 初始熵值与方差对比表

各股票初始熵值与其方差的对比如表7所示。从表7可以看出,用熵衡量风险与用方差衡量有类似的效果,基本符合熵越大,方差越大。但也有一些不同,验证了研究熵度量风险的必要性。

运用同样的方法求深证100指数的概率分布,来代表市场收益率的概率分布。具体结果如表8所示:

表8 市场收益率概率分布表

计算得出市场收益率的风险即H(rm)=1.644。

在MATLAB中通过回归分析的方法计算出每只股票的β值,结果如表9所示:

表9 各股票β值表

各只股票的条件信息熵可用市场收益率的熵与各股票的初始熵的差值来表示,结果如10所示:

表10 各股票条件信息熵值表

根据H(Si)=βH(rm)+H(SI|rm)i=1、2…10可计算出各只股票的熵值,结果如表11所示:

表11 各股票熵值表

接下来计算在给定收益率的条件下,用熵值衡量风险与用标准差衡量风险的区别,可以通过计算一定收益率水平下,要使得投资组合的风险最小的各个股票的组合情况。

利用MATLAB中的优化工具箱可求解公式(6)这一线性约束问题,求出均值—熵模型下10只股票的投资比例,如表12所示:

表12 均值—熵模型下的股票投资比例

为了方便比较,我们可以求出相同收益率水平下,均值—方差模型的投资比例,具体如表13所示:

表13 均值—方差模型下股票的投资比例

通过对比均值—方差模型与均值—熵模型在相同收益率下的投资方案,可以看出,在收益率由低到高的过程中,两种模型都会选择用收益风险比较大的中金岭南(000060)代替华联控股(000036),可见新旧模型存在相似的选择过程。但是用熵度量风险的新模型计算出的投资方案中只通过两只股票来分散风险,而传统方法得出的最有投资组合中包括了更多的股票。

四、结 论

(一)用熵来度量风险具有合理性和可行性

从实证过程可以看出,股票的熵值不依赖于某种特定的分布,只要确定收益率的分布,便能求出股票的熵值,因此熵值是一种理想的股票风险度量手段[16]。

(二)均值—熵模型能够为投资者提供更加简单的投资方案

从以上的实证结果可以看出,在相同收益率下,用均值—方差模型计算出的最优投资组合中包含的股票数量更多。虽然从理论上来讲,选择的股票越多,分散风险的效果就越明显,但是过度分散不仅不会降低投资者面临的风险,反而会因为信息成本等其他成本的增加提高风险。而基于熵度量风险的均值—熵模型提供给投资者的最优方案中包括的股票数量更少,更加简洁,可以减少交易费用和管理费用,降低投资者的风险。

(三)模型评价

1.模型优势

(1)使用熵代替方差衡量投资组合的风险,不需要对收益率的分布做任何假设,是一种对客观概率的正确描述和无偏估计,代表风险的熵值的大小只与收益率的概率分布状况有关,这就克服了使用均值—方差模型必须假设收益率的分布是正态分布的缺陷。因此,均值—熵模型在使用时更具有实用性。

(2)熵在度量风险时与方差的效果是相似的,但是熵可以描述收益率的多阶矩的特性,相比方差只能表达的二阶矩的特征,熵能提供更多关于收益率的信息,因此能更加准确地衡量不确定程度。投资者确定各个风险资产的投资比例的过程是复杂动态多变的,用熵来衡量投资组合的风险更加合理。

(3)虽然增加投资组合中的资产数量能够有效分散系统风险,但是过度分散反而会降低组合收益。本文的实证结果表明,均值—熵模型能够在相同收益水平上,提供给投资者更加简单精炼的投资方案。包含股票数量较少的投资方案,能在分散风险的基础上有效降低管理费用和交易费用,从而降低投资者面临的风险。

2.模型的不足之处

(1)本文提出的均值—熵模型,在数学方面欠缺严谨性,没有证明过程。

(2)整个计算过程过于繁琐,需要进一步通过计算机仿真,增强模型的实用性,为投资者选取资产组合提供便利工具。

(3)由于熵的值只跟变量的概率分布有关系,并不受其取值的影响,不能表现出投资者对于风险的主观反映,因此熵对风险的描述欠缺全面性。

(4)在整个分析过程中,没有考虑税收和交易费用等问题,需要进一步改进。

[1]王霄,杨珊珊.浅析我国资本市场存在的问题及原因[J].商,2013(3):121-122.

[2]卫海英,张国胜.基于半方差风险计量模型的组合投资分析[J].财经研究,2005(1):115-121.

[3]邵欣炜.基于VAR的金融风险度量与管理[D].长春:吉林大学,2004.

[4]闫冀楠.股市投资收益与风险直接关系的定量研究[J].天津大学学报,1999(7):454-458.

[5]丁健.β系数估计方法研究[D].北京:对外经济贸易大学,2006.

[6]王春峰.金融市场风险管理[M].天津:天津大学出版社,2001.

[7]赵青.投资项目组合风险分析与度量[D].西安:西北工业大学,2005.

[8]李凤章.决策分析中的风险、不确定性和熵[D].北京:中国科学院,1988.

[9]顾昌耀,邱苑华.复熵及其在Bayes决策中的应用[J].控制与决策,1991(4):253-259.

[10]姜丹,钱玉美.效用风险熵[J].中国科学技术大学学报,1994,24(4):461-469.

[11]杨继平,张力建.期望效用—熵决策模型在沪市争取按投资选择中的应用研究[J].系统工程,2005,23(12):23-29.

[12]袁博.熵模型在股票投资风险管理中的应用研究[D].西安:西安建筑科技大学,2009.

[13]李华.证券投资组合中的熵优化模型研究[J].大连理工大学学报,2005,33(6):16-21.

[14]李江涛.熵风险下的国内证券投资组合模型[J].商业经济,2009(11):64-65.

F830.59

A

1008-2670(2014)04-0029-07

2014-04-10

国家自然科学基金项目“货币政策多目标交互行为协调控制研究”(61273230);2012年度教育部“新世纪优秀人才支持计划”(NCET-12-1027);山东省“金融产业优化与区域发展管理协同创新中心”首席科学家平台“金融产业系统优化机制创新平台”。

郑勇,男,山东滨州人,山东财经大学财务处经济师,研究方向:财务理论与实践;刘超,男,山东济南人,山东财经大学金融学院教授,博士生导师,研究方向:社会经济系统分析与计算机仿真。

猜你喜欢
度量方差股票
鲍文慧《度量空间之一》
模糊度量空间的强嵌入
概率与统计(2)——离散型随机变量的期望与方差
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
方差越小越好?
计算方差用哪个公式
方差生活秀
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票