○花俊洲 (上海金融学院 上海 201209)
CAPM模型中β系数的非参数估计
○花俊洲 (上海金融学院 上海 201209)
在资产定价模型的实证检验中,由于证券期望收益与系数β值之间未必存在严格的线性关系,因此使用一般线性回归方法对β进行估计必然会导致模型的不准确。作为对这种估计方法的修正,本文提出了可变系数回归模型,利用局部加权最小二乘估计方法对模型中的系数β进行估计,并研究了模型中局部权系统的决定问题,该模型是一般线性回归模型的推广。由于系数的可变性,使得估计结果更适应实际数据的变化规律,从而估计结果更为精确,该方法也为风险管理和监督提供了较为有用的数理工具。
CAPM β系数 可变系数回归模型 局部加权最小二乘估计
资产定价问题是近几十年来西方金融理论中发展最快的一个领域。投资组合理论由亨利·马柯维茨(H.M.Markovitz)于1952年创立,形成了现代资产定价理论。它把投资者的投资选择问题系统阐述为不确定性条件下投资者效用最大化问题,这标志着现代证券理论研究进入了定量分析阶段。马柯维茨的研究在理论上解决了证券组合的选择问题,但因其需要巨大的计算量而难以得到广泛应用。1963年,威廉·夏普(Sharpe)提出了简化形式的计算方法,即单指数模型。1965年前后,Sharp等人提出著名的资本资产定价模型(CAPM),使投资组合理论应用于整个经济学领域。这一模型在现实的投资组合绩效、证券估价、确定资本预算及管理公共事业股票中得到了普遍应用。
在一组严格的假定下,CAPM模型可简单地表达为:
ri=αi+βirM+εi
其中ri表示证券或组合i的期望收益率,αi表示独立于市场部分的收益率,rM表示市场组合期望收益率,βi为证券或组合的系统风险系数,εi为随机误差。
然而,大量的实证研究又发现一些CAPM无法解释的异常现象,诸如公司的规模、赢利—价格比、现金流量—价格比、历史销售增长率、历史收益率表现等因素都会对股票的期望收益率产生一定的影响。针对证券收益受多种因素的影响,马歇尔(Marshell)和布努姆(Blume)等人又提出了多因素模型。
多因素模型(MPM)由于具有较强的解释性而成为目前投资实践中的主导模型。从统计的观点看,多因素模型通过许多因子来确定证券的价格,所考虑因素的范围较广。与CAPM模型仅从证券市场本身的历史来研究股价不同,多因素模型把证券的价格与通货膨胀率、失业率、工业生产总值、利率水平、汇率水平等经济因素联系起来,从而使模型能更好地反应现实情况。
多因素模型的简洁表达如下:
其中:Ij(j=1,2,…,p)表示影响收益率的第j个因素,βij表示证券或组合i对因素Ij的敏感度,其他符号表示同上。可以看出,多因素模型认为股票的超额收益由两部分组成,即由各因素作用影响的收益部分和无法由各因素解释的收益部分。
1976年,罗斯(Ross)通过放松有效市场的假设,提出了套利定价理论(APT),对CAPM模型作了进一步修订,其重要特性是合理且简单易懂。在均衡状态下,所有被选择的证券组合来自被考察的资产集并满足无风险就无收益的条件,而且对其风险性资产的定价不依赖于有效市场证券组合的选择。它假设任一证券的收益率是由k个因素的线性函数决定的,其方程为:
其中:Eri是第i种资产的期望收益率,Fj(j=1,2,…,k)表示第j种因素指数的收益,βij是第i种资产的收益对第j个因素的灵敏度,εi是第i种资产均值为零的特殊收益。
尽管上述三大资产定价理论在经济解释和应用上有很大区别,但在数学处理上却有共同之处,即假定证券期望收益与系数β值之间存在严格的线性关系,并使用一般线性回归方法对其系数进行估计。然而,实证检验表明,证券期望收益与β值之间是否存在严格的线性关系仍然值得怀疑。Black等以及Fama和MecBeth对美国证券市场的实证研究发现,证券的期望收益与β之间确实存在一种正的线性关系,然而在1992年Fama和French采用与以前不同的样本数据研究发现,证券的期望收益与他们所设计的β之间几乎不存在相关性。陈浪南和屈文洲针对上海证券市场的实证研究表明,β对股票期望收益的解释能力并不是很强。
很显然,假如实际中证券期望收益与β值之间不存在严格的线性关系时,使用上面的一般线性回归方法来估计系数β,必然会导致结果的不正确。本文针对这种不足,提出了一个可变系数的回归模型,并使用局部加权最小二乘估计法来估计系数β,使得估计结果更为准确,能够更加适应数据自身的变化规律,也更贴近于数据的实际要求。
首先来回顾一般采用的线性回归方法。为了便于数学表达,可以把上述三大定价定理抽象为统一的数学模型。
定义1(一般线性回归模型):假定对某种证券或组合有n组历史观测数据(Yi,xi),其中Yi表示收益率,xi=(xi1,xi2,…,xip)T表示影响该证券或组合收益率的因素,对于随机变量Y1,Y2,…,Yn一般的线性回归模型如下:
(Ⅰ) Y1,Y2,…,Yn相互独立,并且Yi~N(μi,σ2),i=1,2,…,n
其中xi0=1;μi=E(Yi),i=1,2,…,n。
通常情况下,可以用最小二乘方法来对该模型进行估计。
定义2(可变系数回归模型):假定对某种证券或组合在不同的观测“位置”Vi,有n组历史观测数据(Yi,xi),i=1,2,…,n,对于随机变量Y1,Y2,…,Yn在“位置”V点的可变系数回归模型定义如下:
(Ⅰ) Y1,Y2,…,Yn相互独立,并且Yi~N(μi,σ2),i=1,2,…,n
其中V∈D,D是一个带有距离函数d(·,·)的m维度量空间,V可以解释为观测数据x所对应的“位置”,比如:当V=t为一维时间标量时,就表示按时间顺序观测到的数据x,当V=(x,y,z)为三维向量时,就可以表示为在空间地理位置(x,y,z)上观测到数据x,当V=(x,y,z,t)为四维空间时,则表示t时刻在空间地理位置(x,y,z)上观测到数据x,如此等等。D中的距离d(·,·)可以根据问题的实际背景具体化,除了通常使用的欧氏距离之外,它还可以取作两观测点之间的社会环境、经济环境、自然环境的相似性度量等等。在此基础上,我们的模型可看成是随观测数据x的“位置”V变化而变化模型系数的变系数回归模型。β0(·),β1(·),…,βp(·)是p+1个定义在空间D的某一子集上的函数。
尽管可变系数线性模型形式上看起来很具体,但它实际包含了许多熟知的线性回归模型作为其特例,如:
(Ⅰ)如果βj(V)=βj,j=0,1,…,p是p+1个未知常数,那么模型(1)便是一般线性回归模型。
(Ⅱ)取D⊂RP,V=x且β1(x)=…=βp(x)=0,则模型(1)便为μ=β0(x);由于β0(x)是任意函数,所以这正是非参数回归模型。
(III)如果取D=[0,+∞),V=t是第t个观测值在被获得的时间点,那么模型(1)便为:μt=β0(t)+β1(t)xt1+…+βp(t)xtp,t=t1,t2,…,tn。这个模型便是熟知的动态线性回归模型。
因此,可变系数回归模型,是原来的一般线性回归模型的推广。对于模型(1),可以通过下面的局部加权最小二乘方法来估计系数。
南通历史上有许多英雄人物,深受儒家经内圣外王思想的影响,努力在各方面完善自我提升自身的修养能力,在此基础上,凭借着“己欲立而立人,己欲达而达人”的理念,将自身理想信念外扩,从而造福桑梓服务社会。
利用非参数回归中局部拟合的思想,通过对对数似然函数施加适当的局部权,再利用极大似然原理得到所关心的局部估计量,适合非参数回归拟合问题。这种思想自提出以后,目前已得到广泛的研究,本文正是利用这种思想来进行局部加权估计的。
一般地,给定任何一点V∈D,这里xT=(x1,x2,…,xp)∈M,对所有的观测点(Yi;xi1,xi2,…xin)i=1,2,…,n,它们均提供了μ=EY在给定点V的信息,这些信息可用以估计系数β0(V),β1(V),…,βp(V),然而不同的观测值对在给定点处V的系数估计有不同的重要性,这种重要程度可以通过一组权来对相应似然函数中的各项作调整。
设在给定点V处的一组权为:w1(V),w2(V),…,wn(V),其中第i个权wi(V),相对应于第i个观测数据(Yi;xi1,xi2,…,xip)。
对于模型(1),不难求得(yi,y2,…,yn)的对数似然函数:
按照局部似然方法,在给定点处V相应于权wi(V),i=1,2,…,n的局部加权似然函数(为方便计,仍记为lnL(β(V);y1,y2,…,yn))为:
定义2对给定的点V∈D,使(3)式达到最大值的β(V)的值,记为:β^(V)=(β^0(V),β^1(V),…β^p(V))T,称为β(V)在给定点处V的局部加权最大似然估计量。
由于变系数回归模型的局部加权最大似然估计量的推导类似于一般线性回归模型的推导,因此可以不加证明地给出如下结论。
定理1对于变系数回归模型(1),β(V)在给定点V处的局部加权最大似然估计量由如下方程组来决定:
定理2对于变系数回归模型(1),假定对于任意点V∈D,矩阵XTW1(V)X的逆矩阵均存在,那么β(V)在给定点V处的局部加权最大似然估计量为:
并且,W1(V)=diag(W1(V),W2(V),…Wn(V))为n阶对角权矩阵。
证明过程如下:
由定理1,可知似然方程为:
上式可表示为矩阵形式:
其中,β(V)=(β0(V),β1(V),…βp(V)),其他表示同上。
假定对于任意点V∈D,矩阵XTW1(V)X的逆矩阵均存在,则在给定点V处的参数估计值可表示为:β^(V)={XTW1(V)X}-1XTW1(V)Y。
特别地,若对一切的1≤i≤n及任意点V∈D,设定W1(V)=1,那么(6)式就变为:XTY=XTXβ。
此即我们熟知的一般线性回归模型的正则方程。
1、Gauss局部权系统
如前所述,对任意给定点V∈D,第i个权值W1(V);(i=1,2,…,n)反映了第i组观测xi=(xi1,xi2,…,xip)T及Yi对估计点V处的参数βk(V);(k=0,1,…,p)的重要性。一般来说,距给定点V∈D较近的观测数据对V点处的参数估计影响应该较大,而相距较远的观测数据对给定点V处的参数估计影响应该较小,甚至为零。而在变系数广义线性模型中,观测值xi=(xi1,xi2,…,xip)T以及x=(x1,x2,…,xp)T所对应的D中的点Vi和V之间的距离以d(Vi,V)来度量。因此,对于较小的d(Vi,V)所对应的观测点,我们赋予较大的权值,反之,对于较大的d(Vi,V)所对应的观测点,则赋予较小的权值。
下面采用Gauss局部权系统:
在给定点V∈D处,以d(Vi,V)的Gauss函数为该点的权,即:
其中λ>0称为光滑参数。当λ→0时,只有在观测点V∈D处,观测值xi权才为1,其他各观测点的权值均趋于零。当λ→∞,对于一切i=1,2,…,n均有Wi(V)→1,这时,参数β(V)的局部加权最大似然估计即是通常的最大似然估计。
2、局部权系统中光滑参数的确定
光滑参数的确定问题是非参数回归中所研究的一个重要课题,针对不同的光滑方法,已经有各种各样的光滑参数确定方法。在此,我们将利用交叉证实方法(cross-validation)来确定前面所给的局部权系统中的光滑参数λ的值。
由前面可知,在每一给定点V处有观测值Yi
本文主要解决了如下问题。
第一,实证表明,资产定价模型中,证券期望收益与系数β值之间未必存在严格的线性关系,针对这种情形,提出了可变系数回归模型替代原先的一般线性回归模型来估计系数β,该模型放松了线性的假定,使模型更适应实际数据的变化规律。
第二,利用局部加权最小二乘估计方法对可变系数回归模型中的系数进行估计。
第三,研究了模型中的局部权系统以及其中光滑参数的决定问题。
从理论角度考虑,该模型由于系数的可变性,使得估计结果更加适应实际数据变化规律,从而估计结果更为精确,该方法也为资产定价研究、风险管理和监督提供了较为有用的数理工具。但由于我国的实际情况,对于复杂数理模型的应用尚缺乏一定的条件,主要是缺乏好的金融数据,大部分金融机构都没有能够保留良好的横截面数据和时间序列数据,这给实证也带来了不小的麻烦。后续的研究中,我们将克服这些困难,着重于该模型在实际中的检验。
(注:本文受上海市教育委员会科研创新项目(09YZ409)、上海教育委员会重点学科建设项目(J51601)资助。)
[1]Angelini,E.,Tollo,G.D.,Roli,A.:A neural network approach for credit risk evaluation[J].The Quarterly Review of Economics and Finance,2008,48(4).
[2]Black,F.,M.C.Jensen and M.Scholes:The Capital asset pricing model:Some empirical tests,In:M.C.Jensen,ed.,Studies in the theory of capital markets[M].Praeger,New York 1972.
[3]Cox.D.R.:Regression models and life-tables(with discussion)[J].J.R.Statist.Soc.B.,1972(34).
[4]Fama,E.F.and J.D.Macbeth:Risk,return and Equilibrium:Empirical tests[J].Journal of Political Economy,1973(81).
[5]Fama,E.F.and French,K.R.:The cross section of expected stock returns[J].The journal of Finance,1992,June(2).
[6]Fan.J.and Gijbels,I.:Data-driven bandwidth selection in local ploynomial fitting:variale bandwidth and spatial adaptation[J].J. R.Statist.Soc.B.,1995(57).
[7]Jorgensen,B.:Maximum likelihood estimation and largesample inference for generalized linear and nonlinear models[J]. Biometrika,1983(70).
[8]Ong,C.-S.,Huang,J.-J.,Tzeng,G.-H.:Building credit scoring modelsusing genetic programming [J].ExpertSystemswith Applications,2005(29).
[9]West.M.,Harrison.P.J.,Bayesian forcasting and dynamic models [M].Springer,New York,1989.
[10]Tibshirani.R.and Hastie.T.:Local likelihood estimation[J].J. Am.Statist.Ass.,1987(82).
[11]陈浪南、屈文洲:资本资产定价模型的实证研究[J].经济研究,2000(4).
[12]花俊洲、梅长林、吴冲锋:变系数广义线性模型及其估计[J].系统科学与数学,2004,24(1).
(责任编辑:李文斐)
book=1,ebook=67