满百举,刘霞辉,2,孙怡龙
(1.中国社会科学院大学经济学院,北京 102488;2.中国社会科学院经济研究所,北京 100836;3.山东社会科学院国际经济与政治研究所,济南 250002)
相比于传统的代表性代理人框架,异质性代理人框架有着更为丰富的理论结果和实践优势[1]。首先,由丰富微观数据所驱动的异质性使得宏观经济学模型能够更加贴合现实经济行为。Ahn等(2018)[2]考察了工人技术水平的异质性,发现负向冲击将造成低技能劳动者的更大损失。其次,在讨论政策效应的时候,以代表性经济主体为核心分析对象的同质性模型只能给出平均意义上的政策效应。而政策制定者往往最关心政策在各阶层个体之间的分配效应,对此同质性模型似乎无能为力。Auclert(2019)[3]研究了异质性框架下财政政策的传导机制对社会消费的影响。除了代表性模型下的收入和替代效应外,他还指出在居民之间存在异质性的条件下,货币政策将会通过收入异质性、未预期通胀异质性以及利率暴露渠道重新分配社会财富,影响社会总消费。最后,宏观的总体行为都是微观主体博弈结果的加总,因此微观上的异质性也会导致宏观结果异于传统理论。有学者指出,个人、家庭以及企业的异质性会通过个人信贷约束、异质性的货币传导渠道等方式影响总需求,从而加重危机并延缓经济复苏的脚步。因此,宏观异质性代理人模型是理解现代宏观经济系统动态变化的核心框架。
此外,宏观异质性代理人模型的应用范围也逐步扩展到财政问题以及货币问题的研究之中。Huntley 和Michelangeli(2014)[4]扩展了具有特异性收入冲击和借贷约束的生命周期理论,发现异质性居民在经历短暂的收入冲击后,居民对于税收抵扣的边际消费倾向显著高于代表性模型中的结果。Kaplan 和Violante(2014)[5]构建了双资产结构经济学模型,证明了在存在收入异质性的情况下,将会有大量经济主体成为“hand-to-mouth”类型的消费者,即拥有大量非流动性资产但却几乎没有流动性资产的个体。与Huntley 和Michelangeli(2014)[4]的结论类似,这些消费者对于财政抵扣将会有非常大的边际消费倾向。
目前,虽然具有丰富异质性的宏观经济模型越来越普遍,但其在应用过程中仍然存在诸多问题。一方面,到目前为止,异质性模型的应用大多停留在计算和模拟层面;另一方面,对于异质性模型来说,计算上的复杂和困难是一大障碍,对于异质性模型的求解需要强大的算力支撑。例如,异质性主体的随机增长模型会导致时变的代理人资本分布,使得基于资本分布的价格变成随机变量,从而极大增加了个人随机优化问题的求解难度。
Bewley(1986)[6]、Imrohorolu(1989)[7]、Aiyagar(i1994)[8]以及Hugget(t1993)[9]是早期将异质性因素加入宏观模型的代表。Bewley(1986)[6]在研究货币均衡问题时,构建了交换经济异质性模型的基础框架。Imrohorolu(1989)[7]将异质性风险引入分析,比较了具有特异性风险的完全保险市场与具有信贷约束的非完全保险市场。文章定义了不变分布的含义,即对未来无穷期分布预测的极限。值得注意的是,文章中对于具有借贷约束的模型采用了值函数迭代算法进行求解;而对于没有借贷约束的情形,值函数迭代算法的效率较低,因此可采用蒙特卡洛(Monte Carlo)模拟法进行求解。
Aiyagari(1994)[8]较早将个人未保险的特异性劳动冲击引入随机增长模型中,发现预防性储蓄和预算约束仅能解释总体储蓄率上升的很小部分。它能够很好地解释财富和收入不平等的上升,因此逐渐成为研究收入和财富不平等问题的基础框架。Hopenhayn(1992)[10]将异质性生产率冲击加入企业决策过程中,考察了市场中企业进入和退出的动态调整过程。然而,该文没有使用数值解法进行求解。相反,它使用比较静态分析研究了模型的稳态行为。Huggett(1993)[9]构建了纯交换异质性不完全市场经济,发现异质性环境下的无风险利率比相应代表性模型中的无风险利率还要低。除了理论上的贡献,该文还提出了求解异质性模型的值函数迭代算法,为异质性模型的求解提供了基础方法。至此,特异性冲击就成为异质性模型建模的必要组件。
另一篇开创性文章是Krusell和Smith(1998)[11]的研究。除了考虑个人所面临的特异性冲击外,文章还将总体的劳动生产率冲击引入异质性模型,使得模型设定更加符合实际。更重要的是,它提出了“近似聚合(Approximate Aggregation)”的概念,即总体变量的演化规律仅由截面分布的均值决定,其分布并不影响总体状态变量的演化动态。但需要注意的是,这并不能说明异质性毫无意义。相反,个人面临的特异性风险对于理解均衡中的平均消费和储蓄至关重要,风险的存在增加了储蓄,从而使得总消费减少了约2%。
不完全市场环境是异质性代理人模型的基础设定及逻辑起点。如果市场是完全的,即市场中存在可以保障家庭免受风险冲击的状态依赖保险,那么异质性模型的结果就等价于同质性模型。只有家庭面临的异质性冲击无法被保险市场完全保障时,异质性代理人模型才有讨论的价值。
基础的不完全市场异质性代理人模型的基本设定如下:模型为纯交换模型,家庭的最优化问题是标准的无穷期贴现效用问题,它从消费流中获得效用,并具有固定的贴现率0 <β<1。家庭的瞬时效用函数为严格凹函数,严格递增并且二阶可微。特异性的收入或者劳动冲击导致家庭的总收入是满足特定条件的随机过程,Huggett(1993)[9]假设其劳动或收入是两状态马尔可夫链。市场中仅有一种固定回报为R的无风险资产a,且缺乏状态依赖证券来保障代理人免除收入风险。因此,代理人只能通过储蓄无风险资产a来进行自我保险,并以此来平滑消费。代理人的决策问题是在期初决定消费ct以及储蓄at。
后续文献对基础模型进行了多个方面的扩展。从模型设定上讲,Aiyagari(1994)[8]将新古典生产函数引入模型,使得异质性模型扩展到生产经济。在该经济中,唯一的资产a不仅具有储蓄价值,也是生产性资本。因此,模型中资本回报率的决定方式就从固定利率假设变为了债券市场的供求均衡条件。从模型框架上看,Imrohorolu(1989)[7]、Huggett(1993)[9]、Rios-Rull(1995)[12]将生命周期引入异质性框架,使得模型能够更加准确地刻画由人口年龄结构变动带来的经济动态变化。在此基础上,异质性OLG模型逐渐成为研究社会保障问题的基础框架之一。
对于异质性模型解的存在性和唯一性问题,Miao(2006)[13]通过压缩映射定理证明具有总体冲击的Bewley模型存在序贯均衡,并且这种均衡可以通过递归形式表示。这为异质性模型的数值解法奠定了理论基础。此外,也有文章证明了在不完全市场条件下一大类异质性模型均衡的存在性。事实上,在冲击幅度较小时,局部均衡不仅存在,而且唯一。
相比于代表性代理人模型,异质性代理人模型的求解更为复杂和困难。首先,同质性模型只需要求解联系上下期状态变量和控制变量的政策函数,而异质性模型需要求解更为复杂的函数关系。举例来说,由于经济主体的异质性,描述整体经济状态的变量也就从包含消费、资本等变量的有限维向量变为了描述状态分布和随机性冲击的无限维对象,因此解的形式也就从向量函数转变为表征从当期分布到下期分布的泛函映射。借用Algan等(2014)[14]的符号,该泛函为从t期的分布Ft和冲击ht到t+1 期分布Ft+1的映射Γ:Ft+1=Γ(ht+1,ht,Ft)。其次,大量的特异性冲击导致模型表现出非常严重的非线性特征。最后,借贷约束的存在造成政策函数不可微,使得传统的求解算法失效。
由于模型的高度非线性,即使是最简单的异质性模型也几乎不存在解析解,因此求解模型的工作重点是开发高效稳健的数值算法。从目前来看,求解异质性模型的数值算法总体上可以分为扰动法、投影法以及混合方法。
扰动法的核心思想是在稳态处进行泰勒展开,从而将均衡条件转化为线性系统进而使用已有工具求解。扰动法有以下几个特点:首先,它可以对财富分布的演化进行分析表征,并保证求解出的政策函数达到预先选择的近似阶数。其次,扰动法具有普遍适用性。其他数值解法仅适用于冲击为低维马尔可夫过程的情形,但是扰动法对于随机性的来源和形式没有过多限制。最后,它还可以求解高维随机变量的情况,甚至连续型随机变量。但值得注意的是,扰动法是求解异质性模型的局部算法,而且传统的扰动法依赖于值函数和政策函数的连续性及可微性,因此不能解决带有约束限制的问题。
使用扰动法求解异质性模型的例子有很多。Preston和Roca(2007)[15]使用二阶扰动法求解了带有特异性收入风险的异质性模型,认为个人的最优储蓄决策几乎是其资本存量的线性函数,因此其结论支持了永久收入理论。不仅如此,这还为“近似聚合(Approximate Aggregation)”理论提供了证据。与此类似,Kim 等(2010)[16]将边界约束转换为惩罚函数,将代表性经济的解作为总体变量的演化方程,从而将扰动法拓展到带有边界约束以及连续个体的情形,并提高了扰动法的计算效率。然而,根据总结,该算法的精确度较低,即使增加格点数目,误差也不会有太大改进。
投影法的基本思想是通过已知函数(基函数)来近似模型中的非线性政策函数或者值函数。投影法的求解逻辑分两步。第一步是将状态变量空间离散化,并且定义拟合函数在每个格点上的误差计算规则。第二步是在给定损失函数的情况下寻找最优的拟合系数。Haan(1997)[17]使用光滑的指数函数作为基函数,从而将分布函数以及总体变量的运动定律转变为有限维系数向量,再通过非线性方程的求解算法计算模型稳态。Algan等(2014)[14]在其基础上,使用参数化分布方法优化了总体状态变量的更新过程,从而优化了拟合系数的求解过程。Den Haan 和Rendahl(2010)[18]则通过显性聚合的方式直接积分个人的政策函数,从而得到总体变量的演化方程。这种方法避免了参数化过程的求解,提高了投影法的计算效率。相比于扰动法,投影法能够获得系统在全局下的最优解,因此是全局优化算法,但是为此也要做出计算复杂度上的牺牲。
越来越多的文献综合了扰动法和投影法的优点,使用混合方法来求解模型。Krusell和Smith(1998)[11]将投影法和模拟技术(简称KS算法)结合起来求解模型。对于个人的最优化决策行为,他使用标准的投影法进行求解,然后使用数值模拟程序回归得出总体变量的运动定律。通过有限理性设定,他猜想资本运动动态符合对数线性形式,即下期的均衡总资本仅仅是当期总资本均值(对数形式)的线性函数,从而以分布均值来代替无限维分布本身。KS算法对于非近似聚合模型的求解精度较差,但是它确实提供了一种全局求解算法。在此基础上,后续文章或修改了总体变量运动定律的模拟方法,或使用简单的多项式规则来构造资本格点,使得算法对于非线性问题的求解更加准确。
Reiter(2009)[19]将投影法和扰动法结合起来求解Bewley模型。他先使用投影法求解出具有特异性冲击但是没有总体冲击的稳态均衡,再对模型在无总体冲击均衡附近使用扰动法将其展开为线性系统,这种思想为后续异质性模型的求解提供了新的思路。更进一步,使用系统和控制论中的降维工具降低了状态向量和政策向量的维度,使扰动法的适用范围扩展到状态依赖定价的异质性企业模型以及高维状态变量问题。Winberry(2015)[20]使用双变量对数正态分布作为基函数,将状态变量的联合分布投影到基函数空间中,从而将无穷维对象转换为五维参数向量,并使用矩匹配方法完成分布参数向量的更新,之后再通过现有的Dynare 软件包来实现三阶扰动计算。在求解最优Ramsey 政策规则时,部分文献使用截断函数法逐步近似无总体冲击的异质性模型稳态,再通过Dynare实现在稳态解处的扰动。
对于代表性模型的求解,现有算法可以根据需要做到任意精确度的计算,但这对异质性模型的求解并不成立。事实上,对于算法精确度的评估也存在不同的方法。第一种是直接利用欧拉方程来计算格点上的最大欧拉方程残差。第二种是考察格点增加前后计算结果的差异。如果格点增加前后的结果相差不大,那么可以认为计算结果是精确和有效的。同样地,也可以通过扩大格点范围或者选取不同的拟合函数来测试算法的稳健性。
在异质性模型中,总体变量的运动规律至关重要,因此可以通过考察总体变量运动规律的准确性来定义算法的稳健性。 Krusell 和Smith(1998)[11]对计算出的总体变量运动规律进行回归,将总体变量(总资本)回归的可决系数R2以及回归标准误σ̂u作为算法的精确度指标。但Den Haan 等(2010)[21]指出,即使回归结果的可决系数R2超过0.9999,数值结果依然可能是不准确的。他提出的算法评估方式的基本步骤是:(1)生成资本序列以及初始分布Γ0;(2)由求解所得的个人政策函数生成横截面数据,并计算总资本;(3)根据方程=α1+α2at+α3以及初始资本序列生成总资本序列;(4)计算序列和的最大差值。
Den Haan(2010)[22]从计算时间、个人的政策函数、总资本计算精确度等指标层面全面比较了不同的扰动法和投影法以及Krusell 和Smith(1998)[11]的算法、Reiter(2009)[19]的算法等混合算法的性能。虽然没有任何一种算法在每个指标上的表现都是最好的,但在精确度指标上,Reiter(2009)[19]、Den Haan和Rendahl(2010)[18]的算法表现最为稳定,他们的整体表现也最为优异。
2.1.1 基本模型设定
(1)最优化问题假设存在连续的无穷个体,相应的资产和收入分别为a和y。个人效用遵循标准的期望贴现效用假设,其未来的期望贴现效用为:
其中,ct≥0 表示每一期的消费水平,ρ≥0 是时间贴现率,效用函数u严格单调递增且为严格凹函数。
Huggett(1993)[9]假设个人的收入yt服从外生的两状态泊松过程,即yt∈{y1,y2},y2>y1。两个状态的密度分别为λ1和λ2,即该过程由状态1 转移到状态2的概率为λ1,相应地,从状态2转移到状态1 的概率是λ2。因此,其状态转移矩阵为:
在实际校准过程中,收入的两种状态分别对应失业和就业,因此λ1和λ2分别表示失业者的工作获得率和就业者失去工作的概率。个人财富的表现形式是固定供给的非生产性债券a。在给定收入和利率rt的情况下,个人的资产动态为:
而在Aiyagari(1994)[8]经济中,个人的收入yt由工资wt和特异性生产率zt组成,即yt=wtzt。此外,设定个人资产存在一个借贷约束-∞<-a≤0,则:
综上所述,个人的优化问题是在给定资产动态(见式(3))和借贷约束(见式(4))的条件下,最优化个人的未来期望贴现效用(见式(1)):
由于时间上的连续性,因此经济体的状态必须使用概率密度函数来刻画。本文使用gj(a,t),j=1,2 来表示当收入为yj以及财富为a时的联合分布的概率密度函数。另外,记Gj(a,t),j=1,2 为相对应的累积分布函数。因此,该经济的状态变量就是资产和收入的联合分布gj(a,t),j=1,2。
(2)价格。在Huggett(1993)[9]模型中,个人只积累外生给定的非生产性债券。在该经济系统中,利率rt是唯一的价格变量,它的值由债券的供给平衡确定:
其中,0 ≤B<+∞表示债券总量,B=0 意味着债券的净供给为0。
而在Aiyagari(1994)[8]的研究中,个人的财富表现为其所拥有的生产性资本a,代表性企业使用该资本并雇佣劳动力进行生产,总资本即为全体成员的资本之和。代表性企业的生产函数具有常规模报酬,并且要素市场是竞争性的。因此,相应的均衡条件为:
其中,r和w分别为稳态(zt=zˉ=1)时的工资和利率,δ表示资本折旧率。
(3)效用函数设定为严格单调递增以及严格凹的函数。一般均选取常相对风险规避效用函数(CRRA),即:
2.1.2 稳态均衡
Aiyagari-Bewley-Huggett模型的稳态均衡形式为:
对于j=1,2,有:
其中,j+k=3,sj(a)=yj+r-cj(a),cj(a)=(u')-1v'j(a)。因此,sj(a)和cj(a)分别表示j类型个体的储蓄和消费政策函数。
值得注意的是,Achdou 等(2022)[23]指出,在连续时间模型中,借贷约束(见式(4))在状态空间内部都将以等式的形式出现,并且在边界约束处的形式可以转变为状态边界条件,j=1,2。此外,均衡中的利率或者工资率由债券供求平衡条件式(6)或者式(7)来确定。
2.1.3 转移动态
除了定义上述稳态均衡之外,还可以定义相应的转移动态。这一转移动态表示经济体由初始稳态向最终稳态演进的过程。模型的转移动态可以表示为下述时间依赖的偏微分方程组:
其中,∂x f表示函数f对于x的偏导数,公式中其他符号的含义和稳态均衡中相应符号的含义相同。当然,相应的状态约束边界条件也就转变为:
此外,状态变量的分布函数gj满足相应的初始条件gj(a,0)=gj,0(a)。而相应的值函数也满足一个终止条件,即vj(a,∞)=vj(a),其中,vj(a)为相应问题的稳态均衡值函数。
在理论方面,Achdou等(2022)[23]证明了当跨期替代弹性大于1时,连续时间异质性模型的稳态不仅存在而且唯一。文章对边际储蓄倾向做了解析刻画,并且证明代理人在经受长时期的低收入冲击后,将会在有限时间内到达预算约束。对于带有状态约束的HJB方程的解,部分文章指出其对应于偏微分方程中的粘性解概念,并且证明若使用惩罚函数法求解带有状态约束的HJB方程,当惩罚因子趋向于无穷时,HJB方程的解将会收敛到原方程的粘性解。
更为重要的是,Achdou 等(2022)[23]指出,任何不带有总体冲击的无限个体异质性代理人模型的解都可以归结为一个耦合的偏微分方程系统,其中,第一个方程是在给定状态变量概率密度函数演化规则下表征个体最优消费和储蓄规则的汉密尔顿-雅可比-贝尔曼(Hamilton-Jacobi-Bellman,HJB)方程,第二个是在给定个体最优储蓄行为时资产概率密度函数演化规则的柯尔莫哥洛夫前向方程(Kolmogorov Forward Equation,KFE)。这样的偏微分方程系统对应于“平均场博弈”系统(Mean Field Game,MFG),该系统中的HJB 方程和KFE 方程的微分算子是相互共轭的,并且总体冲击是系统的“共同噪声”(common noise)。
除解的存在性及求解理论外,Acemoglu 和Jensen(2015)[24]还指出,当个体受到正向冲击时,即使该冲击仅影响经济体中的部分主体,整个经济体的总体变量稳态均衡值也会变大。
求解离散时间异质性模型和连续时间异质性模型的算法既有联系又有区别。离散时间异质性模型的求解核心是近似状态变量分布,由此可区分为扰动法、投影法以及模拟法,而连续时间异质性模型的均衡条件可以划归为一组偏微分方程。有学者使用有限差分法来求解仅具有特异性冲击的连续时间异质性模型的均衡状态(见式(9))。该算法先将连续时间的偏微分方程进行离散化,再利用HJB 方程和KFE 方程离散转移矩阵互为转置的特点以及高效的矩阵迭代算法进行数值求解。有限差分法被证明是一种简单、有效且容易扩展的求解连续时间异质性模型的算法,并且被证明可一致地收敛到真实解。
在此基础上,类似于Reiter(2009)[19]的研究中使用的扰动法思想,Winberry(2015)[20]将异质性模型的求解分为两个阶段。他先使用有限差分法求解不带总体冲击的模型稳态,再利用高效的非线性矩阵方程微分算法求解在无总体冲击稳态附近的局部扰动。Ahn等(2018)[2]借助工程计算中的观测矩阵对扰动法做了整体降维,极大地提高了算法的计算效率。
除了传统的数值算法之外,迅猛发展的机器学习方法也被引入到连续时间异质性模型的求解中。相比于传统的求解方法,神经网络算法具有以下优势:第一,通用近似定理在理论上保证了神经网络算法的适用性,且该算法也适用于非凸函数或者不可微函数的求解;第二,神经网络系数的计算可以通过现有的梯度下降法或者后向传播法来进行有效估计;第三,神经网络算法对于高维问题的计算更加高效;第四,神经网络算法具有优秀的外推性质。
宏观理论的发展以及数据可得性的提高促进了宏观异质性模型的发展,宏观异质性模型的发展也从离散时间版本逐步发展为连续时间版本,连续时间的宏观异质性模型的均衡条件表述更为简洁。总体来看,相比于离散时间模型,连续时间模型拥有理论和计算上的优势。第一,连续时间模型可以轻松处理诸如预算约束、固定成本等非凸性问题以及值函数或政策函数不可微的情形。对于带有状态约束的异质性模型,离散事件模型求解过程中将会出现大量难以求解的不等式约束。而连续时间模型则将其转化为求解偏微分方程系统的边界条件[2,23],从而提高了运算效率。第二,由于连续时间模型中HJB方程和KFE方程的共轭性质,离散化后的转移矩阵互为转置,因此在求得任意一个方程的离散化形式后,几乎可以直接得到另一个方程的离散化形式。第三,在连续时间模型下可以得到预算约束处个人行为的定量描述,甚至是解析形式,可以更加清晰地了解模型性质,这在离散时间设定下很难做到。第四,由于连续时间的性质,因此离散化后的系数矩阵是稀疏矩阵。这在一定程度上解决了“维数诅咒”问题,扩大了连续时间模型的应用范围。第五,相比于离散时间模型中稳态均衡和转移动态需要使用不同算法进行求解的缺点,连续时间模型具有算法通用的特点。由于方程形式的近似性,因此只需要进行简单修改,稳态均衡的求解算法就能够运用到转移动态的求解中。
宏观异质性代理人模型具有深刻的理论和现实意义,能够更加细致地刻画现实经济运行的特征,将会成为宏观经济模型的重要组成部分。伴随着计算数学、动力系统等学科的发展,新的求解算法将不断涌现,其求解难度将逐步降低。从模型构造和求解逻辑上分析,在离散时间模型基础上发展起来的连续时间模型更为简洁和高效,其应用范围会愈加宽广。当然,本文对于异质性模型的梳理还仅限于特异性冲击的情形,对于具有总体冲击的情况,还需要另外讨论。