林 林,Thomas Lux,李培杰
(1. 德国基尔大学计量经济系世界经济研究中心宁职院校企合作办,德国 基乐 24106;2. 德国基尔大学计量经济系世界经济研究中心,德国基乐 24106;3. 清华大学机械工程系,北京 100084)
关于“第一性原理”的讨论在过去的一段时间讨论十分火热,马云、徐小平、罗振宇等众多创业大咖都学起了物理,让“第一性原理思维方式”瞬间成为了创业热词。徐小平说:“学物理,就是把认知框架放在这个知识领域的最远端,让人们有机会重新假设人们的生存环境”,强调用物理学的方式思考问题,抛弃已有的全部成见,一层层地拨开表象,直接从事物的本质进行思考。本文首先从“第一性原理”浅谈“第一性原理思维方式”之根本,再谈用物理的方法看待经济问题,即经济物理学的发展,最后引出一个以物理视角构建的“产业经济模型”仿真。套用徐小平的说法:
人们用物理学的方式来模拟最原始的人类,就是要把人们放在人类经济发展的最远端,让人们有机会重新假设人们的分工、交换与协作。
“第一性原理”是量子力学术语,物理学解释是:采用近似方法求解薛定谔方程,在无任何经验参数条件下计算物质的各种性质。通俗地讲,就是从头算,只采用最基本的事实,不需要任何参数,只需要一些基本的物理常量,然后根据事实推论,得到体系的基本性质的原理。英文称之为“First Principle”。
把“第一性原理”的思维方式带向热议的是商业奇才埃隆·马斯克(Elon Musk),他曾经是全球最大的网上支付公司PayPal的创始人,主导了特斯拉、SpaceX航天运载、太阳城能源等轰动行业的项目,如今又成立了“神经织网”,研究人类思维向计算机的输入。当人们惊叹马斯克创业的跨界与成功时,也捧出了“第一性原理思维方式”。
用“第一性原理”来思考事物或现象的本质,至少有以下几个特点:
1)“第一性原理”强调用少量的基本数据进行分析。强调事实和少量假设,从问题的本质出发,并将问题简单化。比如爱因斯坦相对论的基础就是对宇宙本性的两个简单假设。
2)用“第一性原理”思考,而不是类比。类比(Analogy)是一种重要的逻辑思维和推理方法,是人们解决陌生问题的常用策略。但是多数人考虑问题时会局限于类比思维,当人们从类比出发时,事物会随着现实的不可测而变得越来越复杂;同样,当人们从一个模型出发时的迭代类比会增加不确定性,极易把一个模型的复杂程度增加到难以度测。
3)“第一性原理”的思维方式强调实践验证。运用原有定律和推理是科学的重要工具,但真理往往掌握在动手做实验或实践的人手中。17世纪,研究科学的人都信奉亚里士多德和他的论断:两个铁球从高处落下来,重的先着地,但25岁的伽利略不相信,在比萨斜塔上做了一个著名的实验,结论是两个铁球同时落地。
科学家们发现,从物理学的这种最“原始”的视角出发,可以简化和仿真很多复杂的自然或生命现象,由此诞生了基于物理学的一系列交叉学科:生物物理学(Biophysics)、天体物理学(Astrophysics)、经济物理学(Econophysics)、信息物理学(Cyberphysics)等。这些交叉学科的诞生无一不是出自“第一性原理”的思维方式和贯彻了它的基本特点。
让人们用一个简单的产业经济模型(Social Production Model,以下简称SP模型)来解释一下从物理学视角下的产业经济(或社会)发展,这个模型在文献[3,4]的框架下构建,具备“第一性原理”的以下三个特征:
1)从数据出发,用物理学中个体(粒子)运动来模拟产业演进中人与人之间的联系;
2)条件充分简单化,没有附加的假设条件,和复杂运算;
3)以实验为基础、以实践为验证。
中国老一辈粒子物理、理论物理学家何祚庥院士2014年在《理论经济物理学》中提出新物理学应该力求研究经济社会的复杂现象,他还归纳了马克思主义政治经济学的逻辑框架,号召年轻一代的物理学家们构造一个能够整理、分析、处理“大数据”,能讨论各个不同经济部门经济发展不平衡的动力学的经济统计模型,指出“这可能是未来理论物理学最重要的研究”,SP模型即是这样一个尝试。
现代社会的本质是“围绕生产的一系列简单关系”(relation of production),包含了生产、销售和消费。在一个发达的(假设是封闭的)的产业或社会中,这个关系可以简化为如下的生产关系:
少量的资本家(雇主)雇佣了多数的工人,他们在不同规模的工厂(公司)里工作,为社会提供产品(或服务),通过市场销售,雇主获得了利润,工人获得了劳动工资(利润的一部分),并都在市场上进行消费。见图1。
图1 产业链和现金流呈相反方向循环
图1展示了简化了的现代社会生产关系全貌,内圈的产业链和外圈的资金流始终呈相反方向运动。每一个劳动力(Labor)均来自于一个家庭(Household),他们把劳动提供给工厂(Firms)换来工资,工厂把劳动的成果(Products)在市场上销售,获得的利润用来发工资,在市场上家庭或劳动力用他们获得的工资去购买商品,利润再次回到资本家手中用来雇佣新的劳动力、发出工资或其他投资…… 周而复始。
从传统经济学角度来看,如何用公式(模型)来表述产业链中的“雇佣”、“生产”和“消费”关系是一个大难题,但运用“第一性原理”的思维方式就可以进行简化:图1的生产流程可以看成一个简单的(劳动力)输入和(产品)输出的过程,因为劳动力和产品是两种不同事物,在数量和质量上很难进行比较,不妨再简化一下这个系统,即把劳动力价值和产品都用货币(钱)来表示,这样就把一个原本复杂的产业经济模型简化成为了一个“循环资金流”模型,即雇佣、生产和消费的过程被等同为在工厂、工人和市场间的资金流过程。当然,模型里的“资金”在不同的地方有不同的定义,比如在工人手中它是“工资”,在雇主手中它是“收益”,在市场上它是“消费”,在形式上它还可以是实体资产、虚拟资产(存款、股票等)、具体商品或服务,等等。此外,因为资金和商品总是服从等价交换的原则,在模型中把现实中具体的“卖东西”的行为表述成“赚钱”,“消费”意味着在市场中“花钱”,“雇佣”意味着支付“工资”,以此类推。
SP模型用伪代码(pseudo code)描述并由计算机仿真,模型由一系列规则组成,每一个规则都含有一个条件和给定条件的执行动作。仿真开始以后,系统会依次执行各规则,并把每个个体(agent)的当时状态和执行动作循环记录在存储器中。
假设该产业中有N个参与的个体,在初始状态,人人平等,每人拥有相同数量的货币m(coins),且都处于未受雇佣(unemployed)的状态(假设个体等同于家庭、每个工厂只有一个雇主);存在一个初始状态的市场(市值为V)可用于商品交换,此时,整个社会的资金流是所有个体手中货币值和市场值的总和:∑Nmi(t)+V。
个体在发展中有三种可能的状态:成为雇主E(Employer)、工人W(Worker)或者失业者U(Unemployed)。个体的实时状态由内存记录Si(t)={mi(t),ei(t)},前者给出了个体i拥有的货币mi(t),后者是他在t时刻的雇佣状态:如果ei(t)=0,那么i没有被雇佣,如果ei(t)=j,则雇主j雇佣了i。系统从当前状态到下一个状态的演进S(t)→S(t+1)遵循以下几个规则:
1)雇佣
①随机选择个体a,如果a的状态未被雇佣(他可能已经是雇主E,或是即将成为雇主的待业者U),a的可能雇佣者的集合为H=E∪U;
②a的潜在雇主c的概率可由潜在雇主的现有资金来衡量:P(c)=mc/∑x∈Hmx;
③给定一个最低和最高工资(w1、w2均为外生变量),社会平均工资为最高和最低工资平均值w*=(w1+w2)/2,当雇主c的资产多于平均工资时(mc>w*),c雇佣a。
2)收益
若a不是失业者U,他可能是雇主E或者工人W,他们为工厂工作,把产品在市场上销售换来收益m∈[0,V]。若a是工人,则把m收益交给雇主,若a是雇主,m收益留给自己。
3)解雇
若a是雇主,他可能在现有的工人集合Wa中(根据均匀分布)随机选择u个人解雇,以保证工厂的工人数量控制在他可以支付工资的工人数量内:u=max(Wa-[ma/w*],0)。
4)支付工资
若a是雇主,他需要为自己的工人集合Wa中的每位工人支付月工资,该工资随机抽取于最低工资w1和最高工资w2之间。当支付到最后,雇主没有能力开出随机抽取的工资时,则重新选择工资w∈[w1,ma](ma为a的自有资金),如果雇主剩下自有资金比最低工资还少,即ma 5)消费 无论a是什么雇佣状态,他都需要消费,消费金额为随机量m∈[0,ma],完成消费后,个体a的钱减少m,市场价值V增加m。 以上就是5个依次执行的模型规则,每轮循环规则依次运行N次以保证所有的市场参与者都会随机执行程序,每12轮循环记做1年,每年工厂收益被记为年度产值(加总为GDP)。系统中有4个可调整的外生变量(经检验它们的赋值对整体仿真结果影响不大),可以假定一个简单的初始值,分别是: 1)个体数量N=1000; 2)系统初始资本量M=100000;(这样每个个体在初始状态拥有的资金量为ma=100) 3) 最低与最高工资[w1,w2]=[10,90]; 4)初始市场价值V=100。(保证最初交易的进行) 最后假设该模拟的产业运行100年(Year=100)。 SP模型从“第一性原理”的视角用计算机来模拟了基本的经济社会生产关系,简单的模型却可以对产业经济中的普遍现象做出惊人相似度的仿真。 以下仅以产业阶层的形成、公司规模分布、收入分配不合理和贫富差距等仿真结果进行简要说明。 计算法则:每个月,计算雇主数量、工人数量和失业者数量。 从图2可知,尽管在初始状态下所有人都处于未雇佣状态,在仿真次月,社会阶层即开始迅速两级分化,在很短的时间(约12个月)里,各自所属的社会阶层的数量的时间序列都迅速聚拢,围绕着某个中间值上下波动,在柱状图上呈现高斯分布。图2中约有18.1%的人成为雇主,80.6%的人成为工人,另外有1.3%的失业人群。 图2 雇主、工人及失业者的柱状分布图注:图2 (a)(b)(c)依次为雇主、工人及失业者的柱状分布图,实线为高斯拟合;(d)(e)(f)依次为上下对应的时间序列(年份=100年,共1200月,1200000次规则执行)。 或许由于一定的敏感性,现实生活中关于现代经济中产业阶层的统计数据并不多,但毋庸置疑的是,阶层的分布基本遵从马克思主义经济学的基本描述:少部分的资本家雇佣占人口绝大多数的工人。SP模型还原了这一事实。此外,模型还证明了传统经济学中的供需平衡、市场均衡(Market Equilibrium)状态(供给=需求,完全就业)根本无法实现,经济总会围绕着可能的“均衡点”上下波动,而正是由于不能实现的均衡状态,完全就业(零失业率)是不可能实现的:一定程度的“摩擦失业”将长期存在。 在封闭经济体内,不考虑其它的外因,SP模型仿真的失业率逼近现实。历史数据显示,2007年新加坡的失业率下降到1.6%,降到了摩擦失业率的较低水平。图3显示了美国过去60年的失业率,尽管失业率呈现周期波动,但平均失业率偏差并不大,1954年3%的失业率几乎是美国失业率的最低点,这个失业率可以近似为美国的“摩擦失业率”,包含了等待就业和重新就业的未雇佣人群,这个指标也可以看做政府控制失业率的一个目标。 图3 模型外的真实世界:美国失业率(1950-2010)注:(1950-2010),Data from the U.S. Bureau of Labor Statistics: Labor Force Statistics from the Current Population Survey. www.bis.gov 计算法则:每个月,计算每家公司的工人数量。(当公司有1个雇佣工人时公司成立,当工人都被解雇后,公司倒闭)如上例,最初的数据处于迅速收敛的不稳定状态,因此本数据截选了仿真第10年到第100年的公司规模);右图为对左图公司规模分布的对数正态(Lognormal)曲线拟合。 模拟公司规模数据显示,大部分的公司都是小公司:平均雇佣工人数为5,中位数为4,最小规模为1(占总数量的27%);公司规模越大,数量越少,系统记录的最大规模公司用人数为101(对应时刻市场上有850个受雇佣工人,该公司雇佣人数占比11.8%)。这一系列数据和现实大体相同:小规模公司(个体工商户)是经济的主体,大公司占比较少。文献[5]以1997年的美国公司举例,最大规模的公司拥有近106的工人数,而美国全体在职工人的数量为107,说明当时美国最大规模的公司雇佣了近10%的在职工人。图4右图显示公司规模分布可以用对数正态高度拟合(OLS回归:Rsq=99.9%,Radj-sq=99.8%),这个公司规模呈现对数正态分布的特点也在文献[6,7,8] 等人的实证数据分析中提及或验证。 图4 左图为每家公司的规模(工人数)的月度柱状图 计算法则:每年(12个月)计算每人的年收入。工人的收入是工人获得的工资,雇主的收入是一年中获得的收益总和。 收入分配不平等(Income Inequality)在过去一个世纪是毫无疑问的热议话题之一。自1897年帕累托[10]第一个指出收入分布的不均衡和提出帕累托指数,已经过去了100多年。这期间关于收入的分布大约集中为以下几种观点:(1)Zipf分布,参见文献[11];(2)对数正态(Lognormal)分布,参见文献[12、13],但是在高与低收入末端情况拟合不佳;(3)幂法则(Power-law)分布,参见文献[14、15], 但在低收入的分布末端使用了极端数据切割;(4)指数 (Boltzmann-Gibbs)分布,参见文献[16、17];(5)二段式分布:即从低收入人群的指数法则分布到高收入人群的幂法则分布,参见文献[18-20]。 以上研究有一个共同点:学者们使用的数据对象和年份均有很大的不同,有的使用了统计上的工资数据,有的使用了第三方公布的收入数据,并或多或少使用了数据截取、年份或考察时间段截取,使横向的比较模型的正确性变得十分困难。那么,有没有一种可能:产业中阶层的差异很大,从而不同阶层的收入差别也很大,因而产业链中全体参与者的收入分布不可能用同一种分布来拟合? 图5中文献[9]还原了中国和美国在20世纪最后30年1970、1980、1990和2000的收入分布。显然,三个国家的收入分布都在向右平移,证明经济的发展使人们的收入不断提高;中国在1970年的收入差距(阶层差距)还不太明显(呈现钟状高斯分布),但是20世纪70年代末开始收入分布的方差增长非常快,说明富人收入的增速明显高于社会低层次的一般收入者,并加速了收入差距,体现了比美国都要明显的社会阶层差异化;此外,收入分布还明显呈现出双峰(Bimodal)、甚至三峰(Trimodal)的形态,说明社会高收入、中等收入和低收入人群的收入状况差异明显、差距不断增大。 图5 中国、美国收入分布图[9] 图6中,虚线为单峰高斯模型f(x)~N(62.8,133.92),(Rsq=0.72),虚点线为双峰高斯分布,f(x)~N(9.2,30.12)+N(125,138.42),(Rsq=0.98),实线为三峰高斯f(x)~N(7.9,27.72)+N(54.9,182)+N(131.1,137.52),(Rsq=0.99,RMSE=6.1)。 图6 雇主收入分布图(正方形为雇主柱状图) 在SP模型的模拟中,单峰(Unimodal)的高斯分布无法还原整个社会收入分布的全貌,而双峰要比单峰得到的拟合精确得多。图6展示了SP模型模拟的雇主收入,可以看出雇主收入呈现明显的双峰高斯分布,甚至可以用三峰高斯分布来拟合。由此可见,社会收入的不平等呈现明显的“阶层”特点或“等级制”,模型的验证再一次与产业经济发展现状相吻合。 传统经济学用线性方程组和参数估计来模拟产业和经济运作,不乐观的是,复杂的社会关系,诸如“分工、交换与协作”、“雇佣、生产与消费”等都很难用简单的(线性或非线性)公式来表达,更别提主体之间互相影响,使得他们之间的各种社会决策后果的复杂程度呈指数级增加,如果想尝试用一系列的恒等式来表述这一系统,这个系统会变得无限复杂和难以运算。 在应用经济学研究中,能用一个简单建模解释一系列经济现象的情况极为罕见,上文介绍的产业经济SP模型是一个突破性的尝试。这个遵从于“第一性原理”,并能用计算机仿真的简单物理模型的可拓展性极强,并可以将身边所能看到的几乎所有经济社会的运行规律进行验证:比如热议的“公司动态”(涉及公司规模、公司成长速度、进入和退出、公司寿命、公司利润等)、“经济周期”(涉及GDP、GDP的波动、GDP与公司数量、GDP与小公司的进入和大公司的退出关系等)、“消费与投资”(工资消费占比)、“收入不平等”(贫富差距,财富再分配的方式,工资和收益占GDP的比重等),不一而足,将在接下来的研究中进一步整理。4 模型内仿真与模型外现实
4.1 仿真1:产业阶层和永恒的失业率
4.2 仿真2:公司规模分布
4.3 仿真3:贫富差距的产生
5 结语