Richards模型与Logistic模型在人口预测中的比较*

2017-03-14 03:22谭祥勇
关键词:平方和回归方程残差

刘 锋, 何 卓**, 谭祥勇

(1.重庆理工大学 数学与统计学院, 重庆 400054;2.上海财经大学 统计与管理学院, 上海 200433)

Richards模型与Logistic模型在人口预测中的比较*

刘 锋1, 何 卓1**, 谭祥勇2

(1.重庆理工大学 数学与统计学院, 重庆 400054;2.上海财经大学 统计与管理学院, 上海 200433)

Logistic模型是常用的人口预测模型,在Logistic模型的基础上再添加一个参数,得到一个含有4个参数的非线性s型增长模型,即Richards模型;分别通过Logistic模型和Richards模型对1985—2014年的中国人口进行了预测,建立了人口预测模型;通过与实际人口相比,结果表明,Richards模型比Logistic模型拟合效果更好。

Logistic模型;Richards模型;人口预测;非线性

人口预测是制定和顺利实施社会经济各项战略设想的基础和出发点,所以精确的人口预测非常重要。预测人口的方法很多,如自然增长率[1]、年龄移除算法[2]、S型种群增长数学模型法[3]等。前两种方法受到人口政策、社会经济发展水平、文化教育和医疗卫生的影响,所以预测结果与实际往往有一定的差距。S型种群增长数学模型主要用来描述在环境资源受到限制的情况下,生物种群的增长规律。

在生物、医药、经济等领域中,常有因变量随自变量呈现S型或反S型曲线变化趋势,称具有这种趋势的数学模型为S型种群增长模型。常见的S型曲线有Logistic,Gompertz,Richards等。本文采用S型种群增长模型法中的Richards模型和Logistic模型来预测中国人口数量。

1 理论基础

1.1 Logistic模型理论基础

Logistic曲线模型方程如下:

(1)

y(t)表示t时刻种群的数量,γ是种群的相对增长率(即出生率减去死亡率),β为初始值参数,N为环境能容纳最大种群数量。

此模型含有3个未知参数,通过曲线直线化[4]可以得到参数值,但是这样的值并不是很好,把曲线直线化得到参数值设为初始值,再运用最小二乘法[5]得到最优参数估计值。

对式(1)进行变换,可得:

(2)

对式(2)等号两边进行自然对数变换,则有

(3)

z=β-γx

(4)

由上述计算部分可知,确定合适的N值后,即可对Logistic曲线方程进行一定的变换,使其转化为直线回归方程(4)。N是环境最大容纳量,设N=200,得到β(直线回归方程的截距值)和γ(直线回归方程的斜率值的相反数)的值,这样就得到了N,β和γ的初始值;然后借助R编程软件,用非线性最小二乘法得到拟合曲线模型。

1.2Richards模型理论基础

Richards曲线模型的方程如下:

(5)

y(t)表示t时刻种群的数量,γ是种群的相对增长率(即出生率减去死亡率),β为初始值参数,N为环境能容纳的种群的最大数量,δ为曲线形状参数,当δ=1时, 式(5)即为Logistic曲线模型。所以Logistic曲线模型可视为Richards曲线模型的一个特殊情况。

此模型含有4个参数,参数的估计同理Logistic模型。

对式(5)进行变换,可得:

(6)

对式(6)进行自然对数变换,可得:

(7)

z=β-γx

(8)

由上述计算部分可知,确定合适的N和δ值后,即可对Richards曲线方程进行一定的变换,使其转换为直线回归方程。参数δ依据不同的实际数据可能有不同的取值,无法简单地得出其确切值。此时可考虑确定δ的取值范围,借助R软件,得到拟合效果最优的曲线模型。

2 模型的应用

在国家统计年鉴上获得我国历年人口基本数据。数据选取于1985—2014年,选择这30年相应的人口数据为观测数据:y1=105.851,y2=107.507,…,y30=136.782 ,人口单位是千万。令1985年起始年为1,1986年为2,依次类推。

2.1Logistic模型的应用

通过曲线直线化,得到参数的初始值,N=200β=-0.160 573 4,γ=0.021 932 6;再利用非线性最小二乘法得到最优参数值,即β=-0.156 696 9,γ=0.022 213 2;则中国人口Logistic模型增长预测公式为

(9)

利用此公式可估算中国1985—2014年的人口数量,结果见表1。

表1 基于Logistic模型中国1985—2014年人口预测对比

此模型的残差平方和为61.088 300 73.

2.2 Richards模型的应用

通过曲线直线化,得到参数的初始值,N=200,β=-0.961 35,δ=0.522 49;再利用非线性最小二乘法得到最优参数值,即β= -0.970 75,γ= 0.019 973,δ=0.518 35;则中国人口Richards模型增长预测公式为

(10)

利用此公式可估算中国1985—2014年的人口数量,结果见表2。此模型的残差平方和为55.974 046 77。

表2 基于Richards模型的中国1985—2014年人口预测对比

3 结 论

残差平方和表示的是实际值与模型拟合值之间差值的平方和。残差平方和越小,说明实际值与模型拟合值之间的差异越小,模型更具代表性。根据两模型对中国1985—2014年的人口预测可以看出,Richards模型的残差平方和55.974 046 77比Logistic模型的残差平方和61.088 300 73要小,说明Richards模型比Logistic模型拟合效果要好,更适合用来预测中国人口。

利用Richards模型分别对我国2020、2030、2050年人口数量进行预测,结果见表3。

表3 Richards模型对中国未来人口预测

[1] 胡秋灵,姚文辉,李红霞.基于Box-Jenkins建模法的人口自然增长率预测模型[J].统计与决策,2007(3):4-6

HU Q L,YAO W H,LI H X.Prediction Model of Population Natural Growth Rate Based on Box-Jenkins Modeling Method[J].Statistics and Decision,2007(3):4-6

[2] 宋新华,张国彬.用年龄移算法预测通州市2010年老年人口状况[J].交通医学,2000(5):467-469

SONG X H,ZHANG G B.Using Age Shift Algorithm to Predict the Status of the Elderly Population in Tongzhou City in 2010[J].Medical Journal of Communications,2000(5):467-469

[3] 高辉.几类常用非线性回归分析中最优模型的构建与SAS智能化实现[D].北京:中国人民解放军军事医学科学院,2012

GAO H.The Construction of the Optimal Model and the Realization of SAS in Several Kinds of Nonlinear Regression Analysis[D].Beijing:The Chinese Military Medical Science Academy of the PLA,2012

[4] 谢兰,高东红.非线性回归方法的应用与比较[J].数学的实践与认识,2009(10):117-121

XIE L,GAO D H.Application and Comparison of Nonlinear Regression Method[J].Practice and Understanding of Mathematics,2009(10):117-121

[5] 贾小勇,徐传胜,白欣.最小二乘法的创立及其思想方法[J].西北大学学报(自然科学版),2006(3):507-511

JIA X Y,XU C S,BAI X.The Establishment of the Least Square Method and Its Thought Method [J].Journal of Northwestern University (Natural Science Edition),2006(3):507-511

责任编辑:李翠薇

Comparison of Richards Model and Logistic Model in Population Prediction

LIU Feng1, HE Zhuo1, TAN Xiang-yong2

(1.School of Mathematics and Statistics, Chongqing University of Technology, Chongqing 400054, China; 2. School of Statistics and Management, Shanghai University of Finance and Economics, Shanghai 200433, China)

Logistic model is a commonly used population prediction model, and a nonlinear s-type growth model containing four parameters, Richards model, is obtained by adding a parameter to Logistic model. Chinese population during 1985—2014 is predicted by Logistic model and Richards model respectively, and the population prediction model is constructed. By comparing with the real population, the results show that Richards model is better than Logistic model in fitting effect.

Logistic model; Richards model; population prediction; nonlinearity

10.16055/j.issn.1672-058X.2017.0000.002

2016-09-11;

2016-10-30.

国家自然科学基金(11471060).

刘锋(1973-),男,湖南新化人,副教授,博士,从事非参数统计研究.

** 通讯作者:何卓(1991-),女,四川遂宁人,硕士研究生,从事非参数统计研究.E-mail:984624328@qq.com.

O212

A

1672-058X(2017)01-0006-01

猜你喜欢
平方和回归方程残差
基于双向GRU与残差拟合的车辆跟驰建模
采用直线回归方程预测桑瘿蚊防治适期
线性回归方程的求解与应用
线性回归方程要点导学
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
走进回归分析,让回归方程不再是你高考的绊脚石
费马—欧拉两平方和定理
利用平方和方法证明不等式赛题
勾股定理的扩展