郝 乐,吴 頔
(1.辽宁大学 国际关系学院,辽宁 沈阳 110036;2.沈阳大学 经济学院,辽宁 沈阳 110041;3.平安银行股份有限公司 沈阳分行,辽宁 沈阳 110001)
线性回归组合预测模型
——以中国人口老龄化预测为例
郝乐1,2,吴頔3
(1.辽宁大学 国际关系学院,辽宁 沈阳110036;2.沈阳大学 经济学院,辽宁 沈阳110041;3.平安银行股份有限公司 沈阳分行,辽宁 沈阳110001)
摘要:利用不同时期的数据分段建立线性回归模型,然后依照误差最小的原则将其组合成精度更高的线性回归组合预测模型。并以中国人口老龄化预测为例,说明了该预测模型的应用。
关键词:线性回归;组合;预测模型;老龄化
预测模型种类很多,主要有线性回归模型、指数模型、幂函数模型、灰色系统GM(1,1)模型、Logistic模型等等[1-4],各种模型都有其自身的特点和适用的范围,在进行预测之前,对于模型的选择是很关键的。要构建一个科学的预测模型并不是一件十分容易的事,因为预测模型是否科学,一方面取决于预测结果是否准确,另一方面取决于模型本身是否简单。然而,这两方面却是矛盾的,模型简单,预测结果就不会太准确;而预测结果相对准确,模型就不会太简单。线性回归模型是最基本的一种预测模型,随着数据信息的更新,采用信息分段建模,将几个线性回归模型组合后进行预测,精度会更高。
一、一元线性回归模型
设自变量x与变量y对应的观测值见表1。
表1 自变量x与变量y对应的观测值
如果变量间存在着线性关系,则可用直线
来拟合它们之间的变化关系。由最小二乘法,a,b应使
二、一元线性回归组合模型
构建预测模型时,随着时间的推移和条件的变化,不同时期的数据信息的作用是不同的,近期的数据信息显然比远期的数据信息显得更有价值,一元组合线性回归模型的思想就是:逐次舍弃前面一定数量的历史数据,分别建立m个一元线性回归模型,再将m个模型按误差最小的原则进行组合。构建组合线性回归模型的基本方法是:
(3)舍弃最前面的N2组数据,对剩余的n-
⋮
(m)舍弃最前面的Nm-1组数据,对剩余的n-Nm-1组数据,作一元线性回归模型:
所以
[k1,…,km]T令K=[k1,…,km]
则R=K·E·KT,令U=[1,…,1]T,于是问题变为在约束条件K·U=1之下,求R=K·E·KT的最小值。
设F=K·E·KT+λ(KU-1)两边对K求导有
三、中国人口老龄化预测
作为线性回归组合模型的应用,根据国家统计局官方网站(http:∥www.stats.gov.cn/)提供的2001—2012年全国65岁以上人口的统计数椐见表2.表2~表8中x代表年份、y代表人口数,人口数单位(万人)。对我国未来几年65岁以上人口的变化情况进行预测:
表2 2001—2012年全国65岁以上人口的统计数椐 万人
表3 2001—2012年12组数据对应的一元线性回归模型所产生的误差
表4 2004—2012年9组数据对应的一元线性回归模型所产生的误差
表5 2007—2012年6组数据对应的一元线性回归模型所产生的误差
(4)三个线性回归模型对应2007—2012年6组(n-(m-1)N=6)。数据拟合产生的误差见表6。
表6 三个线性回归模型对应2007—2012年6组数据拟合产生的误差
计算得:
于是得到组合线性模型:
组合回归模型对应2007—2012年数据产生的误差见表7。
依此对我国2013—2020年65岁以上人口的预测值见表8.
表7 组合回归模型对应2007—2012年数据产生的误差
表8 组合回归模型对我国2013—2020年65岁以上人口的预测值
四、结语
参考文献:
[1] 黄明知,罗荣桂,吴兵,等.区域最优人口规模测评模型研究[J].武汉理工大学学报,2004,26(8):93-95.
[2] 周南,左玉辉,柏益尧,等.生态城市规划中人口预测——以昆山市生态城市规划为例[J].环境科学与技术,2005,28(2):61-63.
[3] 易亮.基于MATLAB的人口预测方法分析[J].价值工程,2012,28(3):226-227.
[4] 李菲.基于两种模型的河南省人口预测及对策研究[J].开封大学学报,2012,26(1):77-80.
[5] 叶中行.概率论与数理统计[M].北京:北京大学出版社,2010:402-407.
【责任编辑肖景魁】
Linear Regression Combination Forecasting Model:Taking China’s Ageing Population Forecast as an Example
Hao Le1,2,Wu Di3
(1.College of International Relations,Liaoning University,Shenyang 110036,China;2.School of Economics,Shenyang University,Shenyang 110041,China;3.Shenyang Branch,Ping An Bank Co.,Ltd.,Shenyang 110001,China)
Abstract:Piecewise linear regression model is established by using data in different periods,and linear regression combination forecasting model with higher precision is combined according to the principle of minimum error.China’s ageing population forecast is taken as an example to illustrate the application of the forecasting model.
Key words:linear regression;combination;prediction model;aging
收稿日期:2015-08-03
基金项目:辽宁省社会科学基金资助项目(L13CJY052)。
作者简介:郝乐(1984-),女,辽宁沈阳人,沈阳大学讲师,辽宁大学博士研究生。
文章编号:2095-5464(2016)03-0290-04
中图分类号:N 945.15
文献标志码:A