基于多种模型组合的我国2015年人口总数预测

2009-02-25 09:59王勇胜薛继亮
关键词:权重

王勇胜 薛继亮

摘 要: 首先建立了线性回归模型、曲线拟合模型、指数函数模型、时间序列模型、灰色系统模型5个单一模型,就2001-2004年的人口数分别对这5个模型的预测结果进行了比较;然后考虑将这5种模型用5种组合方法组成新的组合模型来预测人口总数;最后对我国2005-2015年的人口总数进行了预测,预测结果为我国2015年人口总数为14.30亿。

关键词:人口预测;组合预测;权重

中图分类号:C921.2 文献标识码:A 文章编号:1009-9107(2009)01-0075-05

一、引言

人口问题是一个世界各国普遍关注的问题。人作为一种资源,主要体现在人既是生产者,又是消费者。作为生产者,人能够发挥其主观能动性,加速科技进步,促进社会经济的发展;作为消费者,面对有限的自然资源,人在发展的同时却又不得不考虑人口数量的问题。因为影响一个国家或地区的人口数量的不仅仅是一个自然再生过程,它还涉及到这个国家或地区的经济增长、环境资源的承载力等因素。

一个国家或地区的人口规模直接影响着其经济的发展、政治结构的稳定、社会的进步和资源的利用。中国是世界人口第一大国,人口问题始终是影响我国可持续发展的核心因素。由于我国20世纪五六十年代在人口政策方面的失误,不仅造成人口总数增长过快,而且年龄结构也不合理。因此,要在保证人口有限增长的前提下适当控制人口老龄化水平,把年龄结构调整到合适的区间,是一项长期而又艰巨的任务。用建立数学模型的方法对人口发展的过程进行描述、分析和预测,进而研究和控制人口增长和人口老龄化的政策、策略,早已引起各方面的极大关注,并成为系统科学、经济科学和人口科学研究中重要的应用交叉研究领域。

最早的人口预测模型可以追溯到英国人口学家马尔萨斯。马尔萨斯根据百余年的人口统计数据资料,于1798年提出了著名的人口指数增长模型。后来,人们通过对马氏模型的修正,又提出了阻滞增长模型(logistic模型),该模型在一定的时期内也取得了比较令人满意的结果。指数增长模型和阻滞增长模型都是确定性的,只考虑人口总数变化的连续时间。后来,人们又发展出了随机性模型,如考虑人口年龄分布的模型等。

人口预测作为经济、社会研究的一种方法,应用越来越广泛,也越来越受到人们的重视。在描绘未来小康社会的蓝图时,首先要考虑的是未来中国的人口数量、结构、分布、劳动力、负担系数等等,而这又必须通过人口预测来一一显示。人口预测研究是国家制定未来人口发展目标和生育政策等有关人口政策的基础,对于国民经济计划的制定和社会战略目标的决策具有重要参考价值。一般的人口预测统计学模型预测精度都难以保证。

二、人口预测模型的建立

(一)原始数据

下面分析几种典型的人口预测方法,根据《2005中国统计年鉴》,原始数据如表1所示。[1]

(二)模型建立

通过对原始数据的分析,建立如下几种典型的人口预测模型。

1.线性回归模型。人口发展过程线上任一点的切线斜率基本保持不变,即各时期人口发展速度较一致,近似直线状延伸时可采用一元线性回归法。这里将时间作为控制变量,将人口数量作为状态变量,确定它们之间的数学模型Y=a+bt,控制时间来预测人口数量。[2]应用最小二乘法得到线性回归模型为:

Y=9.541133+0.1368503t

其中检验结果为:R2=0.91,F=75.091

2.曲线拟合模型。曲线拟合法通过对历史数据的规律进行研究,选择最能描述观察数据的规律的曲线作为预测模型。优点是能较好地反映资料的变化趋势,短期预测准确性较高。对历年的人口资料进行拟合,结果表明二次曲线效果较好。设模型为Y=a+bt+ct2。根据原始数据得到:

Y=9.332511+0.1800133t-0.001541537t2

其中检验结果为:R2=0.91,F=75.110

3.指数函数模型。人口发展过程线并不都是近似于直线状。有些地区的人口前一段时期内发展较慢,越往后发展速度越快。比如很多城市人口发展过程就属于此类,这种情况下应选用指数函数模型Y=aebx。[3]应用原始数据可得到指数模型为:

Y=9.631313643e0.012081t

其中检验结果为:R2=0.926,F=117.096

4.时间序列模型。影响未来人口数量变化的因素很多,但可归纳成两个主要方面:第一,与目前人口的数量和构成有直接的关系;第二,受经济社会发展水平和人口政策的影响。经典的时间序列模型主要考虑第一个方面的影响,即从探讨人口发展的历史规律出发来预测未来人口的发展趋势。应用较多的时间序列模型有自回归模型(AR),移动平均模型(MA),自回归移动平均模型(ARIMA)等。人口数量在时间上的变化,具有当前变化受前期数量状况的影响的特殊性质。因此可以用自回归模型Yt=a+bY璽-1来预测其继后期的数量。应用最小二乘法得到时间序列模型为:

Y璽=0.3377029+0.981812Y璽-1

(0.928) (8.531)

5.灰色系统法。全世界或一个国家的人口发展具有较明显的规律性,但对于某个地区来讲并不一定可用线性或简单非线性曲线来显示。此类无规律可寻或资料不全的情况下可以用灰色系统GM(1,1)来进行预测,模型形式为X(t+1)=(X(1)-U/A*e-At+U/A。[4]代入原始数据得:

Y=18.6174942008-8.9915942008e-0.01813121962t

在设定阈值5%的情况下,满足预测的精度要求,最大相对误差都小于5%。

(三)预测结果的比较分析

利用上述所建立的人口预测模型,可以求出我国2001-2004年人口总数的预测值,结果见表2。

由以上分析所得数据可知,就2001-2004年这4年来说,5种预测模型都得到了与实际值十分相近的结论。尤其是二次曲线模型和自回归模型,它们的相对误差的绝对值不超过0.6%。而灰色系统模型也不错,其相对误差不超过1%。指数函数模型相对误差相对其他模型有点大,但也在可接受的范围之内。所以,以上5种模型都是可取的。

由于各种模型都具各自的特点,在预测的不同时期,均表现出了各自的优劣。不能冒然地断定某一模型是最好的。模型的选择必须根据一定的条件,注意每一模型的时效性。模型的应用带有一定的局限性,在实际操作中是比较难以把握的。不妨采取权重组合预测模型来弥补单一模型的缺陷。

三、预测的组合数学模型

对全国人口数进行预测时,假设有n个模型都通过了统计检验,在通过了有关合理性检验准则(如经济含义检验准则)后,可选出r个满意的模型。为简化问题,只考虑在某时点上的组合预测方法。[5]

现根据以上的讨论及全国2001-2004年最后预测结果来探讨不同方法的组合预测模型。

(一)算术平均法

用上述5种方法对5个不同模型所得的预测点进行修正选取,可得新的综合预测值。

组合预测模型较单一的预测模型更具稳健性,更具有可靠性。表3的结果很好地证明了这一点。几乎每种组合方法都取得了比较精确的预测值,并使预测误差控制在可接受的范围内。但总的来说,二项式系数法效果最为满意。下面应用该模型对我国2005-2015年的人口数进行预测,从而找出我国人口变化的趋势。先用五个单一模型进行预测,再利用二项系数法修正预测结果,最终预测值见表4。

四、讨论

人口问题是一个世界各国普遍关注的问题,人口状况是一个国家或地区的重要国情。为了实现人口与经济、社会、资源、环境的协调发展,控制人口具有极为重要的意义。为了实现人口控制目标,确保国家可持续发展战略的顺利实施,中国政府必须继续努力稳定目前每对夫妇平均生育1.8个孩子的低生育水平。[6]同时,努力采取措施,不断提高人口素质。国家计划生育委员会2002年12月在泰国曼谷召开的第五届亚太人口会议上发表的国家报告提出:2010年末,中国人口总数(不含香港、澳门特别行政区和台湾省)将控制在14亿以内。从表4中我们可以看出,线性回归模型和指数模型所算数据在2010年却超过了14亿,但其他三种单一模型的数据在14亿之内,而用二项系数法修正的5种单一模型预测值也比较理想。

参考文献:

[1]国家统计局.中国统计年鉴[M].北京:中国统计出版社,2006.

[2] 范柏乃,刘超英.中国人口总量预测模型新探[J].中国人口科学,2003(6):73-76.

[3] 方先明,白先春,魏秋萍.江苏省人口发展趋势分析[J].统计与决策,2003(3):59-60.

[4] 王泽昊,潘虹. 灰色系统模型在我国人口预测中的应用[J].统计与决策,2005(1):31.

[5] 侯建中,张福林. 用最优加权组合法预测深圳市人口发展趋势[J]. 数理医药学杂志,1998(11):203-205.

[6] 闫文周.小康社会统计与评价指标研究[J].统计与决策,2005(7):28-29.

猜你喜欢
权重
权重涨个股跌 持有白马蓝筹
主成分分析在高职公共基础课影响度中的应用研究
改进食堂的最优决策方法
基于中证800股市行业优劣模型的研究
基于AHP浅析煤炭价格影响因素
企业退休金收支平衡的模型分析
各省舆情热度榜
各省舆情热度榜
基于粗糙集的海夕卜石油勘探风险评价指标权重确定