侯媛媛,王礼力
(西北农林科技大学 经济管理学院,陕西 杨凌 712100)
基于主成分分析基础上的中国蔬菜家庭消费预测
侯媛媛,王礼力
(西北农林科技大学 经济管理学院,陕西 杨凌 712100)
文章在对中国蔬菜家庭消费的现状进行论述后,通过主成分分析法分析影响中国蔬菜家庭消费的五个因素,再利用回归得出城镇和农村居民的不同家庭人均蔬菜消费量的模型。在此基础上,以城镇人口和农村人口为因变量,建立人口的时序模型。结合这两个模型对我国蔬菜的家庭消费量,以及全国蔬菜家庭消费市场总容量进行未来年份的预测,以期为中国蔬菜产业发展中的政策制定和战略调整提供依据。
主成分分析;蔬菜消费;预测
蔬菜的消费在中国人民的饮食中占有重要的地位。随生活水平的提高,我国城乡居民的食品消费结构也向着多元化、高档化方向发展。近年来,在消费结构变化的影响下,蔬菜人均消费从数量上看呈现出稳中有降的趋势,从而导致蔬菜总量消费增加开始平缓。然而,从上世纪90年代以来,特别是在1995年第二轮“菜篮子工程”的推动下,中国蔬菜产量增加迅速,蔬菜的生产供应,总量上已经完全能满足消费的需求,但消费需求的结构性变动是蔬菜的消费能力在城乡间、地域间、不同收入水平家庭之间、甚至不同季节间都存在着诸多的不平衡,作为第二大种植业的蔬菜,其消费需求能力倍受人们关注。
事实上,我国城镇居民和农村居民历年来的食物摄入结构可通过图1来看:
图1 中国城镇和农村居民人均的食物摄入结构
从图1可以看出我国居民人均的食品消费结构在这十几年中的变化情况。蔬菜在城镇居民的人均日常消费变化相对稳定,从1990年到2008年先是减少,后又有小幅度的增加,然后一直维持在117~123公斤的水平,因此城镇居民年人均蔬菜消费在总的食物消费中所站的比重呈小幅逐渐下降趋势,近年来基本维持在35%的水平。而农村居民由于生活水平的提高,也越来越注重营养的均衡,蛋奶肉的消费量增多,而原来作为主要摄入类型蔬菜和粮食则有所减少,农村居民人均蔬菜消费量由1990年134公斤,占总体食物摄入量的31.5%,下降到2008年的99.72公斤,占总体食物摄入量的27.8%。据世界粮农组织公布的数据,2005年美国日人均消费蔬菜量为334g,日本为347g,法国为398g,而我国仅为264.3g。这说明我国居民的新鲜蔬菜消费量与发达国家相比,还有很大的差距,与《中国居民平衡膳食宝塔》推荐的每天消费400~500g蔬菜相比也有很大的差距。
根据蔬菜消费的特点,本文主要选取了五个影响因素,分别是:居民的可支配收入、恩格尔系数、蔬菜的零售物价指数(以1985年为基准)、蔬菜价格指数相对于粮食的价格指数涨价幅度、蔬菜价格指数相对于肉禽的价格指数涨价幅度;后两个指标主要反映了蔬菜、粮食和肉禽每年的涨价幅度不同,对蔬菜消费的影响。确定了这些影响因素,分别利用1985~2008年的数据作城镇居民和农村居民的人居蔬菜消费分析。
在SPSS16.0软件中设置提取特征值大于0.6的因子,得出前两个主成分基本上就反映了原来所有的信息,第一主成分和第二主成分的方差贡献率分别为58.07%与31.73%,累计方差贡献率达到89.80%。
并根据分析结果中的旋转后的因子负荷矩阵,可以了解到,主成分Z1与城镇居民的收入和城镇蔬菜价格关系紧密;主成分Z2与城镇蔬菜价格涨幅相对于粮食和肉类价格涨幅情况关系紧密;恩格尔系数影响程度并不大。
设变量因素依次为 Y1、Y2、Y3、Y4和 Y5,得到如下主成分的表达式:
通过这些方程,得到1985~2008年的主成分Z1,Z2的值,根据这些数值,运用SPSS16.0软件,我们可以建立城镇居民的人均蔬菜消费量对两个主成分的回归方程:
把Z1和Z2的主成分得分代入主成分回归方程中,可以得到1985~2008年的预测值,通过与实际值之间的比较,平均误差为4.35%。因此该模型的回归精确度比较高。
同理,我们也能得到农村居民人均蔬菜消费量的影响因素主成分表达式:
由旋转后的因子负荷矩阵可知,主成分K1与农村居民的收入和农村蔬菜价格关系紧密;主成分K2与农村蔬菜价格涨幅相对于肉类价格涨幅情况和恩格尔系数关系紧密;K3与农村蔬菜价格涨幅相对于粮食类价格涨幅情况关系密切。
运用SPSS16.0软件,对上表的数据进行回归分析,得到V2主成分回归方程:
把K1、K2和K3的主成分得分代入主成分回归方程中,可以得到1985~2008年的预测值。估计值与实际值之间的误差并不大,平均误差为3.51%,因此该模型的回归精确度比较高。
我们通过建立城镇居民和农村居民的人均蔬菜消费模型,可以了解到人均蔬菜消费量的变化情况,在此基础上,要想了解全国的蔬菜家庭消费的市场容量,需要结合我国城镇和农村居民的人口变化情况。因此,全国城镇和农村居民蔬菜总消费量的模型为:
其中:Q总——蔬菜在国内市场的总需求量;
P1——城镇人口的数量;P2——农村人口的数量;
V1——城镇人均年蔬菜消费量;V2——农村人均年蔬菜消费量。
通过对人口数量进行预测,就能掌握国内蔬菜市场的总需求量。为了消除年份对于回归的影响,设定顺序T=1,2,3….n,代替年份作为自变量,而人口为应变量,建立时序模型。同样运用SPSS16.0软件对我国的城镇与农村人口进行回归分析,通过散点图的分布形状,设置二次曲线、复合曲线、三次曲线、增长曲线作为回归方程模型进行回归拟合,经过这几种回归模型的比较,发现二次曲线能更好的解释这些信息,模型拟合度好,显著性明显,因此:
城镇人后发展变化模型为:
其中:T=1,2,3……n;代表了:1985年,1986年……
而对于农村人口进行回归分析时,发现三次曲线能更好的解释农村人口变化的信息,拟合度也是三种回归方程模型中最和好,因此得出:
农村人口发展变化模型为:
其中:T=1,2,3……n;代表了:1985年,1986年……
通过以上的分析,我们得到了城镇居民和农村居民的人口变化时间趋势模型,用这个模型,预测2009~2020年之间城镇人口与农村人口的变化情况。再利用前面所列出的全国居民蔬菜总消费量公式,结合城镇、农村居民的人均蔬菜消费模型,可以得到全国未来年份的国内蔬菜市场需求量。其中,在确定城镇居民人均蔬菜消费量的模型中,主成分Z1根据散点图的分布,符合二次曲线和三次曲线的规律,通过进一步分析与比较,三次曲线的拟合度比较高;而城镇居民人均蔬菜消费量模型中的第二个主成分Z2,根据其散点图的特征,即数值在(-2,2)之间浮动,通过反复试验,最终确定正弦与余弦的时间序列之和函数模型符合主成分Z2的浮动变化规律。因此,主成分Z1和Z2的模型为:
其中:T=1,2,3……n;代表了年份。
对于农村居民人居蔬菜消费模型中的三个主成分的预测,同样,也是先根据这三个主成分的时间序列散点图,来确定它们的变化规律,从而得出它们的时间序列模型。根据观察和多次重复试验,确定主成分K1变化与二次曲线的拟合度很高;主成分K2的数值在(-2,2)之间浮动,符合正余弦函数模型;主成分K3的散点图变化没有规律,只能粗略运用三年移动平均法来预测。因此,主成分K1和K2的模型为:
其中:T=1,2,3……n;代表了:1985年,1986年……
由以上的公式,我们可以得到2009~2020年城镇居民和农村居民的人口数量预测值和全国蔬菜家庭直接消费的预测值。
以上分析可以说明以下问题:
(1)对于城镇居民而言,根据前面的主成分分析,人均收入和蔬菜价格是影响人均蔬菜消费的第一主成分,它的变化趋势符合三次曲线规律,从1985年到2020年是由先增大后减小的过程,转折点就在2008年。根据城镇居民人均蔬菜消费模型,说明在2008年之前,收入和蔬菜价格的变化对人均蔬菜消费量起到负影响的作用,而到2008年之后,由于人们饮食理念的变化,注重健康饮食和维生素的摄入,越来越多地城镇居民愿意购买有机或者无公害的高价蔬菜,因此收入和蔬菜价格的变化对蔬菜消费能起到一定积极作用。第二个主成分代表城镇蔬菜价格涨幅相对于粮食和肉类价格涨幅情况,它的变化忽高忽低,但总在一定范围内波动,呈现正余弦曲线趋势。当蔬菜涨价幅度大于粮食和肉类涨价幅度时,抑制人们对蔬菜的消费,反之,增加蔬菜的消费。但由于第二主成分的影响因子不是很大,因此,我国城镇居民的人均蔬菜消费量的变化主要取决于第一主成分的变化情况,自1985年就开始呈现下降趋势,由1985年的144.36公斤下降到2007年的117.8公斤,2008年为123.15公斤,之后缓慢回升,由2009年的112公斤的水平逐步升高,一直到2020年能达到城镇人均蔬菜消费为145.59公斤。
(2)对于农村居民而言,影响它的人均蔬菜消费量因素中,第一主成分依然代表可支配收入和蔬菜价格,它的变化趋势符合二次曲线规律,并在1985年到2020年之间一直保持上升趋势。根据农村居民人均蔬菜消费模型,收入和蔬菜价格的逐年变化减少了蔬菜消费的增加。第二主成分代表了农村蔬菜价格涨幅相对于肉类价格涨幅情况和恩格尔系数。它的变化情况符合正余弦函数的图形,在(-2,2)呈现不规则浮动。说明蔬菜价格涨幅相对于肉禽价格涨幅,表现为有范围的高低波动,当农村蔬菜价格的涨幅超过肉禽类价格的涨幅情况时,农村居民会相应的增加肉禽类食物的摄入,而减少蔬菜的消费;反之,增加蔬菜的消费。而恩格尔系数的变化说明农村居民的食物消费占总消费金额的变化,促使了农村居民对其他类物品的消费,而减少了蔬菜的消费。第三个主成分代表了农村蔬菜价格涨幅相对于粮食类价格涨幅情况,但它的变化非常没有规律,根据农村居民的蔬菜消费模型,说明相对于其他类的食物,粮食作为农村居民的主要食品,它的价格涨幅情况对蔬菜消费的影响很小。根据这些影响因素的变化,农村居民人均蔬菜消费自2009年开始,在98公斤的基础上呈小幅度波动,2015年到2020年之间有所回升,但幅度不大,在101公斤上下浮动。
(3)通过对人口的回归预测,城镇人口自2009年开始逐年增加,由2009年的65013.29万人,增加到2020年的97230.79万人;而农村人口逐年减少,从2009年的69992.49万人,减少到2020年的61261.91万人。根据前面对于人均蔬菜消费的预测,预计在从2009年到2020年,城镇居民的蔬菜消费总量将大幅度增加,而农村居民的蔬菜消费总量将逐年减少,2020年,城镇居民的蔬菜消费量为14156.19万吨,是农村居民蔬菜消费量6324.20万吨的2倍多,2020年全国家庭蔬菜消费总量将达到20480.39万吨。由此可以看出,未来10年,全国蔬菜的消费主要由城镇居民带动,除了上面分析到的影响人均蔬菜消费的因素之外,与我国城镇化密切相关。城镇化促使我国城镇人口的大幅增加,城镇化对蔬菜消费量的影响是多方面的,城镇居民受教育的程度高于农村居民,人均纯收入也较高,因此他们更注重生活的质量,并且由于城镇经济发达、交通便利,能够及时的获得蔬菜的供给,而农村居民由于交通不便利,除了自给部分蔬菜外,只能通过集市来补充所需要的蔬菜,加上很多蔬菜不耐贮藏,在一定程度上也限制了农村居民对蔬菜的需求。
(4)通过以上分析,我们了解到2020年之前,我国国内蔬菜家庭消费的市场容量情况,更多地蔬菜消费动力来自于城镇居民,而影响人均蔬菜消费的因素中,城镇居民收入的增加在2008年之后会带动蔬菜消费的增加;而蔬菜价格的合理上涨,也不会对蔬菜消费造成阻碍作用。要保持蔬菜的价格涨幅与粮食和肉禽价格涨幅的协调,只有在有限空间内的蔬菜价格上涨才能促进城镇蔬菜消费的增加,而过快的价格上涨,只会妨碍我国蔬菜产业的健康发展。
[1]崔朝辉,周琴等.中国居民蔬菜、水果消费现状分析[J].2008.
[2]FAOSTAT.Retrieved on 18th Aug[EB/OL].http://faostat.fao.org/site/346/default.aspx,2007.
[3]中国营养学会.中国居民膳食指南及平衡膳食宝塔[J].营养学报,1998,20(4).
[4]吴亚非,李科.基于SPSS的主成分分析法在评价体系中[J].当代经济,2009,(2).
(责任编辑/浩 天)
F063.2
A
1002-6487(2010)23-0091-03
侯媛媛(1980-),女,陕西汉中人,博士研究生,研究方向:投资经济与项目管理。