网络搜索数据与消费者信心指数自回归模型研究

2015-10-13 06:01贾培佩张文良
合作经济与科技 2015年18期
关键词:信心消费者模型

□文/贾培佩 张 泰 张文良

(1.河北金融学院;2.河北软件职业技术学院河北·保定)

网络搜索数据与消费者信心指数自回归模型研究

□文/贾培佩1张泰2张文良1

(1.河北金融学院;2.河北软件职业技术学院河北·保定)

[提要]本文建立网络搜索数据与消费者信心指数自回归时间序列模型,对消费者信心指数进行分析,发现网络搜索数据和消费者信心指数之间存在显著相关性。

网络搜索数据;消费者信心指数;相关性

收录日期:2015年8月19日

随着互联网科技的发展,以及我国固定网络和移动网络的迅速普及,人们获取信息的方式正在由传统渠道向信息化渠道发展。本文主要对网络搜索数据和消费者信心指数之间的相关性进行了探讨。关键词初选是整个研究的第一歩,搜索引擎的推荐、Googlecorrelate关键词挖掘工具、SEO关键字挖掘和ICTCLAS汉语分词系统是确定初选网络搜索词的四个重要方法,然后基于关键词搜索量的相对值与消费者信心指数的实际变化的相关性强弱,来确定最终用于研究的关键词,同时还可以在运用时差相关分析法确定相关性大小的过程中,发现其不同关键词的领先或滞后阶数。最后,将关键词搜索指数与消费者信心指数进行相关性分析。

一、建立自回归模型

(一)关键词初选。网络搜索数据反映的是在某段时期,该关键词的被关注度和搜索热度。消费者信心指数同比数据来自于我国国家统计局官方网站数据库的统计数据。两种数据选取的时段是从2009年11月到2013年6月。

本文根据消费者信心指数的编制结构,选定了经济发展形势、家庭收入和就业、物价水平、消费或购买意愿等构成和影响因素,选择了“GDP”、“就业率”、“货币供应量”、“黄金”和“二手房”等比较原始的网络搜索关键词。除了百度搜索风云榜等比较简单的关键词挖掘方法对与消费者信心比较相关的领域进行了初步的关键词搜集外,还运用了数据挖掘工具Correlate、SEO关键字挖掘工具及ICTCLAS(汉语词法分析系统),使得关键词的选取工作更加的有章可循。通过上述的操作,得到1,500多个与初始关键词相关的词,之后对关键词做了进一步的搜集和整理工作。剔除重复的关键词后,在谷歌趋势搜索字词栏中逐一进行输入,如“公积金买房”、“柴油价格”、“上证指数”、“理财产品”、“居民消费价格指数”等,最终得到有搜索量并且各个月份数字相对比较完整的关键词约600个。为了使最终的结果更具科学性和客观性,需要把从谷歌趋势中下载下来的网络搜索关键词数据进行如下数据预处理:

1、由于关键词数据是以周为单位的,而消费者信心指数国家统计局是按月公布的,因此为了更好地确定两者之间存在的相关关系就有必要把网络搜索关键词的周数据合并转换成以月度量化的月度数据。

2、为了解决季节变动要素和不规则要素往往掩盖经济发展中客观变化给研究所带来的问题,消除其短期波动,需要对关键词进行平滑处理,对网络搜索关键词,数据进行三期的移动平均,从而达到突出各网络搜索数据长期变化规律的效果。

3、由于消费者信心指数的数据是同比数据,而网络搜索关键词数据并不是同比数据,因此为了更准确地去发现两者之间的相关关系,需要与消费者信心指数的数据保持一致,有必要将平滑之后的网络搜索关键词数据转换成同比数据。

(二)关键词评价。根据消费者信心指数的构成和影响因素,利用百度等搜索引擎的关键词推荐工具,以及SEO长尾关键词挖掘工具,对网络搜索的原始关键字词进行了挖掘和筛选过滤,保留下来大约600个与消费者信心指数相关的网络搜索初始关键词。为了比较系统的评价网络搜索关键词搜索量的变化情况与消费者信心指数之间的关系,对网络搜索关键词的评价主要从网络搜索关键词的领先性和相关性角度为衡量指标。

文章中采用了时差相关分析法分别计算各个初选网络搜索关键词的领先阶数和相关性。时差相关分析具体表达式为:

式中,p为某一网络搜索关键词相对与消费者信心指数的领先阶数,rp表示当时差为p的两个变量之间的相关系数,x表示网络搜索关键词搜索热度的月度变化率,y表示消费者信心指数,而这个最大值即为关键词与消费者信心指数两者之间的相关系数。

本文在关键词评价过程中,符合要求的关键词其p值必须大于0。同时为网络搜索数据与消费者信心指数的相关系数设定一个临界值标准(本文中的临界值为0.5),对于小于这一标准的网络搜索关键词,不予考虑,进行剔除处理。

(三)搜索指数合成与检验。表1从消费者预期和消费者满意两方面列出部分网络搜索关键词的皮尔森相关指数。(表1)

表1 

图1 拟合效果图

(四)消费者信心指数自回归模型。本文选择消费者信心指数(Y)为被解释变量,消费者预期搜索指数(X1)和消费者满意搜索指数(X2)为解释变量,建立时间序列模型,为了确定各个研究变量是否平稳,采用ADF检验法,检验结果为所有变量在5%的置信水平都已平稳。接下来建立自回归模型:

采用Engle和Granger的两步协整关系检验法来检验其长期趋势。结果显示,残差项具有稳定性,因此网络搜索指数与消费者信心指数之间具有长期稳定的协整关系。并且自回归方程(1)拟合效果是最优的,拟合方程见(2)、(3)式。该模型量化了网络搜索数据与消费者信心指数之间的关系,表明消费者信心指数的变化是由消费者未来生活预期的变化和消费者对现有生活满意情况的变化以及历史的消费者信心水平来共同决定。

模型当中,解释变量X1t-2和X2t-1代表的是消费者通过网络搜索相关内容对消费者信心指数刻画的贡献,从宏观和微观两个层面,以消费者预期和消费者满意为代表,反映了在网络生活中,消费者预期和消费者满意网络关注度和热度的变化。两个搜索指数变量的系数不同,这说明消费者预期和消费者满意两个影响因素的变化对消费者信心的影响程度是不同的。消费者预期搜索指数和消费者预期搜索指数两个指数各变化1%,对应的消费者信心指数变化的幅度分别为106.87%和2.10%。

我们把消费者信心指数的真实值和模型得到的消费者信心指数的拟合曲线图绘制在一起。(图1)可以看出本模型对于消费者信心指数的拟合效果基本上令人满意,两者的走势基本上是同步的。即:网络搜索数据可以在一定程度上对消费者信心指数进行预测,但是在某些时段,消费者信心指数的模型拟合值和消费者信心指数的真实值之间还是存在较大的偏差。

二、结论

通过建立网络搜索数据与消费者信心指数之间的自回归模型,我们发现:1、网络搜索数据与消费者信心指数之间是协整的。消费者预期搜索指数的提高会引起消费者信心指数的下降;消费者满意搜索指数的提高会引起消费者信心指数的上升。这表明消费者预期也就是消费者对宏观层面的评估和预判对消费者信心的影响要远远大于消费者满意即微观层面的影响;2、网络搜索数据中的部分数据和消费者信心之间具有显著的相关性;3、利用网络搜索数据合成的消费者预期搜索指数和消费者满意搜索指数与消费者信心指数之间存在不同时间的时差。消费者预期搜索指数领先消费者信心指数两个月,消费者满意搜索指数领先消费者信心指数一个月;4、引入网络搜索指数后的自回归模型对消费者信心指数的拟合和预测都比较好,可以比官方公布的消费者信心指数提前1个月左右,基本实现了对消费者信心指数的实时监测。

主要参考文献:

[1]国敏.基于网络搜索技术的游客量预测方法研究[D].北京:首都师范大学,2012.

[2]郭洪伟.我国消费者信心指数的编制及存在的问题[J].商业时代,2010.

河北省统计科学研究计划项目(2014HY39)

F713.55

A

猜你喜欢
信心消费者模型
消费者网上购物六注意
重要模型『一线三等角』
Study Of ShiJie Control Thought
重尾非线性自回归模型自加权M-估计的渐近分布
恢复信心比给猪刷脸更重要
知识付费消费者
3D打印中的模型分割与打包
悄悄偷走消费者的创意
悄悄偷走消费者的创意
KX5的耐心与信心