基于GWR的苏州酒店价格的空间异质性及影响因素研究

2019-03-28 09:00:44张义杰南京财经大学江苏南京210023
中国房地产业 2019年23期
关键词:景点显著性条件

文/张义杰 南京财经大学 江苏南京 210023

价格竞争一直以来都是酒店之间的一种重要竞争方式。而对于旅游者来说,酒店作为旅游六要素之一,其价格始终备受旅游者关注。关于酒店价格的近期研究中,国内外的研究热点都比较集中于酒店客房的定价策略和方法、酒店价格对于顾客满意度的影响、影响酒店价格的因素等方面[1-3]。地理加权回归(GWR)模型由英国Newcastle 大学的Brunsdon 等[4]提出,是一种能有效揭示被观测者空间非平稳性的方法,其在与地理位置有关的学科中具有重要的应用价值。除了Brunsdon 之外,近年来还有其它学者[5]也将研究结果与OLS 方法进行比较,都证实了地理加权回归模型较优。虽然很早之前就有国内学者对酒店价格时空分异进行研究[6,7],但是运用GWR 模型进行研究的非常少。本文采用GWR 模型对苏州的酒店价格空间异质性进行研究,以促进酒店价格的科学化制定。

1、研究方法与变量选取

1.1 模型与方法

经典的线性回归模型通常是由随机误差项εi 和一套参数β0 和βi 组成,可以写成:

传统的回归模型是建立在最小二乘法基础上对参数进行估计,OLS 则在定义了全局因变量yi 和自变量x 关系后,i 通过最小误差平方和来得出方程参数的估计值[8]。虽然其对于空间平稳性数据的回归有较好的估计,但是对于空间非平稳性数据的回归估计却不太理想。因此这时候就需要引入GWR 模型,其允许一些不平稳的数据直接被模拟。地理加权回归方法对传统回归模型进行了拓展,使得参数能够进行局部估计,其模型为:

式中:ui、vi是第i 个样本点的地理坐标;βi是随着地理位置的变化而变化,每一个局部的βi都是用来估计它相邻的空间观测值。

1.2 数据来源

本文苏州酒店房价数据来源于携程网,共获取了7月25日到7月31日共七天的苏州整个地域范围内的酒店信息,最后选取出3957 家连续七天均获取到客房最低价数据的酒店,将其七天的价格平均值作为原始数据。同时从携程网获取了每家酒店至7月31日为止的评分、评价数和酒店设施情况。评分为空的酒店其评分以同价格段所有酒店的平均值为准(例如价格为158 元的酒店评分为空,则以价格为101-200 元所有酒店的评分平均值作为其评分)。同时对酒店所提供的设施和服务进行统计,每提供一样设施或服务其数量就加一。

苏州地区内的POI 点数据均从百度地图获取,其中包括餐饮POI 点88993 个,地铁站POI 点129 个,公交车站POI 点9557 个,购物POI 点13457 个,商务POI 点2486 个,休闲服务POI 点894 个,普通景点(除A 级景点以外的其它景点)POI 点2515 个,3A 级景点POI 点11 个,4A 级景点POI 点19 个,5A 级景点POI 点8 个,综合医院POI 点140 个,银行(包括ATM 机服务点)POI 点5232 个,车站(包括汽车站和火车站)POI 点131 个,高等院校POI 点86 个,共计14 类POI 点数据。由于百度地图API 一个矩形范围内只能返回最多400 个POI 点的数据,所以将苏州市范围切成80*80 个切片对每一类POI 点进行爬取。结果显示没有一个切片的数据量达到400,因此获取的数据相对来说较为全面,基本没有遗漏。最后将所有酒店和POI 点数据导入ARCGIS10.5 中计算酒店周边1000 米范围内各类POI 点的数量。

1.3 变量选取

由于不能将哑元数据导入GWR 模型,经过统计发现酒店周边3A、4A 和5A 景区数量的数据为哑元数据,为了不影响模型最终结果,所以决定采用赋值法对这三个变量进行合并(一个3A 级景点赋3 分,4A 级景点赋4 分,5A 级景点赋5 分)。最终选取的所有自变量共16 个,分别为:酒店评分、酒店评价数、酒店设施数、酒店类型、餐饮(“周边餐饮数”的简称,下同)、地铁、公交、购物、商务、休闲服务、普通景点、A 级景点、医院、银行、车站、高校。

2、结果分析

2.1 OLS 结果分析

注:***为0.001 显著性水平;**为0.01显著性水平;*为0.05 显著性水平,下同。

本文中OLS 模型回归分析通过ARCGIS10.5 中的普通最小二乘法工具实现,输出的结果如表1所示。由于回归结果中Koenker 统计量的概率为0.000000(p〈0.01),具有统计学上的显著性,即说明数据可能存在空间非稳定性,因此使用稳健概率列(Robust_Pr)来确定系数显著性。从表中可以看出自变量餐饮、购物、商务、休闲和银行的VIF 值均大于5.0,说明模型的自变量之间存在较为严重的全局或局部多重共线性。

2.2 主成分分析

由于自变量之间存在多重共线性,但是这些变量的显著性水平又较高,为了在消除自变量之间多重共线性的同时不遗漏重要的自变量,所以决定采用主成分分析方法。

将数据导入SPSS25.0 软件中,选择因子分析中的主成分分析方法进行提取。得到的KMO 和巴特利特检验结果KMO 结果为0.838,且巴特利特球形度检验的显著性为0.000(p〈0.01),说明现有变量适合进行因子分析。

得到的成分矩阵如表2所示。经过主成分分析,原有的16 个自变量被降维成了5 个新的主成分。根据表中各列的因子载荷可以看出,主成分1 主要由餐饮、地铁、公交、购物、商务、休闲、普通景点和银行共8 个变量构成,因此可以将其命名为“周边综合生活配套设施”(简称PT);主成分2 主要由酒店评分、酒店评价数、酒店设施数和酒店类型共4 个变量构成,因此可以将去命名为“酒店自身条件”(ZS);主成分3 主要由A 级景点这一变量构成,因此可以将其命名为“酒店周边环境”(HJ);主成分4主要由车站这一变量构成,因此可以将其命名为“长途交通条件”(JT);主成分5 主要由医院数量这一变量构成,同时高校占的比重也较高,因此可以将其命名为“周边医疗条件”(YL)。

通过SPSS25.0 将原有的16 个自变量全部标准化,依照表2从上到下的顺序设经过Z 标准化后的变量为X1,X2,…,X16。同时用每一列的因子载荷分别除以其相应的特征值的平方根(分别为5.927、1.853、1.408、1.185、1.017),得到的各主成分的表达式。

表2 成分矩阵

2.3 GWR 结果分析

将上述所得5 个新的变量导入GWR4.0 软件中进行运算,得到的回归结果如表3所示,以及GWR 模型的估计系数如表4所示。

从表3中可以看出,PT、ZS、JT 和YL都是显著的,只有HJ 是不显著的。结果说明PT、ZS、JT 和YL 都具有明显的空间不平稳性,其系数会随着空间位置的变化而发生显著变化;而HJ 则不具有明显的空间不平稳性,随着空间位置的变化其系数并不会发生显著的变化。

表3 回归结果

从表3中可以看出,ZS、HJ 和JT 的系数平均值均为正数,其对酒店价格的影响多为正向影响,其中酒店自身条件平均来说对酒店价格的影响最大为58.89,其次为长途交通条件对酒店价格的影响为56.77,最后为酒店周边环境对酒店价格的影响为10.83,即酒店自身条件越好、长途交通条件越便捷,一般来说酒店的价格就越高;而酒店周边环境越好一般其周边同质化竞争也较为激烈,因此对酒店价格的影响程度不高。而PT 和YL 的系数平均值均为负数,其对酒店价格的影响则多为负向影响,其中医疗条件越好的区域其周边一般多为廉价快捷酒店方便病人家属入住,其价格普遍较低。

3、结论与不足

本文基于GWR 模型,对苏州地域范围内酒店价格的空间异质性及其影响因素进行了探讨。研究发现:①酒店价格主要受周边配套设施、酒店自身条件、周边环境、长途交通条件和周边医疗条件的显著影响,其中周边配套设施、酒店自身条件、长途交通条件和周边医疗条件的影响程度在空间上存在异质性②酒店自身条件、长途交通条件对酒店价格的正向影响最大,周边医疗条件对酒店价格的负向影响最大。

酒店价格的形成是多种因素在一定区域范围内共同作用的结果,除了本文中提到的影响因素之外,一定还有其它重要因素会对酒店价格产生影响。酒店的地价、房租和建设成本是否会对酒店价格产生影响,这些都是酒店经营者自己私下的交易行为我们暂时不得而知。我们曾尝试将区域范围内的平均地价作为自变量代入模型中,但考虑到现实中酒店建设的复杂情况,总觉得有失偏颇,因此将其舍弃。每一个酒店经营者对于所经营酒店的价格期望和其所选择的定价策略到底是怎样的,会对酒店价格产生怎样的影响这一点也有待进一步研究。政府的税收制度、相关政策又会对酒店价格产生怎样的影响也有待进一步探讨。

猜你喜欢
景点显著性条件
排除多余的条件
选择合适的条件
基于显著性权重融合的图像拼接算法
电子制作(2019年24期)2019-02-23 13:22:26
基于视觉显著性的视频差错掩盖算法
打卡名校景点——那些必去朝圣的大学景点
一种基于显著性边缘的运动模糊图像复原方法
论商标固有显著性的认定
知识产权(2016年8期)2016-12-01 07:01:32
英格兰十大怪异景点
海外星云(2016年7期)2016-12-01 04:18:07
为什么夏天的雨最多
没有景点 只是生活
Coco薇(2015年11期)2015-11-09 13:19:52