王天青,陈天一,张安安
(青岛市城市规划设计研究院 大数据与城市空间研究中心,山东 青岛 266071)
随着城市化速度不断加快,城市规模逐步扩大,实体商业空间的形态和功能也随着消费需求的变化而持续发生改变。[1]但由于城市商业规划规范文件中缺乏相应的引导指标,许多城市出现了商业供给无序的现象,导致城市部分区域的商业供应能力欠缺,无法满足市民的个性化需求。此外,城市部分区域的商业经营也面临着不确定性,这些问题阻碍了城市商业设施的持续健康发展。
2019年国务院办公厅印发的《关于加快发展流通促进商业消费的意见》着重强调了创新优化商业流通发展,培育消费热点的相关政策,并提出了更好满足人民群众消费需求,重振消费信息的要求。新形势下,结合城市商业商厦指标数据,分析消费者的行为活动和需求特征,建立科学定量的商业评估指标体系尤为重要。而商业商厦作为城市商业设施的主要构成部分,是集中购物、娱乐、餐饮、休憩等多种功能设施的“载体”[2],其本身就具有重要的研究意义。
近年来,对于商业指标的研究逐渐增加,许多学者运用城市断裂点理论证明了商业规模设施指标与其吸引消费者能力具有相关性。这是一种通过Voronoi图和构建理想化指标模型对特定区域的商圈进行规模和服务范围的实证性评估的方法。例如,谢顺平等和程飞等人分别以南京市和北京市为例,论证商业中心自身规模影响其辐射域的相关趋势[3-4];鲁成等对零售商圈的店铺数量、规模等指标进行评估量化,得出商圈规模对辐射范围有影响显著这一结论[5];吴雪艳等在建立商业规模指标评价体系的基础上,运用断裂点理论计算出济南对周边城市的商业辐射范围。[6]就现有的关于城市商业规模和辐射范围的研究结论来看,对于经营规模、业态多样性及商业辐射强度等指标的研究相对较少。虽然许多研究结论都得出规模与辐射范围具有正相关关系,但由于缺乏数据获取渠道,其提出的城市商业设施供应的政策建议缺乏有力的支撑;其次,城市断裂点理论和Voronoi图是理想模型[7],在实际应用中仍然需要考虑到商业丰富度、消费者购买倾向等多方面的因素,因而其参考性有所欠缺;此外,目前的研究多集中于宏观商圈选址、绩效评估等方面,缺乏对城市基础的商业单元的引导。
随着信息技术的发展,大数据对城市商业空间的分析技术日趋成熟,数据来源也趋向多样化,如大众点评口碑数据、基于网络地图的POI商户数据、手机信令数据、网络干道LBS数据等。有学者开始从宏观的消费者活动视角[8-10],总结消费出行特征,运用商业设施的访问频次等手段,对不同等级的城市商业设施、商业中心的空间结构特征进行分析;如王德等利用手机信令数据,对商圈消费者数量、商厦服务范围的空间分布特征进行了分析;[11]唐刚利用手机信令数据,对城市商业中心的辐射区域特征进行了分析。[12]手机定位大数据已经成为了城市商业空间指标分析的重要数据来源,但由于信令数据是基于基站位置产生,更适用于区域研究,无法满足对单体商业综合体的研究需求。
相对于国家对商业发展的重视和消费者不断变化的需求,现有关于商圈和商业网点的研究也需要更新,否则将无法为商业供给侧发展提供坚实的理论基础。本文旨在使用LBS数据研究城市商业商厦的指标,在完善商业设施建设的基础上促使需求表达和供给决策能够有效对接,发挥商业在区域经济发展中重要的拉动作用,为商业设施重构和规划发展提供指导和借鉴。
综合商厦作为现代城市商业设施,是城市商业中心的主要构成部分。本文以商业商厦的供需指标作为研究对象,以消费者的行为模式、商厦的供应规模的耦合效应为分析视角,分析了商厦供需指标之间的关系型,旨在辅助城市规划者在商业用地指标规划上进行研究,进而更科学地优化城市商业商厦的相关规划。
研究选取了截止到2019年12月开业的山东省十六地市的100个经营较好的综合商业商厦为研究对象,并采用控制变量的方式减轻商业设施的外部要素带来的误差。100个综合商厦名称由大众点评的综合商厦门类中高人流量综合商厦排名可得,其中济南市、青岛市各选取15,其他地市各选取5个,并通过百度地图API将其定位。
本文研究数据多源,主要分成三类:第一类为通过高德地图开源API获取到的城市兴趣点(POI)数据,以研究所选商厦的业态构成;第二类为百度慧眼青岛联合实验室提供的2019年山东省十六地市特征区域内7-9月手机APP定位的Location Based Service数据(以下简称LBS数据),用以区分不同商厦的服务人口居住地位置;第三类为通过大众点评人流排名选取的商业商厦,并通过解析天地图遥感影像获取到的大中型综合商厦空间化的矢量范围数据。
百度手机LBS数据是基于手机用户后台GPS定位的高频定位数据,具备时间连续性强、空间粒度细致、采集样本大等特点,对于数据精度要求高的研究具有较高的价值。[12]本次研究所使用的LBS数据的统计时间间隔为单日的访客人次,并对个体商厦的访客人数进行小时内去重。不同于手机信令数据,LBS数据提供到精确到50 m以内的GPS定位点数据,可以通过算法筛除非访客人群,提升研究的精确度。百度手机LBS数据可以用于界定综合商厦的服务指标。
本文提取了2019年7—9月三个月内访问过样本商厦附近的手机用户数据,在进行数据清洗和加工的过程中使用了如下规则:首先搜索用户在三个月时间段内出现在该市范围内的天数,若该用户在该范围内出现的天数达到60%,则判断该用户为本地常住人口,否则视为外地游客,不纳入研究数据中;进而检索三个月内,用户在研究的商厦范围内出现的天数,若出现频次低于20%,则判断为消费者,否则视为在研究对象区域内居住或工作,不纳入研究数据中。上述规则主要基于主观经验判断,不可避免的存在漏筛、过量筛选等误差问题,但通过对多源同类数据进行交叉检验,认为该数据清洗方法具有较高可靠性。图1显示了经过处理后的数据总量分布,平均单日数据量为84.87万人次,周五至周日的数据略高于工作日,周一至周三的数据最为稳定。
图1 日访问设备数
本研究的商业网点的名称、空间与类别数据来自于2019年9月采集的高德地图POI兴趣点数据,该数据是一种具有经纬度、类别、名称等信息的点状地理空间要素,常用于分析城市中商业特征、分布研究等。在研究选定的商厦范围内,统计POI总量为47411个,它们被分成了餐饮服务、购物服务、科教文化服务、生活服务、体育休闲服务五类。
本文对城市商业空间研究中的经典算法菲什拜因参数(Fishbin index)[13]进行改进,构建商业商厦指标。通过对指标关系进行研究,提出区域商业需求可以通过两个要素表征:区域内消费者前来消费的频次;消费者出行的所付出的出行成本,即商厦的服务范围。而商业商厦的供应则表达为商业空间的面积规模与网点的富集性。
1.服务范围。通过百度LBS定位数据获取的访客居住位置为点状数据,也存在离群值,影响统计结果。为了更好地指数化(Indexation)商厦的服务半径,本研究引入了标准差椭圆模型,该算法由韦尔蒂·利菲弗(D. Welty Lefever)在1926年提出,其原理为基于所有空间点创建一个新的以平均中心为中心的椭圆面(见图2)。而该椭圆的面积代表了一定标准差内数据分布的概化面,短半轴y表示数据分布的范围。
图2 标准差椭圆原理
本研究中,为了消除离群值对于商业吸引范围的影响,选取了一个标准差范围的居民购物者数据,即占总样本数63%的输入要素的质心包含在内,以标准差椭圆的短轴y表示商厦的影响范围,其具体计算方法如下:
其中,xi和yi是要素i的坐标,{X,Y}表示要素的平均中心,n等于要素总数。
2.商铺富集性。商业的富集性对于商业经营区域是必不可少的元素。在以往的研究当中,香农熵是一个最为普遍的业态多样性评估方法。[14]但香农熵更倾向于评估混乱性而不是富集性。[15]因此,本研究使用富集性熵(HN)归纳商厦中业态的多样性(Diversity)和规模(Scale)两个测度来测度评价商业网点的丰富度,其公式如下:
其中,HN的值取决于POI类别的数量N和各类别(p1,p2,…,pN)数量分布的均匀性。
3.商厦客流量及访客来源分布。通过LBS的定位数据,计算居民用户的出行链信息,即将在某一区域的访问的超过30分钟的非常驻用户判断为该区域的访客。判定用户的常住与工作区域的方法已经有大量的手机信令的文献研究[16],故不再赘述。
4.商厦空间数据。商业商厦的建筑面积是商业空间规模的另外一个表征。由于城市的商业商厦建筑轮廓矢量数据未公开化,故只能采取卫片矢量化提取法进行测算。
图3 天地图矢量化流程
首先,采用天地图建筑物矢量化法对商业商厦的轮廓线进行提取。通过Matlab对天地图进行坐标补偿,高效地提取了山东省内100个商业商厦的具体轮廓范围。其次,本研究通过百度地图的建筑内地图功能,获取了目标建筑物的实际层数。最后对建筑面积进行了定量估算,具体流程见图3。[17]
本文通过综合百度LBS定位数据、城市POI数据以及天地图卫片数据对山东省范围内100家商业商厦的规模、客流、业态以及影响范围进行了测算,并将所有数据的精确度提高到了单体商厦的尺度。如图4,在对城市名称进行编码后,所有商厦数据已按序号排序。排序后的统计图准确地反映了各个城市的综合商厦的商业网点丰富度、建筑面积、影响半径以及客流量数据。其中,图a、d反映了济南、青岛等大城市的商厦拥有更高的商业网点丰富度以及更大的日均客流量,图b、c反映了城市规模对商业网点的建筑面积以及影响半径的影响较小。
图4 数据分布图示
表1 描述性统计量
表1展示了所统计的山东省内100家商业商厦的建筑面积(公顷)、日均客流量(人)、业态丰富度(系数)、影响范围(KM)以及公共交通覆盖(个数)数据。通过总结数据可以得出,商厦的平均建筑面积为13.4公顷,商厦面积被12.1公顷至14.8公顷这一区间覆盖的概率为95%;本次调查样本的店铺数量平均值为250,但其标准误差较高,表明数据浮动范围较大。此外,所有商厦的日均客流量具有较高的相似性,为6700人每日,样本中80%的商厦日均客流量超过了6000人每日;商厦的平均影响半径为0.97公里,影响半径数据的离散程度较低,其均值具有较好的代表性。
多元线性回归模型通常用来研究一个因变量依赖多个自变量的变化关系,已经被广泛地用于各个领域的数据研究。[10]其优点在于可以计算多组变量的线性关系,并且通过准确地计量各个因素之间的相关程度以及拟合程度的高低能够提高自身的预测效果,比一元线性回归具有更大的实用意义。此外,运用多元线性回归模型,只要采用相同的数据和模型,即可通过标准的统计方法计算出唯一的结果。基于这些特点,本文采用多元线性回归模型对城市商业商社的供需指标进行相关性分析。
在商业商厦供需指标体系的实际建模过程中,其作为被解释变量不但受定量变量的影响,同时还受到定性变量的影响。例如城市规模、交通条件等因素。因此,在建立线性回归分析模型之前,需将城市特性变量作为控制变量进行虚拟处理。同时,根据现有研究,城市公共交通的便利性、不同业态的比重也会对其指标造成影响[9][11],故本文同时对商厦周边500米范围内的公交与轨道站点数、商业类别占比等数据进行了统计,将统计后的数据作为解释变量参与回归模型的建设。
表2 指标相关性分析
通过表2所示的研究指标相关性检验可以得出,在95%的置信区间下,商厦面积与其影响半径和客流量都有较强的相关性。这说明商厦的面积作为规模要素,是满足商业需求的必要条件;此外,这也表明商业网点规模的丰富度指数与客流量也具有明显的相关性。另一方面,商厦的影响半径与商厦的业态丰富度并没有显著相关性,可以得出居民消费主要遵循商业区域等级体系的原则,受业态丰富度的影响较小。这一现象与多位学者的研究成果相符,例如罗艺等人对大型百货商场零售业态的研究表明,消费者的驱动因素主要在于综合商厦的经营规模;[18]仲海、宁敏的研究证明商业设施的核心竞争力来源于商业的中心地等级。[19]
在相关性分析的基础上,本文通过建立多元线性回归模型进一步研究了城市商业综合体的供给指标与需求指标之间的关系。表3中a,b两个线性回归模型反映了不同的需求度量与供应规模的关系,模型a因变量为商业商厦的服务半径,自变量为商业综合体建筑面积;模型b则反映了商业商厦日均客流量与商业综合体业态丰富度之间的关系。经检验,在95%的置信区间下,模型a、模型b的Sig值均小于0.001,说明该模型可靠并且具有一定的代表性。
表3 模型拟合R2变化
通过观察表3回归模型a1、b1可以发现,城市自身的规模经济特征,也会对商业商厦本身的客流、影响半径等产生一定的影响。[20]然而模型a1的R2值较低(0.228),说明城市特征对商厦的影响范围的解释度较低,两个变量的相关性不明显。模型a2在加入解释因子建筑变量之后,调整后的R2值上升明显,说明商业商厦的规模对其自身的服务半径有显著的相关性。模型a3、a4分增加了日均客流量、业态丰富度、公交覆盖以及业态占比等解释变量,逐步回归之后的调整后R2值稳定在0.57,说明该回归模型具有较强的解释性。模型b1,分析了城市特征与商厦客流量的关系,结果发现城市特征对该模型的解释性较弱。在引入商业网点的丰富度指标后,模型b2的调整后R2值上升明显,说明商业网点丰富度是影响其日均客流量的主导因素。模型b3、b4分别引入了建筑面积、公交覆盖以及业态占比等解释变量,回归后的模型R2值逐步提升,说明所添加的解释因子与日均客流有显著的相关性。
分析多元线性回归模型可以得出,商厦的服务半径和客流量都与其自身的建筑面积存在显著的正相关关系(见表4)。大规模的商业综合体往往可以提供更多样的商品和服务并以此吸引更多的日均客流量,其辐射能力也会更强。模型显示,每增加单位公顷的建筑面积,都会扩大约0.016 km的商厦服务范围。虽然研究结果表明扩大经营规模会带来显著的客流量提升,但也应当考虑目标区域的人口情况,盲目扩张则会出现商业空间闲置、空间利用率低、商业效益低等问题。
商厦的业态丰富度作为商业供应的另一大重要指标,与日均客流量有显著的线性相关关系(P<0.001),在控制其他条件不变的前提下,每增加一个单位的商厦业态丰富度,就可以增加20人每日的日均客流量。另一方面,业态丰富度与商厦服务范围并无显著的相关关系。这一现象说明顾客对商场提供服务的多样性要求较高,业态的多元化将成为商厦发展以及其结构调整的主要趋势。因此,为了推动商业环境的升级,应当鼓励商厦在找准人群和产品定位的基础上,优化业态组合,推动商业环境的升级,引导良性竞争,避免商业活动同质化发展。
商场影响半径与交通便利度也存在一定的正相关关系,商场辐射范围受交通便利性的影响较小;此外,日均客流量数据并没有与商场临近的公交站以及地铁站数量产生显著的相关关系(P=0.087)。虽然交通便利度的提高会使商圈的辐射能力有所增强,但其提升范围有限。这说明主导客流量的主要因素在于商厦的建筑规模以及其自身的业态丰富度,增加交通便利度只能在一定程度上提升客流量,但难以弥补设施上的差异。因此,在增加交通便利度的同时,应重视商业服务供给以及营业规模的提升,充分考虑商场针对的消费人群,明确客流性值。在整体规划的基础上,对交通网络合理布局,通过统筹协调资源提升商圈的综合实力。
此外,本文针对业态种类对商厦指标产生的影响展开了更为具体的分析。在1%的显著水平下,餐饮类商业设施对客流量和商厦服务范围都具有正相关的影响。由于餐饮业的特殊性,其易对周围客流产生长期的定向影响,并为商厦设施提供更多的潜在消费者。另一方面,餐饮行业也容易与商厦的夜间经济协同发展,并可以增加城市活跃度以及提高特定农产品的流通范围。因此,在商业网点的规划中可以对餐饮行业进行适当的资源倾斜,在增加商厦辐射力的同时拉动其他相关产业的收入。
购物类传统商业网点的占比与客流总量存在着显著的负相关关系,对商厦的辐射半径几乎没有影响。这是由于电商平台的高速发展推动了消费者购物方式的转变,传统购物类商业设施正在受到丰富的虚拟购物平台的挤压。消费者前往商场购买传统商品的需求下降,这就需要通过创造性手段提振消费者热情。可以采取财税金融手段引导推广老字号产品等相关特色领域,推动服务水平提高并增强消费者的购物体验。此外,还应当通过政策对商业发展予以正确引导,避免商业设施盲目扩张的现象,对商业设施建设管理增强约束,鼓励创新经营方式和差异化经营。
生活服务类设施对日均客流量影响并不显著,但对市场影响范围有显著的负向影响,这是由于消费者倾向于选择就近满足自己生活服务需求的设施。从线性回归结果可以发现科教文化服务设施与商业半径和客流量均无相关性,因此难以得出此类设施在商业商厦中存在的必要性。而以娱乐为代表的新商业业态对商业设施客流起到了显著的正相关作用,虽然休闲娱乐服务只占总设施数量的3%,但其对日均客流量的吸引力为63人每日,远高于其他业态。这说明在设置商圈经营和服务类型时应注重整体性设计,充分了解消费者偏好,重视新业态对消费者的吸引力。
表4 总体回归结果
本文对山东省100所大型商业商厦的研究表明,山东省省内的商业商厦规模与市场需求均存在合理区间,通过对研究样本的建筑面积进行归纳可以发现,75%的目标商厦的建筑面积属于12-15公顷区间。由此可见,消费者对于游憩消费的功能结构,具有一定程度的偏好,在规划的过程中应适度控制规模,更多考虑面积约束下的经济效益。同时,商业网点数量与商厦建筑面积相对应,数量普遍不超过300家,均值为250家。这表明在商铺数量相当的情况下,想要提升商厦竞争力,应当提高商铺的多样性以及服务质量。此外,商业的业态多样性与市民需求的契合度呈正相关,这表明商品种类覆盖全的商厦更契合市民的消费需求。另一方面,研究发现运营较好的商厦的日均客流量相似性较高,数值在6000至8000的范围内浮动。这从侧面说明对于单体商厦建筑,客流量可能存在一定的边际性,即虽然规模增长会带来额外客流量,但存在客流量阈值。从商厦的服务范围来看,购物人群更倾向于就近购物,平均购物出行距离为0.9 km,是15分钟步行范围的合理区间。
本文还对商业商厦的规模与市民购物需求的相关性进行了研究,发现在控制城市特征的外部要素的前提下,每增加单位公顷的额外建筑面积,就会提高约0.016 km的服务范围。在城市商厦规划的过程中,应充分考虑周边商厦的影响范围,合理布局,考虑增加规模对于商业体的综合影响。将网点数量与多样性共同作用于市民的购物需求。回归模型的分析表明,增加单体商厦内的网点数量以及提高商业网点的业态多样性都对吸引客流有较大的帮助,每增加单位商业业态的丰富度都会额外吸引20.05人均客流量。在网点数量不变的情况下,对商业网点的门类进行结构性优化能有效提高商业网点的运营效率。
此外,研究发现,提高公共交通便利度和餐饮服务数量都对提高商厦影响半径具有正向效应,提高餐饮服务业务以及休闲娱乐服务数量对提高日均客流量具有正向效应。商业区域可以通过调整业态配比和交通便利度等外部因素来增加运营能力。
本研究通过使用新兴LBS数据对城市微观商业的规模、业态、服务范围以及客流量进行了关系评估,对城市商业商厦的规划建设有一定借鉴意义。然而,城市商业商厦的实际运营情况十分复杂,不同商厦的覆盖情况和经营状况存在很大差异,许多区域存在不良竞争和空心化等问题,因此影响商业商厦客流、服务半径的实际因素更加多元化和复杂化。本文仅从商业设施规模以及网点丰富度两个角度进行分析比较片面,而且所选样本的丰富度不够高,不能全面代表所有能级的商厦情况。因此,针对上述不足,后续有必要进行深入的研究。首先,应将区域竞争模型引入到回归参数中,从微观整合到中观层次,对城市区域中出现的商业集聚、商业竞争现象进行深入分析。其次,应该结合现有研究、规划的经验,考虑加入科学性更强的控制变量,以消除其他因素的影响。最后,本文研究只使用了2019年7月至2019年9月的数据,有一定的时间局限性。采用横断面数据采样回归方法也使研究有一定的片面性,未来的研究应当采用更广阔的时空维度数据,以达到更好的结果。