基于多源网络大数据的武汉城市圈城市热度分析
——以五一假期为例

2022-11-17 09:44姚文萃陶海军李桂媛王传海
河北省科学院学报 2022年5期
关键词:武汉市百度规模

姚文萃,陶海军,李桂媛,王传海

(1.苏州农业职业技术学院园林工程学院,江苏 苏州 215008;2.兰州交通大学建筑与城市规划学院,甘肃 兰州 730070;3.湖北工业大学土木建筑和环境学院,湖北 武汉 430068;4.中景达(苏州)建筑规划设计有限公司,江苏 苏州 215008)

2020年全国“两会”提出国家经济发展新的方针,即“逐步形成以国内大循环为主体、国内国际双循环相互促进的新发展格局”。假期期间的消费、出行和旅游等能更好的刺激国内大循环,而这些活动通常是以城市为载体发生,并由此形成人们心中对于不同城市的“关注程度”。在本文中,把这种“关注程度”用“热度”来解释。学者们也通过某类网络大数据来研究城市热度,如柴海燕等人[1]从百度指数出发,从6种指数角度分析武汉旅游的网络热度和空间分布特征。

随着互联网信息技术的不断发展,网络大数据成为城市研究的重要要素。国内外学者近年来多利用百度搜索、百度迁徙、腾讯迁徙、腾讯位置大数据对城市网络特征、城市公共活动空间、城市人口流动等方面进行研究[2-3];刘国栋等人[4]利用百度指数搜索平台,构建起利用指数预测分析的研究路线。杨友宝等人[5]通过百度指数变化,探究长沙居民游憩空间偏好的时空演变。蒋小荣等人[6]采用百度迁徙数据,研究分析全国人口在时空的流动特征。童昀等人[7]使用百度迁徙数据评价分析探究COVID-19疫情对我国人口空间运动的影响。冯章献等人[8]利用春运时迁徙数据,提出经济率和距离率是可以影响人口迁徙的两个重要因素。花磊等人[9]利用腾讯位置大数据分析,提出区位优势会影响人口迁徙意愿。徐腾等人[10]研究分析人口迁徙对房价的变动影响。同时,学者们利用互联网大数据对单个城市的游憩空间偏好、城市关注度和迁移意愿等进行研究[11-14]。也有对城市之间的相互联系、城市功能区识别的研究[15-17]。这些研究多聚焦网络空间或实际空间的一种,未能综合网络空间和实际空间评价城市。因此,本文以假期出行者的网络搜索和实际出行综合在一起为研究对象,采取线上和线下相结合的模式,以“城市热度”为核心要点,以指数搜索的变化趋势、城市间的迁入和迁出,城市人群的聚集为分析手段,多源互联网大数据,综合评价“五一长假”期间武汉城市圈各城市热度。

1 研究对象、数据来源和研究方法

1.1 研究对象和数据来源

研究对象为武汉城市圈内9个城市,包括武汉、黄石、鄂州、黄冈、孝感、咸宁、仙桃、天门、潜江。采用的行政边界来源于湖北省天地图专题地图提供的边界。

本研究所采用数据包括微博搜索指数、百度迁徙指数和腾讯位置大数据。微博搜索指数数据是基于微博指数移动版的关键字搜索,能够全面的体现关键词在微博上的热度情况。百度迁徙指数是采用基于地理位置服务的大数据,经过机器运算分析得出的城市与城市之间迁入迁出的相对数值,反应人口在地理空间上的流动特征。本文选用2021年4月30日-5月5日共计6天的人口迁徙数据作为分析样本。腾讯位置大数据是腾讯公司依托腾讯大量的软件产品数据,采用准确高效的算法大数据产品。本文选取假期中期5月3日早晨10:20至晚上22:20共计13个时间点,获取星云图的经纬度下的数据值,用于测算一天中,在时间点内的人流聚集情况。

1.2 研究方法

1.2.1 城市热度分析和评价模型构建

以假期出行者为对象,梳理从线上到线下的行为活动转变。假设,一个人想要去A城市B网红打卡点游玩,他就会以“A城市B网红打卡点”为关键词在互联网上搜索,此时在该关键词下就会记录搜索次数,相关城市和景点在网络上形成了相应的关注度;之后通过交通线路前往,此时在百度迁徙或者腾讯迁徙网上会形成人在时间和空间上出行记录;到所在地后,由于后台软件的持续运行,人群在时间和空间层面的集聚形成热力图。“搜索—出行—实地停留”行为共同形成出行者对城市选择的模型,海量出行者形成城市热度数据。构建如图1所示的城市热度分析模型,不同的阶段可以依据不同的网络大数据进行量化。结合该模型,挖掘多源网络大数据,形成本研究分析城市热度的思路和方法。

图1 城市热度分析模型图

1.2.2 基于GIS的空间分析法

本文基于GIS空间分析中的OD分析和核密度分析。OD分析一般采用流图、矩阵等,本研究中采用流图的形式,在出行这一行为活动阶段通过GIS绘制不同城市出行者迁徙流线图用以反映城市之间的关联关系。核密度分析可以直观地反映出空间点位置基于某一特征值的疏密关系,在到实地活动阶段通过GIS的核密度分析人口在空间上的分布状态和聚集程度等。

2 基于网络大数据的城市热度分析

基于构建的城市热度分析和评价模型,首先是相关城市或要素在网络上被关注,进而通过交通方式出行,最后到达某地,三者综合形成该城市的热度,其衡量的网络大数据采用城市微博搜索指数数据、百度迁徙指数数据、空间聚集的腾讯位置大数据。数值越高,城市热度越高。其中微博搜索指数数据反映网络空间城市热度,分析9个城市在网络上被搜索的程度,网络搜索者不限定空间边界;百度迁徙指数和百度热力图反映实际空间城市热度,在分析时其研究对象是9个城市。

2.1 基于微博搜索指数的网络空间城市热度分析

微博搜索指数记录了以某一个关键词在网络中被搜索的次数,一定程度上反映了不同城市在网络上的关注热度和吸引力,反映了不同城市在假期中预计要接待的潜在游客。在微博把武汉城市圈内各城市名称作为搜索关键词进行查询,记录从2021年4月30日至2021年5月5日各城市每天被搜索的指数变化,整理得表1。

表1 武汉城市圈2021年五一假期城市微博指数变化趋势表

由表1可知,9个城市中武汉6天被搜索的总量是22655861次,其余8个城市被搜索总量是132822次,武汉被搜索总量约是其余8个城市总量的170倍;武汉日均平均被搜索量是3775977次,其余8个城市日均被搜索之和只有22137次。为进一步评价被搜索指数,将每个城市日均被搜索数量标准化赋值,将武汉设置为100,其余各城市被搜索指数均小于1,搜索指数最高的黄石只有0.1445,而最低的天门,被搜索指数只有0.0007。从被搜索指数看,武汉热度占绝对优势,其余各城市吸引力非常不足。对武汉来说,在4月30日和5月1日的微博搜索热度都较高,在中长假的中间日期5月3日达到顶峰,在5月4日开始出现小幅增长,之后呈下降趋势。结合五一游玩规律,五一之前已经开始搜索旅游城市和旅游目的地,经过5月1日和5月2日旅游、在家休息和寻亲访友后,5月3日又开始了新的一轮旅游搜索,所以微博指数会出现大幅攀升。对其余8个城市而言,旅游资源数量及质量不如武汉市,在全国的知名度也没有武汉高,被搜索数据也验证了这一点。

除此之外,原创性微博的发布条数也可以用来分析城市[18]。可以用来表示某一时段内某城市在互联网上的热度。首先是利用微博搜索的筛选功能,筛选出以文字为主,包含图片或视频为形式的微博内容,作为计数依据,这样可以确保计数的准确性,排除非原创性微博。在时间维度上,筛选出从4月30日至5月5日共6天发布的微博条数(表2)。可以看出武汉市的原创性微博条数是155681条,而其余8个城市微博条数之和为6232条,武汉一个城市的微博条数是其余8个城市总和的25倍。将其标准化赋值后发现,假设武汉的原创性微博数是100,其余8个城市最高的黄石是1.99,其余7个城市均未超过1。

同时,从表1和表2可以看出,微博指数越高的城市,其被搜索的次数越多,包含该城市名的原创性微博也越多,数据之间表现为正相关。微博指数高说明该城市有较强的吸引力,网络空间城市热度较高。

表2 武汉城市圈2021年五一假期原创性微博条数表

2.2 基于百度迁徙数据和腾讯位置大数据的实际空间城市热度分析

2.2.1 武汉城市圈城市迁出、迁入规模指数分析

通常,将人群短期离开居住地城市,迁入其他城市的行为定义为迁徙,很多学者利用不同城市之间人群迁徙情况,反映城市之间联系紧密度。城市迁出规模指数,表现为人群离开某城市的一个综合量化指数。城市迁入规模指数,表现为人群来到某城市的一个综合量化指数,一个城市迁入指数高,说明该城市吸引力越高。

通过Python软件在百度迁徙网站(http://qianxi.baidu.com/)采集4月30日至5月5日共计6天的城市迁徙规模源数据,整理武汉城市圈9个城市迁徙规模指数,得出2021年五一期间武汉城市圈迁出规模指数表(表3)、迁出规模指数变化图(图2)和2021年五一期间武汉城市圈迁入规模指数表(表4)、迁入规模指数变化图(图3)。

图2 2021年五一期间武汉城市圈迁出规模指数变化图数据来源:基于百度迁徙规模数据整理

由表3和图2可知,武汉迁出规模远远超过其余8个城市。从武汉市迁出到其余8个城市的迁出规模指数在5月1日到达了最大值21.53,在5月4日达到最小值为5.39,其平均值达到10.27,其6天的迁出规模总值达到61.64,而其余8市的6天迁出值总和为50.36,武汉市迁出总值是其余8个城市迁出总值的1.22倍。其余8个城市中,迁出规模指数平均值从大到小依次是黄冈、孝感、黄石、咸宁、鄂州、仙桃、天门、潜江。将迁出规模指数标准化赋值后,可以看出武汉市的标准化赋值是其余8个城市的10倍左右。而在假期的迁出规模指数变化中,武汉市假期之初迁出规模指数高、假期末期迁出规模指数低,其余8个城市,大多遵循假期之初低于假期之末,除黄石市和鄂州市外,其他城市均在五一结束的5月4日或5月5日出现迁出规模指数最大值,说明其余8个城市在假期期间旅游吸引力不足,但假期结束之后外出人员较多。

表3 2021年五一期间武汉城市圈迁出规模指数表

由表4和图3可知,武汉迁入规模指数远远超过其余8个城市。武汉市迁入规模指数在5月5日到达了最大值14.29,其6天的迁入总值达到53.10,而其余8市的六天迁入规模值总和为57.95,武汉市迁入规模总值是其余8个城市迁入规模总值的0.92倍。其余8个城市中,迁入规模指数平均值从大到小依次是黄冈、孝感、黄石、咸宁、鄂州、仙桃、天门、潜江。将迁入规模指数标准化赋值后,可以看出武汉市的迁入规模指数是其余8个城市的3倍-20倍。而在假期的迁入规模指数变化中,武汉市迁入规模指数日益增高,其余8个城市,均日渐降低,并且在五一结束的后两天达到最低,说明武汉市不仅假期吸引游客,也吸引更多返汉工作人员,而其余8个城市不但假期吸引游客较少,假期结束之后返城就业人员也较少。

表4 2021年五一期间城市迁入规模指数表

图3 2021年五一期间武汉城市圈迁入规模指数变化图

从迁出、迁入规模对比来看,武汉城市圈中武汉市迁出规模指数和迁入规模指数都较高。其它8个城市,迁入规模指数和迁出规模指数都较低,并且迁入规模指数更低,从标准化赋值可以看出:将武汉迁出、迁入规模指数均取1,其余8个城市迁出、迁入规模指数均在0.25之下。在6天内只有武汉市在假期内迁出规模在减少,迁入规模在增加,其他8个城市则是迁出规模在增加,迁入规模在减少。由此可推知,武汉五一期间迁入、迁出规模都较大,其余8个城市有一定迁出规模量,迁入规模量极少,8个城市大量人口向武汉迁入。

为了进一步直观的反映城市之间迁出、迁入的流量大小,本文整理9个城市的平均迁出数据和平均迁入数据,添加起点城市和终点城市的经纬度坐标;利用ArcGIS软件,构建起点和终点之间的流线,通过OD分析,可视化展现城市间的人群流动特征,如图4城市间迁出关联度和图5城市间迁入关联度所示。

图4 城市间迁出关联度

图5 城市间迁入关联度

从图4和图5可以看出,武汉市与其余8市之间迁入迁出关联度皆为第一层级,说明武汉市作为城市圈的中心城市,虹吸效应十分显著。武汉市东部城市鄂州、黄冈、黄石联系紧密,西部天门、仙桃、潜江、孝感联系紧密,呈现出以武汉市为分割的东、西两个板块,说明人口迁徙和地理空间距离正相关。分层级来看,无论迁出还是迁入。除武汉市外的其余8个城市,相互间人员流动大多处于第三等级、第四等级和第五等级,联系相对不足。

2.2.2 基于腾讯位置大数据的城市热度分析

腾讯位置大数据可以反推出在某时间点或时间段内请求定位的用户的空间描述,反映出人口在空间聚集程度。在本文中,选用假期中期5月3日早晨10点20分至5月3日晚上22点20分每1h的定位签到数据作为研究对象,共计190061条数据。为刻画一天内定位次数整体水平,对数据进行清洗整理,即在相同坐标下的定位次数取平均值,最终得出从早晨10点—22点共计13个时间点下唯一取值坐标点的定位次数,共计4160条数据,采用ArcGIS软件进行核密度分析,得出武汉城市圈人口空间聚集核密度分析图,如图6所示。

图6 武汉城市圈人口空间聚集核密度分析图

由图6可见,武汉城市圈中,人口集聚程度最高的依然是武汉,第一、二和三等级密度都集中于武汉市,其余8个城市除孝感、鄂州、黄石有零星点状第三等级密度,其余城市积聚程度主要是第四等级以后,而且最低等级占比最大。在武汉市范畴内:人口密度较高区域主要集中于武汉市主城区,人口密度由中心区向外围圈层式减少,人口密度第一等级表现为双核心,主要布局在武汉市内环中,说明武汉市有非常明显的多中心发展特征。武汉主城区第一等级区域主要为主要商业中心、商业步行街、主要风景区、公园以及各类交通枢纽地区等,其余8个城市,定位频率相对较高的区域,大体包含了汽车站、火车站、热门旅游景点,还包括沿着高速公路或者国道、省道分布的情况。从人口空间核密度分析可知,其他城市凝聚人口规模和武汉市凝聚人口规模差距十分悬殊。

3 结论与讨论

城市热度主要包括网络空间城市热度和实际空间城市热度。本文通过构建武汉城市圈假期期间城市热度分析模型,以微博指数大数据、百度迁徙数据、腾讯位置大数据等多源网络大数据为基础,以武汉城市圈为研究对象,运用GIS的OD分析、核密度分析等方法,分析了疫后假期武汉城市圈网络空间和实际空间城市热度特征,其结论如下:

网络空间城市热度主要通过微博搜索指数和微博原创指数分析,在微博搜索指数中武汉被搜索总量约是其余8个城市总量的170倍;在微博原创指数中武汉原创微博指数约是其余8个城市总量的25倍,武汉在网络空间中城市热度非常高,其他城市较弱。实际空间城市热度通过百度迁徙大数据和腾讯位置大数据衡量。武汉迁出迁入指数均远超其余8个城市,武汉市作为城市圈的中心城市,虹吸效应十分显著,其余8个城市,迁入指数和迁出指数都较低,并且迁入指数更低,说明在假期旅游吸引力不足,假期结束之后外出工作人员较多。在武汉城市圈中,无论是网络空间城市热度还是实际空间城市热度,武汉城市热度非常高,尤其是网络空间城市热度,其他城市与武汉差距更加悬殊。可以看出,地域临近因素在实际空间城市热度中有一定作用,对网络空间城市热度影响较小。

基于以上结论,湖北省在大力发展武汉城市圈一体化发展过程中,不仅要注重实际空间交通、大型基础设施等一体化发展,也要注重通过旅游资源整合、历史文化提升等方面提高其余城市的网络热度。本研究主要分析了武汉城市圈2021年五一假期期间的城市热度,在以后研究中将进一步分析更多年份的假期,使其准确性进一步提高。

猜你喜欢
武汉市百度规模
武汉市勘察设计有限公司
50亿元!目前规模最大的乡村振兴债券发行
武汉市中小学优秀自制教具评选活动成功举办
Robust adaptive UKF based on SVR for inertial based integrated navigation
武汉市勘察设计有限公司
规模之殇
百度年度热搜榜
Mentor Grpahics宣布推出规模可达15BG的Veloce Strato平台
百度医生
百度“放卫星”,有没有可能?