网络大数据技术在古典园林规划中的应用

2019-05-15 05:53王晨雨常雪松潘运伟董宇恒王彬汕
旅游纵览·行业版 2019年2期
关键词:颐和园长廊游人

王晨雨 常雪松 潘运伟 董宇恒 王彬汕

古典园林的服务对象在当代发生了显著变化,从历史上为少数达官显贵服务变成为当代为人民大众服务。由于服务对象发生变化,所以知名园林景区在高峰期发生拥堵拥挤的现象屡见不鲜。颐和园是中国古典园林的杰出代表,是北京古都文化旅游的核心景区之一,目前也存在高峰超载、客流时空分布不均等问题。本文以网络大数据为基础,揭示了颐和园游人空间分布特点和游线组织特征:第一,颐和园游人分布呈现北多南少,东多西少的特点;第二,游人线路组织主要有5条,其中北宫门——佛香阁——东宫门一线比例最大;第三,北宫门与佛香阁,长廊西与石舫,南湖岛与十七孔桥三组景点的关联度最大。

引言

颐和园是中国古典园林的杰出代表,坐落在北京西郊,占地约290 hm2,是三山五园的核心组成部分。颐和园2017年接待1 700万人次游人(含免票游人),是北京接待游人最多的景区。如此大的客流给颐和园的游人管理带来极大压力。一是高峰超载,小长假和黄金周期间日均接待游人量一般超过12万人次,远远超过《颐和园总体规划》所核定的日容量6.1万人次游人量。二是时空分布不均,突出表现为北多南少,东多西少,同时核心景点游人超载,给遗产保护带来比较大的隐患。

目前,学术界对颐和园的客流不平衡问题的关注较少。黄潇婷(2009)研究了颐和园六类客流流向,但对游人的时空分布特点研究不足。她还以GPS追踪调查的数据为基础,比较了其与传统的活动日志调查方法的利弊。黎巎(2014)运用Agent模型探索颐和园全园客流预测与调控的方法。本文结合《颐和园风景区总体规划》编制工作,重点介绍在颐和园中运用大数据研究客流的技术方法和主要结论。

一、技术路线与方法

(一)数据来源

以全网游记数据为基础,包括携程、马蜂窝、去哪儿、同程、穷游和猫途鹰等旅游网站抓取颐和园相关的游记文本素材,得到50 00余篇游记,共约300万字文本素材。

(二)技术流程

技术流程步骤包括数据抓取、数据清洗、轨迹抽取和轨迹分析几个部分。

1.数据抓取

利用八爪鱼等网页爬虫工具获取颐和园游记数据。首先了解每个游记网站的网页结构,利用XPath导航找准网页中的标题、正文和其它结构化数据的节点位置,并在爬虫软件中设置自动翻页、列表循环、详细页进入、文本定位和数据抓取等流程,通过Ajax(主要用于页面的异步加载)、休眠时间和特殊锚点定位等动作调试流程无误后,进行颐和园游记数据的自动采集和抓取。

2.数据清洗

对游记文本数据进行本地筛选处理。删除重复内容,删除按照正则表达式抽取出的网站模板和广告等无效数据,删除过短或纯符号等无意义素材,最后共得到的5 000余篇(即5 000余条行程),共约300万字游记素材,保存为纯文本格式文件。

3.轨迹抽取

利用excel进行轨迹抽取。将已经掌握的全部颐和园景点和停留节点作为行内容,将每一条行程作为列内容,利用find函数查找每个节点是否出现在每条行程中,以及出现的具体字节位置,根据出现的字节位置进行排序构成单条行程中的游人轨迹。对5000条行程进行相同操作,形成5 000条游人轨迹。如图1所示。

4.轨迹分析

以客流轨迹线路图为基础,对客流轨迹进行聚类分析、轨迹密度分析、关联力分析。其中,聚类分析可获取游人的主要游线,轨迹密度分析能够反映游人的空间分布特点,关联力分析可以揭示两两景点之间的联系强度。

二、游人分布特征

(一)客流轨迹

通过聚类分析,排除明显不合理的线路“噪音”后,共得出5条主要线路如下。

线路1:东宫门—长廊—佛香阁—万寿山—苏州街—北宫门。

线路2:北宫门—苏州街—万寿山—佛香阁—石舫—仁寿殿—十七孔桥—新建宫门。

线路3:新建宫门—南湖岛—石舫—长廊—仁寿殿—东宫门。

线路4:东宫门—长廊—石舫—长廊—东宫门。

线路5:南如意门—南湖岛—文昌院—长廊—佛香阁—北宫门。

游人主要线路见图1。

从客流轨迹反映的情况来看,主要有如下各个特点:线路1是游人选择最多的游线,其次为线路4;经过西堤、山后地区的游览线路比较少;游人出入口主要集中在北宫门、东宫门,新建宫门、南如意门次之。这些特点出现的主要原因在于地铁4号线在北宫门设站,北京观光三线的终点站也位于北宫门。东宫门是颐和园正门,一般游人会选择东宫门出入颐和园,另外东宫门外有公交场站和停车场,游人来此也比较方便,因此,从东宫门出入的游人较多。新建宫门距离颐和园核心景点南湖岛较近,因此,也有不少游人选择从新建宫门出入。从南如意门出入的游人主要来自于长河、昆玉河游船的游人。

(二)客流密度

从客流轨迹密度来看,主要呈现如下几个特点。

首先,颐和园客流整体呈现北密南疏,东多西少的特点。客流轨迹密度见图2。

其次,图2中的线路1是游人最多的一条线路,即北宫门—苏州街—佛香阁—长廊—东宫门。

最后,所有游线都经过长廊一线,这也是造成长廊旅游高峰期较为拥堵的重要原因。除此之外,当地的热门景点还有南湖岛、玉澜堂、东宫门等,在旅游旺季,过大的游客量给文物和遗产保护带来较大压力。

(三)景点关联度

关联景点反映的是游人线路组织过程中的景点联系强度特征。从图3反映的情况来看,主要有3組关联度比较密切的景群,分别是北宫门—佛香阁、长廊西—石舫、南湖岛—十七孔桥。此外,北宫门—石舫、北宫门—长廊西、北宫门—东宫门和新建宫门—十七孔桥等景点的联系度也比较紧密。

景点间联系越紧密,2个景点间聚集的游人密度就越高,基于微博数据所作的游人热力图也直接证明了这点(图4)。上述3组关联度比较强烈的景点,极易在旅游高峰期形成拥堵,需要相关人员在实际管理中妥善应对,以保障旅游安全和遗产安全。

三、结论与讨论

本文以网络大数据为基础,揭示了颐和园游人空间分布特点和游线组织特征。作为一种新的技术方法,网络大数据技术具有数据开放、展示直观、费用低廉等优点,能够有效展示游人分布特征和游线组织形式,无论在古典园林规划设计,还是在园林和公园管理方面都具有非常重大的意义。在古典园林规划设计方面,其分析结果能够为空间和线路调整提供支撑;在园林和公园管理方面,能够促进古典园林和公园管理升级,从而提高游人的游览品质。

网络大数据在揭示游人空间部分方面具有一定优势,通过颐和园的案例可知,其也呈现出较好的效果。其不足之处在于以下几点。第一,数据的有效性问题。目前一些旅游网站上存在营销“软文”的现象,即不是真实的游人所写的文章,这部分数据会对结果产生影响,但影响到何种程度还有待于进一步研究。第二,网络大数据虽能够比较好地反映空间方面的特征,但不能反映时间特征,未来人们可以结合手机信令的实时数据进行进一步优化。

(作者单位:北京清华同衡规划设计研究院有限公司旅游与风景区规划所)

猜你喜欢
颐和园长廊游人
颐和园
酌古参今——颐和园文化遗产之美
登神农顶
颐和园导游词
漫画长廊
漫画长廊
漫画长廊
漫画长廊