刘彦花 梁永佳 王茜茜
[摘 要] 以到访广西的游客为研究对象,基于网络爬虫技术,提取游客在网络游记中所记录的旅游时间、客源地、目的地、交通方式、逗留天数、玩伴以及旅游消费等信息,通过描述性统计分析,挖掘广西游客旅游行为特征。研究发现:游客主要来自广西、广东,以及上海、北京等经济发达的城市或地区;游客首选旅游目的地为桂林、阳朔;游客出游时间主要集中在4月和7-8月;省外游客多采用飞机或高铁为到达交通工具,逗留天数以3-5天居多,广西本地游客以自驾为主,逗留天数一般为1-2天;游客以三五好友结伴旅游居多;旅游人均消费按统计类型不同有所差异,按逗留天数,逗留6天人均消费最高;按结伴情况,情侣结伴人均旅游消费最高;按交通工具,以飞机为交通工具的消费最高。
[关键词] 网络游记;旅游行为;广西
[中图分类号] F590[文献标识码] A[文章编号] 1009-6043(2020)09-0066-03
一、引言
随着人们生活水平的提高,以及便捷的交通网络,旅游日益成为人们在现代快节奏生活中的一种心情调味剂,是人们休闲、娱乐、放松心情、增进情感的一种精神愉悦方式。因此,旅游行为特征研究也成为学者们的关注重点。在以往的旅游行为研究中,学者们主要基于问卷调查获取游客的旅游行为数据,并开展了一些特殊群体的旅游行为研究,如大学生[1]、青年女性[2]、老年人[3]、农村居民[4]、打工旅游者等[5];或某些特殊景点游客的旅游行为研究,如张家界[6]、昆山市周庄等[7];或某种特殊旅游行为的研究,如旅游消费行为[8]、目的地选择行为等[9-10];以及各种形式不文明旅游行为研究等[11]。然而,随着旅游环境、信息渠道、交通方式、宣传手段和游客个体差异的多元化与多样化,旅游行为研究的视角也不断被拓展[12]。信息时代,人们通过博客、微博、QQ空间、微信朋友圈、论坛等网络社区交流信息、表达观点乃至人际交往。从旅游角度,越来越多的游客会在旅游前通过网络获取旅游地景点信息,作为制定旅游攻略的参考和依据,又会在旅游后通过网络发布自己的网络游记,这种方式使网络与旅游的融合更加深入。近年来,部分学者基于网络文本开展了旅游方面的研究,如段正粱等基于携程网205篇淡季出游的网络游记,分析了游客在淡季出游的行为特征[13];阮文奇等基于人民网旅游3·15投诉平台数据开展了旅游投诉对象、主题等内容的关联性分析[14];吴开军等通过112例来自于自媒体的网络游记,分析了中国大陆游客在美国旅游景点、酒店、消费、交通、安全等方面的感知状态[15]。网络游记作为游客旅游过程的真实再现,其客观性、完整性、便捷性为旅游行为研究提供了更加丰富的数据基础和数据获取手段。本研究基于游客发布于旅游网站的网络游记,从时间、空间、交通工具、玩伴、消费等方面归纳总结到访广西游客旅游行为特征,从而为广西针对不同客源地的不同人群开展合适的旅游景点宣传并制定合理的游览路线提供参考,更好地促进广西旅游业的可持续发展。
二、研究设计
(一)研究方法
本研究利用网络爬虫技术(Web Crawler)获取数据。网络爬虫技术是根据一定规则自动抓取网页内容的程序,是互联网信息采集的新兴工具。通过设置网络爬虫规则,可以从某一个网址开始,访问其关联的其它网址,并提取各網页中用户所需要的有价值的信息。本研究采用八爪鱼网页采集器来实施旅游信息采集,八爪鱼采集器是一款简单实用的网络爬虫软件,其原理是通过设置规则不断重复一系列预设任务,替代人工浏览网页并复制粘贴页面信息,从而实现网页信息的自动化采集。
(二)研究样本
本研究以游客发布在“去哪儿网”的网络游记为搜索范围,将2013年以来游客发布的以广西为目的地的游记作为搜索目标,在网络游记信息采集过程中,首先在“去哪儿”网站搜索以广西为目的地的所有网络游记,并将该网址作为网络爬虫的目标网址,之后在软件中设置翻页循环并创建列表循环,再打开一篇游记设置需要提取的信息,最后开始信息采集,信息采集完成后导出为EXCEL表格数据。通过删除重复的、不合要求的或行程不完整的游记、整合同一游客发表的同一行程的多段游记,共收集到1664条有效的完整网络游记。游记共涉及到300多个景点分布于广西63个县(市、市辖区)。在客源地和目的地空间格局分布上,为简化分析,本研究以1664条网络游记数据中景点所在的63个县(市、市辖区)作为研究单元,文中所指的广西南宁、桂林、北海等地级市,均特指市辖区。所收集的游记样本中,内容涉及到游客出游时间、客源地、目的地、逗留天数、交通工具、玩伴、旅游消费等方面的信息。
三、游客旅游行为特征分析
(一)时间特征分析
1.出游月份分布特征。由于景点属性的差异,景点所属地域气候的不同,以及游客本身的要求和假期长短的限制,每个月适合旅游的地方会有所不同。通过对1664条游记的旅游月份统计,到广西旅游的游客高峰出游时间集中在4月份和7-8月份,出游次高峰月份为10月、9月、5月、6月和2月,各月份客流量样本数及占样本总数的百分比如表1所示。
由表1可知,各月份的旅客流量有差异但没有明显反差,这不仅受旅游者假期影响,也受旅游地旅游性质和气候影响。广西常年气候温和,阳光充足,5-9月份钦北防沿海一带对于滨海旅游的游客来说均是最佳旅游的季节,且广西的4月份有清明节和三月三两个小长假,九月份有东盟博览会假期,再加上五一劳动节和十一国庆节、春节、寒暑假等,很好地解释了广西入境旅游的季节出行规律。
2.逗留天数分布特征。游客逗留天数主要由其假期长短决定,同时也会因距离、交通、景点属性等原因适当调整旅游时长。据本次样本游记资料统计,游客在广西旅游的逗留天数从1天到几个月不等,以逗留3-5天的游客量居多,占游客总量的60.4%,各逗留时间游客样本量及占样本总数百分比如表2所示。
(二)空间特征分析
1.客源地空间分布格局。当前,广西旅游业正以蓬勃发展的势头大步向旅游强区迈进,全区旅游综合实力不断增强,全域旅游发展势头强劲。随着各景点知名度的不断提高,以及旅游交通网络、旅游配套设施和旅游管理措施的不断完善,广西正吸引着越来越多的外地游客。统计本次游记样本数据发现,从省域角度,游客来自于全国28个省级行政区或直辖市(图1),其中排名前四的区域依次为广东、广西、上海、北京,其游客量约占样本总量的59%;从市域角度,旅客来自全国117个地级市或直辖市,游客客源地所在城市样本数量排名靠前的依次为广州、上海、南宁、北京、深圳、成都、重庆、桂林、武汉、西安等地,上述城市除广西桂林和广东深圳之外,其余均分布于经济发达的直辖市或省会城市。
2.游客目的地空间分布。旅游目的地是旅游体系中的主要要素,也是旅游活动中最重要和最有生命力的部分,旅游目的地吸引游客的多少,不仅由景点本身的知名度决定,也与旅游地的旅游形象、景点属性和交通通达能力等息息相关,统计本次游记样本数据游客行程数据,绘制广西各县(市、市辖区)游客数量空间分布如图2所示。
根据各地游客量统计可知,广西最受欢迎的旅游区域为阳朔、桂林,其次为北海,到上述区域的游客流量占样本数据总流量的66%。众所周知,桂林山水甲天下,阳朔山水甲桂林,北海有被称为中国第一滩的银滩,也有中国地质年龄最年轻的火山岛——涠洲岛,许多慕名而来的游客均会将这些知名度高的区域作为广西旅游的目的地首选。作为广西首府的南宁,虽有1个5A级景区,但其知名度远不如桂林、阳朔、北海等地,其游客数量也远低于上述三地。
(三)交通特征分析
旅游交通既是游客抵达目的地的手段,也是在目的地内活动往来的工具。当前常用的旅游交通类型有航空、铁路、公路等。统计本次样本数据发现,游客从客源地到目的地的交通主要有飞机、高铁(动车)、普通火车、自驾汽车、大巴等交通工具,且以飞机和高铁居多,占游客总量的64%,各种类型的交通工具占游客总量的百分比如表3所示,表中其它类包括游轮、骑行、公交及徒步等。
游客在广西旅游期间,各景点间的流动77%采用出租车、高铁、包车、大巴、骑行、电动车、游轮、公交、地铁等交通工具中的任意三种或三种以上混合交通,其中同一行政区域的不同景点之间多选择公交车、出租车等交通工具,不同行政区域的景点之间多选择动车或大巴等作为交通工具,这类游客一般是省外既未报团也非自驾的自助游客,其在景点之间的流动可根据景点间的交通方式便捷度随意选择。其次,有13%的自驾游客在景点间的流动仍然采用自驾方式,其余10%的游客分别使用包车、报团大巴、骑行、电动车、徒步、公交等任一种交通工具作为景点间的流动手段。
(四)旅游结伴特征分析
在当下快节奏的社会中,朋友、亲人之间的交流主要通过电话、短信、微信、QQ等通讯工具,缺少更多直接、当面沟通的机会,旅游作为一种愉悦性的个人或集体休闲行为,已日益延伸成为朋友、家人、情侣之间加强交流、增进情感的一种行之有效的方式;对于一个人而言,旅游也是缓解压力、放松心情、调整状态、提升自我的有效方式。分析本次样本数据发现,更多的人选择与三五好友一起出游,其次是家庭一起出游,两种出游结伴方式约占游客总量的50%。各类出游结伴方式统计数量如表4所示。
(五)旅游消費特征分析
旅游消费是在人们基本生活需要满足之后而产生的更高层次的消费需要,它不仅与游客本身的收入水平相关,也与旅游的交通工具、旅游者结构、旅行距离和时间长短密切相关。排除旅游购物,只考虑旅游必要消费的情形下,分析样本数据游客的人均每天消费,按逗留天数统计,逗留天数为6天的游客人均消费最高,平均每人每天474元;按玩伴统计,情侣一起出游的游客人均消费最高,平均每人每天488元;按交通工具统计,以飞机为交通工具的游客人均消费最高,平均每人每天564元;按客源地统计,以黑龙江游客消费最高,平均每人每天消费743元。各类统计如图3所示。
四、结论与建议
(一)结论
通过对到访广西游客旅游行为特征研究,本研究得出以下结论:
1.广西是适合一年四季旅游的省份,其中4月、7-8月是广西的旅游旺季,游客倾向于选择山水观光游和滨海度假游,这一出游行为受广西气候特点、地貌特点和沿海区位属性共同影响。
2.区域游客量与其区域的景点知名度高度相关,游客倾向于将知名度高的景点所在区域作为其旅游目的地首选。
3.广西区外游客的客源地主要为广东、上海、北京;而广西区内游客客源地主为来自南宁,占广西区内游客总量的55%。
4.游客出游逗留天数跟客源地与目的地距离呈正相关关系,距离越近,可以充分利用平时的小短假分多次游览不同景点,而距离太远,出游一次不容易,所以一次旅游逗留的时间会更长一些。
5.游客出游到达目的地选择的交通工具受客源地与目的地的距离、交通状况及出游天数共同影响。广西区内游客主要选择自驾,邻省的广东游客主要选择高铁,其它外省游客到则以飞机和高铁为主。
6.自助游越来越受游客的追捧,游客出游结伴的方式更加多样化,其中三五好友、家庭出游的结伴方式成为主流。
7.游客人均每天消费受逗留天数、交通工具、玩伴、距离等共同影响。
(二)对策建议
根据到访广西游客旅游行为特征分析结果,为更好地促进广西旅游业可持续发展,可从以下方面着力改进不足,完善旅游管理。
1.打造景区特色,提高景区知名度。目前很多区域的A级景区为市内的休闲公园,这类景区特色不明显,是本地市民散步休闲的好去处,但对外地游客来说,吸引力不强;此外,有些景区的特色比较鲜明,但由于其知名度不高,游客主要来自于本省各县市。对于此类景区,需着力加大景区宣传力度,提升知名度,提高景区等级,吸引更多省外游客。
2.加强旅游交通基础设施建设,改善旅游环境。有些县市的景点特色和知名度都可以,但由于交通不便导致旅游吸引力不大,如大新德天跨国瀑布、凭祥市友谊关景区、长寿之乡的巴马水晶宫、盘阳河景区等,这些景区的共同点是所属行政区域都没有高铁站,有些地方甚至没有普铁和高速公路,只能乘坐大巴走二级公路前往。对于此类景区,需着力完善旅游交通网络,从而吸引更多区内外游客。
[参考文献]
[1]王伟,康娜,冯晓丹.大学生旅游行为及市场开发策略探讨[J].河南理工大学学报(社会科学版),2018,19(1):41-47.
[2]蒋美华,梁晶晶.网络自媒体影响下的青年女性旅游行为研究——以河南省为例[J].山东女子学院学报,2018(4):17-22.
[3]李真,李享,刘贝贝.补偿性消费理论视角下老年人旅游行为心理依据研究——以北京城市老年人为例[J].干旱区资源与环境,2018,32(4):196-202.
[4]冯文勇,任瑞萍.山西省农村居民旅游特征研究[J].干旱区资源与环境,2015,29(11):214-218.
[5]徐红罡,唐香姐.流动性视角下打工旅游者行为特征研究——以大理古城为例[J].人文地理,2015(4):129-135.
[6]唐承财,于叶影,杨春玉,等.张家界国家森林公园游客低碳认知、意愿与行为分析[J].干旱区资源与环境,2018,32(4):43-48.
[7]张宏,黄震方,琚胜利.水乡古镇旅游者低碳旅游行为影响因素分析——以昆山市周庄、锦溪、千灯古镇为例[J].旅游科学,2017,31(5):46-64.
[8]余凤龙,黄震方,侯兵.价值观与旅游消费行为关系研究进展与启示[J].旅游学刊,2017,32(2):117-126.
[9]余凤龙,黄震方,陆林,等.发达地区农村家庭旅游目的地选择行为特征与影响机制——以苏南地区为例[J].地理学报,2016,71(12):2233-2249.
[10]王赞赞,冯文勇,张晋华,等.五台山风景区游客目的地选择影响因素分析[J].干旱区资源与环境,2018,32(3):198-202.
[11]姚田田,方旭红,肖利斌.基于网络文本的旅游不文明行为公众认知研究[J].旅游论坛,2018,11(2):64-73.
[12]劉锐,李涛,齐先文.中国居民出境旅游行为演化研究以2005-2015年旅新(新加坡)游客为例[J].资源开发与市场,2018,34(5):686-692.
[13]段正梁,吴秀英,张璇,等.基于网络文本分析的游客淡季出游行为研究[J].旅游研究,2017,9(6):54-64.
[14]阮文奇,李勇泉,赖红香.基于网络文本的我国旅游投诉特征分析[J].旅游研究,2018,10(4):10-19.
[15]吴开军,赵燕.中国大陆游客对美国旅游感知研究[J].旅游研究,2019,11(1):16-25.
[责任编辑:王凤娟]