基于文本挖掘的古镇旅游形象感知研究——以朱家角为例

2013-11-16 03:24冯学钢吴文智
旅游科学 2013年5期
关键词:朱家角长尾词条

王 媛 许 鑫 冯学钢 吴文智

(华东师范大学商学院,上海 210046)

游客的旅游感知是游客对旅游地的一种认识和评价。按照游客旅游行为的进行阶段,可以将游客感知划分为本底感知、决策感知、实地感知和最终感知(薛会娟,2008)。最终感知是指游客游览活动结束后,根据游览经历对旅游地信息进行再加工后抽象、提炼出的对旅游地的最终认识,也称作旅游认知(白凯,等,2008)。通过对最终感知的研究,可以了解游客对本次游览活动的认识与评价,对旅游地的营销、规划有积极意义。长三角地区江南古镇众多,但同质化竞争的情况也较为严重,如何体现地方特色进行差异化竞争,成为困扰这些古镇的重要问题。从游客对旅游地的感知中识别旅游地可供开发利用的地方特色,可以为旅游地的差异化发展提供借鉴。写博客是互联网时代游客表达最终感知的一种十分方便的途径,游客可以自愿、主动地在博客上发布旅游经历及感受,且博文信息不会随研究者的主观意见而改变。本文通过博客这一游客游览结束后的文字记录来了解朱家角游客的游后感知,以期对古镇朱家角的旅游发展提供借鉴。

1 研究综述

游客感知研究由于其现实及理论意义一直是学者们研究的热点问题。游客感知的相关研究主要集中在游客视角的旅游地形象研究(王岚,等,2010;程乾,付俊,2010)、游客感知的时间或空间差异研究(高军,等,2010;杨杰,等,2009)以及影响游客感知的因素研究(乌铁红,等,2009;贾跃千,等,2009;余意峰,等,2010)等方面。在这些研究中,游客视角的旅游地形象感知研究是游客感知研究的重要内容,也是其他研究的基础。问卷调研是目前游客感知研究最为常用的数据获取方式(王岚,等,2010;程乾,付俊,2010;高军,等,2010;杨杰,等,2009;乌铁红,等,2009;贾跃千,等,2009;余意峰,等,2010)。然而问卷调研虽然可以较为深入地围绕主题展开研究,对统计上概率较大的内容反应明显,但对概率较小的隐含信息却较少涉及。为避免研究人员主观因素的影响,问卷问题的设计必须具有较强的科学性。此外,问卷法调查游客感知还应考虑问卷发放时间(游客游览阶段)对调查结果的影响,对问卷发放的科学性、合理性也提出更高要求。

游客对旅游地形象的感知还可以通过游客的博客、在线评论等用户生成内容(user-generated content)得到反映。博客、在线评论等作为游客在整个旅游活动结束后的总结或记录,是分析游客对旅游地最终感知的重要窗口。不同于旅游网站一对多的信息交流方式,博客是一种多对多的信息交流平台(Litvin,et al.,2009),可以通过有效方法对其进行信息获取、总结和重塑,从而为旅游目的地提供有用信息(Akehurst,2009)。随着互联网的蓬勃发展,游客的网上评论、博客(网络日志、游记)等引起了学者们的关注,正在发展成为一种新的研究资料来源(Pan,et al.,2007;Choi,Lehto,2007;冯捷蕴,2011;张高军,等,2011)。但目前利用网络博客进行的游客感知研究大多经过了博文的选取过程(冯捷蕴,2011;张高军,等,2011),这便使得样本的选取较多地受到作者主观因素的影响;分析方法上主要为语义分析法,受工作量限制,样本量较小(一般为15篇~100篇)(冯捷蕴,2011;张高军,等,2011)。文本挖掘技术可以从海量Web文档中抽取研究者感兴趣的潜在的有用模式和隐藏信息(韩家炜,等,2001),从而发现人工的内容分析法可能忽略的一些信息;同时样本直接从网络上抓取而来,避免了作者主观因素的影响。

综上,“博客+文本挖掘”的组合,为目的地形象游客感知研究提供了游客自产生的海量信息数据和不同于传统感知形象研究的新思路,增强了样本选取的客观性,保证了数据获取更加全面。因此,本文采用文本挖掘方法,从游客撰写的博客中抽取信息,站在旅游者游后感知的角度分析古镇朱家角的旅游形象,以发现朱家角旅游形象中隐含的有意义的内容。

2 文本挖掘及数据处理

2.1 朱家角概况

朱家角镇位于上海市青浦区中南部,紧靠淀山湖风景区,距离上海市中心48公里。东有沪宁高速公路,西有沪杭高速公路。古镇面积2.7平方公里,是周庄面积的3倍多。朱家角历史悠久,旅游资源丰富,素有“江南明珠”之称,是上海四大历史文化名镇之一。

朱家角有三多:名人多,明清建筑多,河埠、缆石、茶馆多。朱家角河港纵横,9条长街沿河而伸,千栋明清建筑依水而立,36座石桥古风犹存,名胜古迹比比皆是①朱家角旅游网 http:∥www.zhujiajiao.com/cn/a_brief.asp。,有“上海威尼斯”的美称。朱家角比较著名的景点有放生桥、北大街、课植园、城隍庙、圆津禅院、童天和大药房、大清邮局等。放生桥是长三角地区最大的五孔石拱桥;北大街是朱家角最繁华热闹的街巷,现在也是朱家角旅游特产、特色小吃的集中地;课植园又称“马家花园”,是朱家角最大的庄园式私家园林,环境幽静。由于朱家角镇的年轻人大多外出工作,留下很多老人居住镇上,所以随处可见阿婆和阿婆茶、阿婆棕等。粽子、臭豆腐、豆腐干、扎肉、酱菜等是朱家角的特色小吃,价格低廉,方便购买,吸引了不少游客。可以说朱家角既具有通常江南古镇的特点,又有着自身独具特色的一面。

2.2 数据采集与处理

新浪博客是新浪网的网络日志频道,上线于2005年,是全国人气颇高的主流博客频道之一②百度百科 http:∥baike.baidu.com/view/4158.htm。,故本文选取新浪博客作为博文样本来源,对以“朱家角”为标签的所有博文进行检索,得到2 854篇博文。于2011年10月29日使用软件“火车头采集器V2010SP3”采集博文数据,删除死链接和无法打开的网页,最终得到2006年10月1日至2011年10月26日期间发表的2 633篇博文③所采集博文样本中存在重复样本317篇,非游客游记185篇。经甄别,两类均包含163篇“水都南岸”房地产项目软文,具体表现为3种篇幅较短的广告形式,博文内容对结果影响较小,可忽略不计。除此以外,以转载形式出现的154篇重复游记体现了博主对被转博文内容的认同,具有可供分析朱家角形象感知的功能。非游客游记中包含的另22篇非“水都南岸”广告博文,占全部博文的0.8%,对分析结果的影响在可容许的误差范围内,故未做进一步处理。。

采用“庖丁解牛”中文分词软件进一步对已筛选的博文进行分词处理,得到65 888个词条以及各词条出现频次。按照词条出现频次高低进行排序,剔除冗乱词条,如“大”、“都”、“没”、“要”、“才”、“的人”、“年”等意义较为广泛或没有明显指代的词,计算剩余词条出现频率(每篇博文中平均出现频次),并以此作为后续分析的基础。

3 朱家角的游客感知形象分析

3.1 高频词分析

由于样本选取的是以“朱家角”为标签的博文,故“朱家角”在全部博文当中出现频次远高于其他词条,达到10 720次。“上海”、“青浦”等指示地理位置的词出现频次也很高,尤其是“上海”一词,表现了游客对朱家角的上海特色的一种识别和认可。“古镇”、“江南”、“水乡”则是朱家角在游客心目中的形象的高度概括,它富于历史感的明清建筑、“小桥、流水、人家”的中国水乡、小镇特色在游客中有较高认同。朱家角的旅游景点中排名最高的是放生桥,“放生”词条排名第8位,词频为0.36,放生桥的高频出现集中表现了其在朱家角的旅游景点和水乡景观中的突出地位;而下一个词频较高的旅游景点“课植园”总排名仅在第28位,出现频率为0.18;“粽子”相较于其他小吃给旅游者留下了更为深刻的印象,是朱家角的第3个特色词条,但其出现频率仅为“上海”一词出现频率的十分之一,可见词频前30位的词条出现频率存在较大差异。“周庄”也出现在词频前30位的词条中,可能是由于朱家角具有的江南古镇特点使游客在游览朱家角时也联想到同类型的古镇周庄;而游客对朱家角旅游形象感知的其他词条如“古镇”、“江南”、“水乡”、“小桥”、“流水”、“人家”、“文化”、“明清”等也很好地印证了游客对朱家角江南古镇形象的认同(见表1)。

表1 词频排名前30位的词条及其出现频率

虽然这30个词条同为与朱家角形象有关的词语,但与江南古镇形象相关的词条多,而独具朱家角特色的词条很少。下文将对朱家角的感知形象进行分类,进一步讨论朱家角类别感知形象的特点。

3.2 不同类别的感知形象分析

李蕾蕾(2000)指出,游客首先通过地理空间认知链获得旅游地的空间位置信息与形象特征,而旅游者对目的地形象的进一步认知,则体现为对旅游地类型和旅游地地方性的认知。据此,本文截取朱家角的旅游形象词条中出现频率大于0.1的词条,将游客对朱家角的感知形象词条划分为地理位置、旅游地类型形象和地方性形象3类。地理位置形象由游客在博文中提及的地理位置名词构成;旅游地类型形象反映了游客对江南古镇这一类型旅游资源的感知,由于江南古镇大多已经进行了较为广泛的旅游开发,所以我们也将游客博文中出现的“旅游”、“景点”、“门票”、“景区”等词列入类型形象;地方性形象方面,根据网站“朱家角旅游”①朱家角旅游网站中文版http:∥www.zhujiajiao.com/。中的“古镇旅游”栏目以及亲身游览经验,进行了朱家角特有旅游形象词条的选取(见表2)。与表1对照发现,旅游地类型形象在前30位的词条中出现最多,地方性形象出现较少。

表2 朱家角旅游地形象的不同类别词条

将表2中的词条按照出现频率降序排列,得到不同类型的感知形象频率曲线(见图1):

图1 不同类别形象词条出现频率

“上海”是地理位置形象中最突出的,也是与朱家角有关的词条中出现频率最高的;“古镇”是类型形象中出现频率最高的词;而地方性形象中“放生”(放生桥)是游客提到最多的。虽然朱家角的地理位置形象“上海”一词出现频率最高,然而总体看来,旅游地类型形象不仅在频率上,而且在丰富性方面要高于地理位置形象。从图1中可以看出,地理位置形象出现较强的层次性,在词条出现频率方面表现为:上海>青浦>淀山湖>中国,“上海”出现频率远高于其他词,且高于其他两类形象词条;“中国”出现的频率较低,可能是由于“中国”的地理范围内涵过广,且本文分析的是中文博客,对于处于同一背景下的游客和目的地而言,“中国”一词指代性不强。可见,游客对旅游地地理位置形象感知最强的是旅游地最具代表性最鲜明的地理位置特征,而对其他更加具体或代表性稍差的地理位置形象感知程度不强,从而出现某一地理位置形象十分突出,而游客对其他地理位置形象的感知强度落后于旅游地类型形象的现象。

朱家角的旅游地类型形象强于其地方性形象,可见游客游览朱家角后,感知最为强烈的是江南古镇的整体环境氛围,而不是朱家角的地方特色。然而,江南古镇的旅游形象在周庄、乌镇等其他古镇中都可以得到体验。在朱家角有关的博文中,游客也提到了周庄、乌镇、西塘,它们的词频分别为632(0.24)、249(0.094)、237(0.090)。选取博文中提到的可能与朱家角竞争的古镇名称词条以及朱家角类型形象的代表性词条进行共现分析,并运用pajek软件绘制成社会网络图,进一步揭示朱家角与其类型形象之间的指向性关系(姚占雷,等,2011)(见图2)。图中线条的粗细代表共现频率的高低,线条越粗,表明共现次数越多,游客感知中两者的关联更加密切。结果表明,周庄等其他古镇与“江南”、“古镇”、“水乡”、“小桥”、“流水”、“人家”形象均存在关联,其中尤以周庄、乌镇为甚,主要原因是周庄、乌镇在江南古镇中的代表性较强,知名度较高。同时,古镇名称词条常常多个同时出现,表明朱家角与其他古镇的竞争体现在类型形象上,而非体现为与某一特定古镇的竞争。此外,少数游客会在博文中同时提到西递、宏村,但不管从词频大小来看,还是从共现关系看,西递、宏村的形象与朱家角类型形象的差异比较明显,大部分游客能够区分江南古镇与皖南古村落。

图2 朱家角若干类型形象词条共现分析

频率大于0.1的词条中,朱家角的旅游地类型形象的词频高于地方性形象频率,地方性形象数量也少于旅游地类型形象。但从全部词条来看,朱家角的地方性形象词条在频率小于0.1的词条中大量出现,表明依靠地方性形象开发旅游产品的潜力较大。由于江南古镇这一类旅游地的形象同质性较强,要在与周庄、乌镇、同里等的竞争中获得更大竞争优势,就需要挖掘朱家角特色的、地方性的旅游产品,凸显朱家角的地方个性与特色,提高朱家角的竞争差异性,使朱家角地方性形象可以得到更多感知。

3.3 感知形象的长尾现象分析

对众多旅游细分市场的关注,是长尾理论的一种应用(Lew,2008)。大部分对旅游目的地形象的研究都着眼于曲线头部更加大众化的、突出的形象词条,而对尾部频次较低的词条并未给予很多关注,这些位于尾部的数量居多的词条提供了旅游地潜在的利基(niche)形象信息,对其进行研究有助于旅游目的地的开发和营销,而根据利基形象开发的利基旅游产品,可以帮助旅游地有效地抓住小众旅游者(Pan,Li,2010),同时也为目的地区别于其他同类旅游目的地,开发后旅游时代产品,实现差异化竞争提供一种方式。

本文应用长尾理论,对代表朱家角游客感知形象的词频前141位的词条及其出现频率进行了曲线拟合(见图3),发现游客感知的朱家角旅游形象呈现出了幂指数分布的特征(自变量的幂为-0.611)。虽然“上海”、“古镇”、“江南”、“水乡”等位于“头部”的词条在频率比重方面占了绝大部分,但曲线出现了一条“长尾”。相较于更加符合“80/20法则”①80/20法则,也称帕累托法则,最重要的因子只占少数,不重要的因子占大多数。管理学常用来指80%的价值往往来自20%的因子,剩余80%的因子只占20%的价值。的传统的长尾曲线(乘幂曲线自变量的幂为-1),图3中感知形象曲线的头部占总体的比例小很多,更加凸显了朱家角游客感知形象曲线中“长尾”的意义。从朱家角的游客感知长尾中寻找利基市场②利基市场指激烈竞争的市场中能获取利益基础的部分(市场)。在营销中企业为避免与领先者进行正面竞争,而选择被忽视的小市场,提供专门服务并满足其需求,实现差异化竞争。,对于朱家角在江南古镇形象基础上凸显地方性形象,突出地方特色,实现差异化竞争有现实意义。

图3 朱家角游客感知形象的长尾分布

3.3.1 长尾中的非利基形象

朱家角游客感知形象曲线的“尾部”出现了“吃”、“吃了”、“吃饭”、“小吃”、“好吃”、“美食”、“吃的”等与“食”这一旅游元素密切相关的词条,可见朱家角的阿婆粽、扎肉等特色小吃对游客形成了一定的吸引力。北大街即是为游客提供阿婆粽、糕点、蹄髈、扎肉、酱菜等朱家角特产的主要街巷。

形象长尾不同于传统产品的销售长尾。传统产品销售曲线中按产品销售量降序排列,位于长尾中的即为小众旅游产品;而形象长尾中,由于景区规划、旅游者用语习惯等的原因,旅游形象不一定全部为小众的。比如,相较处于曲线的“头部”的放生桥,课植园、大清邮局、城隍庙、北大街等均位处曲线“尾部”。但这并不代表到北大街进行游览购物是比较小众的,可能是由于北大街缺少较为醒目的标识,且游客进行游览时不会刻意去记住街巷的名称,只是将其作为朱家角整体的一部分。所以说,出现在游客感知形象“长尾”中的不一定为旅游地的利基形象,也不一定是尚待开发的小众旅游产品。因此对于长尾中出现的词条,在进行小众旅游形象挖掘时要仔细甄别。

3.3.2 朱家角可开发的小众旅游产品

2008年朱家角取消了景区门票,但进入课植园、大清邮局和城隍庙等仍需购买景点门票,这在一定程度上区分了以江南水乡观光目的为主的大众游客和以深入感受朱家角历史风韵为主的较为小众的游客。目前,课植园、大清邮局和城隍庙是朱家角主要的小众旅游产品,应注重它们的精品化塑造。

咖啡店、精品小店、艺术馆、老上海等词条代表了朱家角小众旅游的另一个方面——有着现代气息的文化创意旅游。朱家角区别于其他古镇的优势在于它隶属于上海市。上海是我国经济最活跃的地区,也是我国创意文化产业发展的高地。朱家角可以借鉴“M50创意园区”和“田子坊”①M50创意园是上海具有代表性的当代艺术社区,田子坊是在上海特色的弄堂文化基础上发展起来的文化创意旅游产品,两者均为上海创意产业的典型。的发展经验,通过引入老上海元素,举办书画等艺术展览,开展文化创意旅游活动。

朱家角旅游形象的曲线表现出了较强的多元化特征,游客对朱家角形象的感知比较分散。这便更加需要旅游供给者注重对游客个性化需求的满足,结合本文词频分析结果和朱家角旅游形象特征分析等,可将上海元素和文化创意元素纳入朱家角小众旅游产品的开发中,以形成差异化竞争优势。

4 结论

(1)游客对江南古镇类型形象的感知强于对古镇具体景点的感知

朱家角的旅游开发和营销效果可以由游客的感知得到反映。从游客对朱家角的感知形象来看,给游客留下深刻印象的是江南古镇的历史文化氛围而不是朱家角具体的旅游景点、旅游产品,而游客对朱家角之行的记载中也常常同时出现多个其他古镇的内容。一般江南古镇的氛围营造对于朱家角整体环境的塑造是必要的,而只有融入上海元素和进行差异化产品开发才是增强朱家角在众多古镇中的旅游竞争力的有效途径。

(2)代表性的地理位置特征是识别旅游目的地形象的重要标识

“上海”作为朱家角的地理位置标识,在游客对于朱家角的旅游形象感知方面起到了举足轻重的作用。虽然游客对朱家角地理位置的感知整体而言弱于江南古镇类型形象的感知,但朱家角位于上海市这一独具代表性的地理位置形象却远高于朱家角的其他形象。相较于周庄、乌镇等江南古镇,上海是朱家角的独有标识,朱家角应将这一优势发挥出来,在营销时可以强调朱家角是上海都市边上的水乡古镇,并在开发时注意凸显上海元素。

(3)出现在旅游形象“长尾”部分的并非完全为利基旅游形象

旅游形象的“长尾”特征为旅游目的地提供了进行小众旅游市场开发的依据。但游客感知的旅游形象“长尾”与销售产品的“长尾”不同,由于受到旅游者用语习惯、语境以及目的地规划等的影响,形象“长尾”当中并不一定全部为利基形象,如“北大街”出现在朱家角旅游形象曲线的尾部,却不是朱家角可开发利用的小众旅游产品。需要在具体分析时进行目的地小众旅游形象的认真识别和区分。

(4)开发小众旅游产品规避同质化竞争

朱家角旅游形象的长尾分布呈现出朱家角旅游形象的多元化特征,可以通过甄别具有鲜明个性的利基形象进行相应的小众旅游产品的开发,增强和凸显朱家角的地方性形象,从而避免与其他古镇在类型形象方面的过度同质化竞争。加入老上海元素和发展文化创意旅游可以作为朱家角进行小众旅游产品开发的方向。

[1]白凯,马耀峰,游旭群.基于旅游者行为研究的旅游感知和旅游认知概念[J].旅游科学,2008(1):22-28.

[2]程乾,付俊.基于游客感知的古村落旅游资源评价研究[J].经济地理,2010(2):329-333.

[3]冯捷蕴.北京旅游目的地形象的感知——中西方旅游者博客的多维话语分析[J].旅游学刊,2011(9):19-28.

[4]高军,马耀峰,吴必虎.外国游客对华旅游城市感知差异——以11个热点城市为例的实证分析[J].旅游学刊,2010(5):38-43.

[5]韩家炜,孟小峰,王静,等.Web挖掘研究[J].计算机研究与发展,2001(4):405-414.

[6]贾跃千,宝贡敏,路文静.基于国籍差异的杭州市入境旅游市场目的地感知形象研究[J].经济地理,2009(3):510-515.

[7]李蕾蕾.旅游目的地形象的空间认知过程与规律[J].地理科学,2000(6):563-568.

[8]王岚,张捷,曹靖,等.游客感知视角下的旅游地可进入性评价研究——以九寨沟风景区为例[J].人文地理,2010(2):144-148.

[9]乌铁红,张捷,张宏磊,等.旅游地属性与旅游者感知态度和购后行为的关系——以九寨沟风景区为例[J].旅游学刊,2009(5):36-42.

[10]薛会娟.旅游地感知场的形成机理及管理对策探讨[J].人文地理,2008(1):98-101,97.

[11]杨杰,胡平,苑炳慧.熟悉度对旅游形象感知行为影响研究——以重庆市民对上海旅游形象感知为例[J].旅游学刊,2009(4):56-60.

[12]姚占雷,许鑫,李丽梅,等.网络游记中的景区共现现象分析——以华东地区国家首批5A级旅游景区为例[J].旅游科学,2011(2):39-46.

[13]余意峰,保继刚,丁培毅.基于旅游经历的目的地吸引力感知差异研究[J].旅游学刊,2010(5):51-55.

[14]张高军,李君轶,张柳.华山风景区旅游形象感知研究——基于游客网络日志的文本分析[J].旅游科学,2011(4):84-87.

[15]Akehurst G(2009).User generated content:the use of blogs for tourism organisations and tourism consumers[J].Service Business,3(1),51-61.

[16]Choi S,Lehto X Y,Morrison A M(2007).Destination image representation on the web:Content analysis of Macau travel related websites[J].Tourism Management,28(1),118-129.

[17]Lew A A(2008).Long tail tourism:New geographies for marketing niche tourism products[J].Journal of Travel& Tourism Marketing,25(3-4),409-419.

[18]Litvin S W,Goldsmith R E,Pan B(2009).Electronic word-of-mouth in hospitality and tourism management[J].Tourism Management,29(3),458-468.

[19]Pan B,Li X R(2010).The long tail of destination image and online marketing[J].Annals of Tourism Research,38(1),132-152.

[20]Pan B,Maclaurin T,Crotts J C(2007).Travel blogs and the implications for destination marketing[J].Journal of Tourism Research,46(1),35-45.

猜你喜欢
朱家角长尾词条
古镇旅游游客体验探索
灯火朱家角(油画)
长尾直销产品图鉴
长尾豹马修
追踪长尾豹马修
浅析青浦区朱家角居住区设计管理中问题和对策解析
2016年4月中国直销网络热门词条榜
2016年3月中国直销网络热门词条榜
2016年9月中国直销网络热门词条榜
大数据相关词条