■ 孙 琼 黄先开 刘 铮 谭智勇
1.北京工商大学经济学院 北京 100048
2.北京联合大学管理学院 北京 100101
3.北京开放大学旅游管理学院 北京 100081
2016年至今,旅游业作为国民经济的战略性支柱产业,对消费的拉动作用明显。受到2019年新型冠状病毒感染肺炎(简称“新冠肺炎”,Corona Virus Disease 2019)疫情全球蔓延的影响,旅游业成为典型的受冲击行业,面临严峻挑战。随着中国逐渐步入后疫情时期,进一步激发旅游消费潜力,推动旅游消费规模增长,对实现中国经济“双循环”的新发展格局有重要意义。
信息和通讯技术(ICTs)的快速发展,变革了人们的旅游消费方式。由通信网、互联网和传感网等组成的泛在网络已广泛融入消费活动,改变了人们的信息搜寻和分享方式。用户自创造内容的发布和分享,成为信息传播的重要渠道之一,并催生出一批深受消费者欢迎的网站应用(如微信、新浪微博、Facebook 和Twitter 等)和知名旅游论坛(如马蜂窝、驴友论坛、穷游网、TripSay 和Travellerspoint等),并衍生出“信息发布—评论—询问—回答”的系列在线互动行为。在物联网和通讯网络的支持下,游客在移动通讯设备、互联网和其他传感器上遗留了海量的具有定位或地理标签的电子痕迹。这些数字足迹(Digital Footprinting)汇聚成了游客的旅游需求、预期消费、出游心理、旅游风险等的游客个体和群体行为图景,真实反映了用户的选择偏好和深层次的行为规律[1],对认识旅游消费决策的“黑箱”提供了新突破口。借助这些潜在消费者留下的海量足迹,对旅游者消费决策的倾向进行及时准确的分析,对旅游目的地和旅游企业营销具有关键作用。
现有研究已关注到数字足迹在分析区域旅游流时空特征、旅游动机和旅游者数量监控等方面的重要价值,并证实数字足迹不仅有助于旅游目的地战略规划,还能有效提升客户关系管理和目的地营销效果[2]。然而,旅游数字足迹仍是一个新兴的研究领域,对其内涵、数据来源及其特征并未深入解读,尚未构建数字足迹在旅游者特征与时空行为、旅游消费决策等研究中的理论体系,对数字足迹在旅游研究中的应用主题与发展脉络未曾清晰给出,缺少与消费行为内在关联的系统阐释,诸多问题仍有待进一步深入。为此,系统梳理旅游数字足迹研究热点问题,为旅游消费者行为理论研究提供新方向,对丰富旅游消费决策机理研究有着重要意义。
为清晰客观地反映旅游数字足迹的研究概况,首先需要明确本文研究对象是旅游者在旅游过程中的数字足迹,区别于其他领域研究的数字足迹。值得注意的是,本文中的旅游者包括旅游者和潜在旅游者。在此基础上,为保证文献全面性,以“digital footprint”“social network data”“Photo-sharing”“Big Data”“bank card transactions’data”等关于数字足迹的主题词与“tourists”“tourist consumption”“tourist activity”“sightseeing”“destinations”等关于旅游行为的主题词进行逐一搭配,在中国知网、Science Direct、Springer、Web of Science 等国内外数据库展开检索,剔除与旅游者和旅游行为分析无关的文献,共获得606 篇期刊文献。这些文献主要来源 于《SUSTAINABILITY》、《CURRENT ISSUES IN TOURISM》、《TOURISM MANAGEMENT》等期刊,时间跨度为以2014 至2020年为主(图1),尤其在2018年,这一主题逐渐引起更多学者的关注。
图1 2014~2020年发表的有关旅游数字足迹期刊论文时间分布图
鉴于此,本研究以数字足迹在旅游研究中的相关应用为主线,对已有研究成果做一系统梳理,着重阐述旅游数字足迹的内涵及类型,并对旅游数字足迹的数据来源、特征和应用进行归纳,总结数字足迹在消费者人口特征、人格预测研究中的功效及其在旅游领域的研究演化,分析数字足迹与旅游消费行为的关联逻辑,对数字足迹在中国情境下的旅游研究命题进行展望。本文是北京市哲学社会科学基金项目“北京建设世界旅游城市与国际消费枢纽城市耦合发展研究”的部分成果,为旅游消费行为的分析和预测提供了科学参考,对北京国际消费枢纽城市建设策略的制定提供了依据。
旅游数字足迹是信息化领域的一个新兴概念,在2008年由美国学者Girardin 等提出,用以描述消费者产生的海量电子痕迹[3]。作为典型的信息密集型产业,旅游数字足迹的概念外延随着信息技术的发展而不断扩展。2013年前,大部分学者认为旅游数字足迹是人们在游前、游中和游后,登录或使用电子设备,在通讯网络、互联网或其他信息系统中遗留的电子信息,包括通话记录、发送或获取的信息,以及发布的图片和文字等为主[4]。随着以大数据、物联网为代表的智能化技术发展,游客在各类社交网络上自愿发布了大量的文字、照片和视频文件,其旅游活动被各类实时移动通讯设备和传感器等感知,旅游数字足迹的概念范围进一步扩展,涵盖多种自然生成的高时空异构数据,如互联网搜索数据、银行卡交易、手机通讯记录、社交媒介用户数据、水电消耗数据、摄影图像等[5]。已有不少研究开始关注旅游数字足迹这一前瞻性领域,大多数研究指出旅游数字足迹较清晰地反映出游客的旅游行为和时空轨迹,有效补充了传统的旅游数据资源[6],为旅游者行为分析和预测提供了新机遇。但由于部分数据获取的困难,学者未结合旅游情境给出确切的概念和范畴。
不难发现,旅游数字足迹是数字足迹在旅游情境下的延伸,其核心概念须在满足一般数字足迹特征的同时,突出旅游情境。基于以往研究成果,本文探索性地提出,旅游数字足迹是旅游者从游前的信息检索开始到游后的经验分享为止,在泛在网络中产生的各类电子痕迹,并归纳出如下4 个主要特征:(1)主体是旅游者或潜在旅游者;(2)电子痕迹包括旅游产品交易数据、旅游交通数据、旅游地理位置信息、通讯信息、社交媒介用户发布数据、旅游水电消耗和二氧化碳排放数据等;(3)情境包括从游前的旅游信息检索、线路规划,游中的景区游览、文化体验到游后的体验分享、产品评价等整个旅游全流程;(4)具有以TB 或PB 为单位、实时或几乎实时产生、大部分具有位置或地理标签的结构化(以表格形式存储的数据)、半结构化(html 文件)或非结构化(文本、照片、视频)数据(旅游数字足迹的主要特征见表1)。
表1 旅游数字足迹主要特征表
在第四次工业革命推动下,旅游数字足迹的范畴从单一的Web 搜索信息,拓展到以旅游图像数据、文字信息等为代表的多源异构大数据,其所涉及的外延和范畴随着信息技术和物联网技术的快速发展而不断扩展。本文对当前研究中所运用的旅游数字足迹类型进行了归纳,其中社交媒体上发布的用户数据,作为旅游消费行为和偏好的镜像,为旅游者特征和行为研究提供了重要参考。除此以外,受到数据获取难易程度和隐私安全等限制,旅游图像数据和地理位置数据也是研究者运用比较多的旅游数字足迹类型(图2)。
1.2.1 旅游图像数据及其应用
以Flickr、Instagram 和Panoramio 等为代表的在线图片存储分享服务平台在为用户提供在线分享旅游照片服务的同时,可标记照片拍摄时用户所在的地理位置和时间信息。这些具有地理标签信息的旅游图像数据,在城市旅游流时空格局特征研究[7]、客流量监测[8],游客时空行为特征分析[9]、旅游线路规划[10]、旅游动机研究[11]等方面提供了重要参考。借助空间统计技术对这些具有地理标签的图像进行分析,挖掘游客的空间行为特征和偏好的热点区域(观光景点),以指导旅游产业发展。如通过分析Flickr上找到的430万张地理标记照片信息,对佛罗里达州29 个城市的游客流量指标(即密度、入度集中度、出度集中度、中间度集中度和全球聚类系数)与佛罗里达州税务局公布的经济数据进行回归分析,发现旅游业产生的经济价值受到供需双方互动的目的地网络结构的制约[12]。
1.2.2 地理位置数据及其应用
游客不仅在旅游景区遗留数字足迹,在进行旅游消费时(如购物、用餐等)也会产生数字痕迹。然而,由于数据安全和隐私问题,游客的银行交易数据很少被用于消费研究。基于用户地理位置信息(LBS)的社交媒介(如Foursquare、玩转四方和街旁等)为旅游消费活动分析提供了替代数据源。借助基于地理位置的社交签到服务平台,用户通过抵达目的地后在线上完成“生成签到—获取访问地点评论—完成签到地点评分—分享签到地点位置和体验”等系列操作。通过分析用户生成的信息可揭示“谁(用户),在什么地方(位置),什么时间(日期和时刻),以及做什么(场所类型)”。基于地理位置的社交签到数据已开始在城市地理研究中应用,如城市场所规划、功能区域分析和商务区研究[13]。但在旅游研究中,该类数据应用相较于其他几类数据应用并不多。为数不多的旅游学者借助移动社交媒体平台上提供的场地签到数据,对不同游客群体在澳门不同娱乐场所的行为模式进行了分析[14],研究有助于旅游管理者了解旅游者的消费行为和偏好,进而提高旅游目的地的管理和开发水平。
1.2.3 社交媒体数据及其应用
在现有的旅游数字足迹研究中,基于社交网站(SNS)的用户自创信息展开的研究数量最多,不仅因社交媒体的用户分布范围较为广泛,还因推文发布后可立即在互联网上免费获取。每条包含地理位置标签的推文都会自动记录用户所在位置和发布时间信息。现有研究多从目的地形象的塑造和影响因素研究入手,并据此就不同游客群体、不同类别旅游目的地、不同规模旅游企业的营销策略展开探讨,较少涉及产品分销领域[15]。随着研究的进一步深入,研究者将关注重点转移至旅游者,开始关注社交媒体用户发布内容在信息传播、情绪表达上的作用,研究内容也更加丰富。如通过抓取迪斯尼乐园游客发布的226946 条推文,获取了19809 个具有地理位置标签的情感词汇,剖析了迪斯尼乐园中不同场所与游客情绪间的关联,研究显示了视觉化游客情绪空间的方法学意义,为主题公园的旅游路线设计提供了参考[16]。
图2 旅游数字足迹范畴图
基于数字足迹的人格特征研究是当前旅游数字足迹研究的热点领域之一。现有研究主要通过分析用户的线上社交行为,包括发帖数量、在线时间以及在线行为特征,进而预测用户人格特征。通过分析用户在Facebook 上发布内容间的相关属性,如好友数量和密度、发布照片数量、参加活动数量、参加兴趣组的成员数量以及照片被标记次数等,发现人格特质与用户发布内容特征存在显著关联[17]。数字足迹为科学制定市场营销战略规划提供了重要参考,主要体现在用户的情绪分析、群体生活方式特征等研究中。通过分析用户在Twitter上发布的文字信息特征,构建个人收入预测模型,进而可揭示不同人格特征与其收入水平间的关联性,如受教育程度和智力水平高的用户,其收入也高,而收入较高的用户则在发布的推文中表达了较多的恐惧和愤怒情绪[18]。基于来自86220 名志愿者的大研究样本分析,通过自我协议、相互判断协议和外部有效性3个标准,证实了基于数字足迹的人格判断比被研究者的朋友、家人、配偶或同事等熟人对其的人格判断更为准确,且具有较高的评分一致性。研究证实,仅用户的线上社交行为数据,不包括任何文本或网络位置信息,就为人格预测研究提供了坚实基础[19]。
近3年,特殊事件和活动下的用户行为特征研究成为新兴热点,数字足迹在旅游活动中的实际应用引起了学者的广泛关注。以大型旅游展会活动为例,世博会是由目的地营销组织、政府、社区和企业共同推动的大型消费贸易展览,是旅游直接消费的催化剂。通过对消费者的数字足迹分析,探究用户的人格特质对世博会满意度和重访意愿的影响,可为提供个性化的信息推荐和有针对性的广告投放提供重要参考[18]。研究显示通过社交网络进行交互时,具有相似个性的游客会表现出趋同的行为模式,通过使用机器学习技术对自动数据分类器进行训练,进而预测游客的旅游行为趋势[20]。此外,数字足迹的应用也拓展到旅游人力资源相关领域中。基于5 大人格理论,通过分析跨国旅游企业员工的社交网络发布数据,进一步研究专业环境下人格对员工社会网络多样性和联结强度的影响,以指导旅游企业在不同网络发展阶段的人员招聘战略[21]。通过从社交媒体Twitter和Facebook中收集了包含用户分享图片的数字足迹,证实了图像在人格预测中的有效性[22],为应用图像数据进行数字足迹分析提供了思路启发。
表2 旅游数字足迹主要数据类型及其研究主题和代表性成果列表
除此以外,研究也拓展到旅游人力资源的相关研究中。基于5 大人格理论,通过分析跨国旅游企业员工的社交网络发布数据,进一步研究了专业环境下人格对员工社会网络多样性和联结强度的影响,以指导旅游企业在不同网络发展阶段的人员招聘战略[20]。研究显示通过社交网络进行交互时,具有相似个性的游客会表现出趋同的行为模式,通过使用机器学习技术对自动数据分类器进行训练,进而预测游客的旅游行为趋势[21]。通过从社交媒体Twitter 和Facebook 中收集了包含用户分享图片的数字足迹,证实了图像在人格预测中的有效性[22],为应用图像数据进行数字足迹分析提供了思路启发。
数字足迹被广泛应用在对人类时空行为的分析中。早期研究通过分析用户的手机通信数据,探究了用户的行为模式和日常生活工作规律。借助大规模人类的集体动力学理论,搜集了微软即时消息系统中2.4 亿人的300亿次对话,构建出包括1.8亿个节点和13亿条无向边的通信网络图,并最终获得了用户的通信特征和模式[23]。此后,随着互联网技术的发展,数字足迹开始被引入到旅游研究中。现有的基于数字足迹的旅游行为研究普遍利用照片、网络文本等借助内容分析法、复杂网络分析法、空间分析法等研究居民和游客的时空行为规律,成果较为分散。一方面,通过分析数字足迹在游客时空行为研究中的应用及其发展趋势[24],对旅游流的空间网络结构展开研究[24];另一方面,借助游客拍摄并发布在Panoramio 网站上的鼓浪屿照片,分析了游客的时空行为特征和规律,验证了使用照片数据进行旅游流和行为分析具有较高的可行性[25]。除此以外,游客的出入境数据记录为目的地的营销管理、交通管理和游客的体验提升等方面有重要参考意义[26]。2019年,Tosporn等利用Wi-Fi 扫描器追踪北海道旅游区的旅游行为,运用关联规则挖掘(ARM)法识别链接游客访问的目的地的规则,揭示目的地之间关联规则的旅游模式,拓展了旅游数字足迹的研究范畴,为制定可持续的目的地管理和旅游政策奠定基础[27]。在行为预测方面,利用百度指数作为实际游客量的预测变量应用于游客量及旅游收入的预测研究[28],提升了景区游客量预测的准确度。
不难发现,现有在旅游行为方面的应用研究主要集中在以下3 种视角:一是在时间维度上探究旅游数字足迹与旅游客流的关联,即引导作用与前兆效应;二是从时空分析出发,着重探讨游客量与在线信息关注度的时空演变特征、热点景区分析等;三是研究旅游在线信息搜索数据的预测功能。但在影响机制和研究模式方面还很缺乏,很少运用多种数据来源进行综合分析。
前文所述关于旅游数字足迹的相关研究,特别是在旅游者特征识别、行为分析方面的应用,对考量旅游消费行为的分析和预测研究具有指导意义。以西方学者为主流的数字足迹研究在近十年发展迅速,取得了一定成果,通过多角度的理论探索与实证检验,形成了立体的数字足迹应用场景。中国信息化技术的高速发展,为旅游数字足迹的本土化研究提供了强有力的支撑。然而,学术界对数字足迹的研究以游客时空特征分析、目的地形象研究、旅游消费偏好等内容为主,未来研究还需对如下方面作进一步探讨。
(1)旅游数字足迹研究是旅游信息化领域的新兴课题,交叉性强,基础薄弱,相关理论体系亟待构建。国外在旅游数字足迹领域的研究不过十年,尚在基础探索阶段,在应用性研究上受制于数据采集难度,多局限在单个城市或景点的研究。国内的旅游数字足迹研究处于概念引进阶段,关注对象局限在对客流特征的分析上,数字来源多为旅游照片或地理空间信息。旅游数字足迹亟需构建体系化理论,特别是在界定研究对象和方法选择上;在应用研究方面,需从单个城市拓展至大区域的研究,从旅游地活动阶段拓展到贯穿游前、游中和游后过程,从旅游照片信息拓展到社交媒介信息、在线游记攻略文本等多元异构数据。
(2)数据来源单一。在研究旅游行为范式上,成果普遍以计划行为理论为基础,围绕旅游产品认知度、消费者购买意愿和消费行为的影响因素展开研究。受研究产品、被试群体和研究区域选择的差异影响,有关旅游消费意愿及行为影响因素的研究结论差异较大。随着通讯和信息技术发展,针对个人消费数据的研究逐渐成为趋势。学者多采用结构方程模型或搜索指数进行数据分析,但由于旅游消费行为是基于个人认知、情感、态度、意愿等综合心理反应,研究受环境、个人情绪、参与动机、主观规范和文化背景等多重因素影响,单一的数据来源难以真实反应旅游者的行为变化。
(3)旅游行为预测方法精度不高。在利用网络搜索数据预测游客量的研究中,对搜索数据的提取仍相对笼统,仅集中在搜索指数月度数据的简单提取,忽视了不同客户端使用数据的重要参考价值,限制了预测精度,忽视了数据间的空间差异、先兆效应差异和预测效果差异。
结合现有文献基础和应用方向,可在如下几个方面进一步拓展旅游数字足迹的研究,开辟新的研究方向。
(1)构建突发事件下基于数字足迹的旅游消费行为研究理论和框架。新冠肺炎疫情持续蔓延引发全球经济动荡,中国主要入境旅游国家实行强制封锁,基于数字足迹和消费行为理论,面向泛在网络空间的海量旅游数字足迹信息,挖掘分析其特征与形成机制,创建数字足迹集成学习模型,科学预测突发事件下消费者的决策风格,提出基于数字足迹的旅游消费理论,科学评估和预测不同地区旅游需求的影响,为可科学制定旅游发展政策提供重要参考。
(2)开发基于旅游数字足迹的旅游行为预测技术。旅游数字足迹的爆炸性增长产生了大量文本、图像和视频资料,这为客观分析消费者决策行为提供了新渠道,为创建数字足迹的挖掘与集成学习模型提供了数据支撑。开发旅游数字足迹的挖掘与分析技术,形成基于集成学习的旅游数字足迹分析谱系,能够有效拓展数字足迹的应用空间,对科学预测旅游需求至关重要。
(3)创建基于数字足迹的旅游消费信心指数。通过分析旅游数字足迹的特征及其形成机制,创建一种基于旅游数字足迹分析的,用于预测不同时空维度下消费者的旅游消费信心指数,供旅游产品需求和营销分析参考,并满足目标消费者需求,对科学制定旅游营销策略具有重要价值。