主持人:刘 逸
(中山大学旅游学院副教授、博士生导师)
此次笔谈邀请了陕西师范大学李君轶教授、中山大学刘逸副教授、吉首大学肖文杰老师、北京第二外国语学院邓宁副教授、南开大学张坤副教授、厦门大学郑伟民副教授、澳门旅游学院齐珊珊副教授等7位青年学者,主要从“旅游研究取向”“旅游情感”“旅游图像”“时空数据”4个方面对当前旅游大数据的研究展开探讨。李君轶老师系统地阐述了对旅游大数据应用的看法,认为大数据应属于一种新的研究方法,在此背景下,旅游研究应该遵循“多源数据、混合方法、交叉研究、团队协作”的研究模式来发展。未来的研究有4个议题值得深度关注,分别是:多源异构数据的融合、旅游系统复杂性、大数据应用模型以及大数据伦理与隐私保护。
旅游大数据的特点之一是存在海量的非结构化文本数据,利用这些文本数据的难题是如何将其所蕴含的情感进行结构化,也就是量化的问题。为此,刘逸老师针对其过往的研究经历,讨论了旅游情感数据使用中存在的难点,包括:情感表达的复杂性使量化计算难度远大于传统研究;旅游情感研究本身理论体系的复杂性使研究难度更大;情感数据获取存在不稳定性和不连续性。但刘逸老师指出,正因为如此,旅游情感数据存在较大的研究潜力,通过优化数据清洗技术和创新研究思路,可以实现理论和实践的突破。延续这个话题,肖文杰老师专门探讨了旅游情感的分类问题,揭示出这个问题当前存在的争论,即情感究竟是按维度来分还是按类型来分,并进一步揭示了这个争论对旅游情感研究产生的影响。肖老师指出,尽管争论仍然存在,但我们也可以通过一些折中的办法来处理旅游情感研究,一方面,基于词典的情感计算思路,可通过情感词典构建来实现旅游情感的量化;另一方面,可以通过机器学习法来确定其他情感与基本情感维度的量化关系。
除了海量文本,图像也是旅游大数据中非结构化数据的重要内容。如何有效地利用大量旅游图像,也是摆在旅游研究学者面前的另一难题。对此,邓宁、熊婷婷两位研究者介绍了其团队在过往若干年对图像数据的使用心得,例如利用计算机图像识别和更复杂的卷积神经网络等技术解构图片内容,以及相关领域的研究进展。他们进一步归纳了2种研究范式:基于推荐系统和搜索范式、基于真实用户参与数据生产范式,提出旅游图像研究存在着数据可获得性、旅游图像分析与人工认知鸿沟、对平台的依赖和内容边界识别等4个核心问题,并对此提出了自身的看法。张坤老师团队则从基本特征、计算视觉2个维度介绍了旅游图片大数据的基本内容,并探讨了使用这类数据的3个局限:新技术新数据仍需探索、图片信息解读存在主观性偏差、研究知识产出层级较低,最后对旅游图片数据的使用进行了展望。
与文本和图像相比,时空数据是较为结构化的一类数据,郑伟民老师系统地阐述了这类数据的特点和存在的问题,以及研究范式的改变。旅游时空数据的背后是“移动范式”带来的挑战,包括数据精度问题、数据连续性和数据采集效率问题。而在互联网的支持下,这些都得到了很好的改进,研究的重点已经转移到如何将数据转化成有效信息、有价值知识和应用上。而齐珊珊老师则针对应用问题展开探讨,系统介绍了旅游大数据的应用场景之一智慧旅游系统在我国当前的建设实践,并总结了智慧旅游目的地的系统框架的主要内容与结构。
诚然,当前旅游大数据的研究尚为粗浅,上述七位学者也未能囊括旅游大数据当前研究的所有议题。但这些学者的探讨,点明了开展这个系列研究需要注意的问题,应能为广大对旅游大数据感兴趣的学者提供有所裨益的研究思路。旅游大数据的研究,更多的还是需要在实践应用中发现并解决问题,也需要其他多个学科的支撑,如心理学和计算机科学。旅游学者的使命,应该也不是在算法逻辑、数据清洗和系统建设等问题之上,而是如何更好更有效地利用这些数据去探析旅游场景中的种种科学问题,这才是学科应有的分工。
李君轶
大数据给旅游发展和旅游研究带来了巨大的机遇。近10年来,随着大数据种类的增加和规模的不断扩大,旅游研究的实践成果和理论成果都得到了丰富。其中实践成果主要体现在业界对于用户画像、旅游推荐、客户管理等方面的发展,而理论的探讨则主要集中在大数据下旅游管理模式、旅游流时空行为、游客情感体验和旅游舆情分析等领域的研究上。
从已有的研究内容来看,旅游大数据的研究能够把握旅游业本身的一些特点,也凸显了大数据对旅游研究的贡献。但是大部分的研究理论、方法等还是来源于其他学科,很少有旅游研究自身的“独特贡献”,仍然是按照一般商品或是一般消费者来开展相应的研究,如果学者能够面向业界问题开展独特研究,例如利用大数据手段科学客观地统计“游客人次”,构建模型并应用于实践,这应该才是旅游研究的本真。
从研究范式来看,大数据背景下的旅游研究仍然以实证主义代表的第二范式为主,对基于计算科学的第三范式乃至基于大数据的第四范式涉及较少,大数据作为一种新的研究方法,不可能完全取代前三种科研范式,将与三种范式长期并存、互为补充。而依托于第三范式和第四范式将局部的还原论知识生产上升到旅游复杂系统的整体认知和建构可能是大数据背景下未来旅游研究的一个重要方向。
为了让大家对旅游大数据研究有一个比较全面的了解,以及未来如何从事与大数据相关的旅游研究,文章主要从大数据背景下的旅游研究模式的变革和未来主要的研究方向2个方面展开论述。
大数据为旅游研究提供了大量的数据,研究的方式发生了一些变化。在大数据的背景下,旅游研究应该遵循“多源数据、混合方法、交叉研究、团队协作”的研究模式,推动旅游研究的发展。
在旅游研究中,为了开展对某一科学问题的研究,可能会采用不同的研究方法和数据。大部分传统的旅游研究会采用统计数据、访谈数据和问卷数据等数据开展研究,但是由于旅游本身的复杂性,单一的数据可能并不能解决复杂的旅游问题。大数据是信息化社会的产物,在信息化的大背景下,互联网、物联网和通讯网产生了实时的海量数据,这些数据为解决旅游问题提供了机遇,在理论和实践研究中利用大数据(如点评数据、微博数据、手机数据等)可以更科学地解决一些旅游学中的规律性问题,例如利用手机信令数据探索游客的时空行为,发现游客的时空规律。但是大数据并不是万能的,利用大数据并不能解决现象和规律背后的机制(因果)问题,因而需要借助“小”而“深”的其他数据来探究其背后的机制。在研究中采用不同数据解决不同的问题成为旅游研究的重要途径。
定量研究、定性研究的各种方法在已有的旅游研究中得到了充分的应用,一个研究可能会采用多种研究方法,从不同方面切入,共同解决某一个核心的问题。例如现在常用大数据开展情感体验的研究,主要使用基于情感词典或机器学习的情感计算方法来发现游客情感体验的一般规律,但在进一步探索游客情感与其他因素的交互研究中,同样需要回归分析、因子分析、质性分析等方法对研究进行补充和完善。需要注意的是,在研究中研究方法的选取应该以解决研究问题为导向,而非研究方法本身。
旅游现象的复杂性为多学科的介入提供了丰富的对象资源,这也使得当前旅游研究受制于研究者本底学科中研究规范、研究目的、研究立场等因素,导致旅游研究的工具化现象的出现,即多作为一种情境去探索本底学科的科学问题,而并非回应旅游知识共同体所面对的问题。因此旅游研究需要完成交叉学科的渗透与跨学科的整合超越,在我国强调交叉学科发展的大背景下,借助交叉研究的发展趋势,借鉴和使用不同学科的研究方法解决旅游研究问题。大数据为旅游研究带来大量的机遇,让计算机科学、地理信息系统(GIS)、信息科学、数据科学等众多的领域能够介入到旅游研究之中,在理论、方法等方面为旅游研究带来新的思想、理论和方法。
旅游研究的复杂性决定了未来旅游研究一定是需要团队协作的,尤其是大数据背景下的旅游研究。一项基于大数据的旅游研究,除却需要专业的数据分析师挖掘与处理大数据,还需要依托其他专业背景的人才分析结果背后隐含的知识。如利用大数据开展旅游情感体验研究,则需要数据分析、心理学、旅游等不同专业背景的人才组成团队联合攻关才能取得不错的研究成果。未来的科学研究不能靠“单枪匹马”,而需要团队协作,大数据背景下的旅游研究更是如此。
大数据的核心在于数据,如果能够有科学精确的数据,那么研究结果才能够得到保障。现有的大数据环境决定了大数据来源范围广、结构差异大、价值密度低、迭代更新快等特性,例如对游客行为的研究,手机信令数据可以描述游客的时空行为,支付平台数据可以描述游客的消费行为,点评数据可以描述游客的游后行为,然而由于大数据的多源异构特征,割裂的用户数据无法勾勒游客的行为全貌,这从一定程度上导致了学术知识生产的片面性。因此,如何将多源异构的大数据进行融合,是大数据背景下旅游研究内涵、层次以及置信度得以保证的关键。同时数据融合并不是一件简单的事,需要解决技术壁垒、数据标准、数据安全等问题,如何保证客户隐私,保障客户知情权都是生产过程中无法忽视的问题。
知识生产的层次性决定了大数据背景下旅游研究初期多产生规律性的成果,即通过观察旅游复杂系统的某一个截面,直接反映系统截面中的复杂关系网络特征,例如通过平均路径长度、度分布、聚类系数、核数和介数等共性指标去探索区域旅游者时空分布、游客社交媒体行为等方面的规律。但实质上大数据拥有对于复杂系统内在机理进行整体性研究的潜力,因此通过基于计算科学的第三范式对旅游问题进行复杂性研究,探索旅游系统中涌现机制及其背后的社会学、心理学机制,也是未来大数据背景下旅游研究的一个重要导向。
第四范式认为大数据可以在没有模型和理论的情况下挖掘出传统科学方法无法发现的新规律和新知识,甚至认为海量的数据为知识创造提供了新途径,即使没能产出一致性的模型和统一的理论,这些研究产生的相关性可以替代因果性,从而推动科学的进步,深度学习的发展就是这一范式的有力证明。虽然大多数学者认为这一范式过于激进而引起了激烈的争论,但对于大数据背景下的旅游研究,可以尝试利用大数据探索部分实践问题,例如基于大数据的满意度测算、情感体验、空间分析、旅游流预测和市场分析等。同时要对大数据的分析方法和流程进行规范,探索一类大数据的分析方法和流程的标准,有利于旅游研究中大数据的应用。
互联网时代,人、机、物的三元融合是大数据得以存在的客观条件,个人信息不可避免地被收集,同时多源异构大数据的融合会揭示出个体游客各个层面的行为模式。由于学术研究中的数据共享倡议与可重复性要求,开展相关研究乃至后续的成果交流都避不开个体游客的隐私和伦理,因此如何在成功开展研究的情况下妥善保护个人隐私,也是大数据背景下旅游研究应该重点关注的问题9。
李君轶博士陕西师范大学地理科学与旅游学院教授博士生导师
:
刘 逸
在日益发达的互联网技术和智能终端的支撑下,社交媒体平台发展迅猛,在彻底改变了人们生活方式的同时,也带来信息生产速度和数量的暴增。越来越多的旅游者倾向于使用社交网络媒体搜索信息,同时表达自己的心得体会和态度情感,为旅游研究提供了丰富多样的研究场境和数据来源。这种现象的出现重构了旅游行为的知识生产机制,而游客在社交媒体上的情感表达又极大影响了旅游决策和营销,旅游大数据研究在此背景下应运而生。
当前的旅游大数据大致包括3个类型:传统数据电子化、多源异构用户生产(UGC)数据以及由旅游活动后台产生的时空行为数据。在这些数据类型中,旅游情感数据较为复杂多元,而各类社交媒介中又广泛存在可用的免费数据,例如服务评论、星级评分、图片标签、游记感想和日常分享等。如何有效利用海量出现的旅游情感数据,既是广大旅游研究学者的良机,也是挑战。
情感是人对客观事物是否满足自己需要而产生的态度体验,游客情感是在旅游活动中因外部环境影响而产生的愉悦、愤怒、悲伤等情感体验,是旅游体验的核心,贯穿旅游活动的全过程。对旅游学者来说,情感研究已经不是陌生话题,Hosany等从理论设计、测量、分析和解释四个方面,系统地介绍了情感理论在旅游情境中的应用,并提出了一个称为“Emotionapps”的模型,从显著性、效价和意识等3个维度对旅游情感进行测量。研究人员主要从心理学和营销学的角度出发,将旅游情感研究内容和方法概括为七类:(1)情绪概括维度的适宜性;(2)心理学视角中自我报告情绪测量的适宜性;(3)语言、非语言和间接的定性情绪测量;(4)单极性和双极性情绪量表;(5)回溯性与即时性情绪模型;(6)消费者行为模型中情感与认知的相互作用;(7)线性和构性理论的构建。虽然研究人员针对旅游情感展开了深入探讨,但似乎更加集中于较为狭义的基于情感表达的量化测度,对于情感数据特点和开展研究的挑战方面未做过多阐述。因此,本文结合近年开展旅游情感大数据研究的进展和实践,探讨旅游情感研究的问题和挑战。
旅游UGC(User Generated Content)是当前情感大数据研究的重要来源。相对于传统问卷调查,UGC 数据具有易获取、内容丰富、时效性强、样本量大等优点。相对于传统的旅游电子化数据,如价格、预定量、营业额、客流量等数据,UGC 数据获取方式和成本更为简单和高效,因为前者往往是企业内部的重要商业机密数据。常见的UGC 数据有评论数据、图片数据、旅行日记数据、标签数据和评分数据等,其中评论、标签评分和图片数据是使用较为广泛的三类数据。合理有效地使用这些数据,至少存在数据测度、理论解释和数据获取三方面的挑战。
游客情感是在“非惯常环境”下的活动中产生的情感体验,可以捕捉到游客情感表达的有网络评论文本和UGC图片等,但是这种多模态的情感表达给量化计算带来极大的挑战。对于文本数据而言,捕捉其情感倾向需要使用词库过滤的方法,但当前可供选择的词库却不多。较为权威的词库是CNKI提供的Hownet词库,但这个词库的词汇量比较适合满足日常用语,难以满足旅游研究的需求。正因为如此,当前旅游情感研究尚未有取得广泛共识的词库可以为广大学者使用,学者们多根据自己的需求重新定义词库。例如,刘逸等在2017年开展旅游情感捕捉的研究时,便因为发现相关情感词过少,从而更新过这个词库,最终新增了502个情感词。该团队随后在其开展的旅游爱国情感研究时,又再一次更新词库。
除了词库的问题之外,当前关于情感捕捉的算法模型也尚未有广泛的共识,但旅游学者已经为此做出了积极的尝试。情感计算的概念可以认为是来自于MIT 的Rosalind Picard的研究。该学者在1997 年出版的中提出这一概念,并将其定义为“与情感有关、由情感引发或者能够影响情绪的因素的计算”,目标就是赋予计算机感知、理解以及表达情感的能力,情感计算成为自然和谐人机交互技术的重要组成部分。这个概念得到了诸多学者的认可,也出现在后续的很多研究中,例如Paltogou等人采用情感词典对Twitter、MySpace、Digg等社交媒体的文本进行分类研究,而刘逸等人开发的旅游情感评估模型(Tourism Sentiment Evaluation,TSE)本质上也属于情感计算的范畴。该模型构建了旅游专属词库,根据语义逻辑构建了算法模型,为旅游情感计算提供了新的方法和路径。李君轶等利用人工智能中的逻辑与算法编程方法、机器学习方法、深度学习方法探索最佳的基于文本大数据的游客情感计算方法,发现机器学习可靠性高于线性特征的情感词典法,深度学习效果良好,准确率高。为了进一步比较人工逻辑和机器学习逻辑的优劣,刘逸等基于旅游评论数据,选择4个传统机器学习模型、2个深度学习模型和基于词典、语义规则的TSE 模型展开效度对比研究,发现机器学习实现了高精度捕捉,但未形成压倒性优势,而TSE 模型虽然稳定性最好,且已经走在算法前沿,但仍有可能被深度学习所取代。
首先,情感研究的基础应该是心理学,继而是社会学,从人的心理活动出发,探讨本能的、自然的情感发生机制;其次再根据人的社会属性,例如性别、身份、职业、社会角色等,形成带有一定价值观和态度倾向的情感表达;然后,才涉及阐释范式,例如在管理学或者经济学的范畴中探讨情感;最后,是应用场境,例如旅游行为。这种理论体系的多样性,导致开展旅游情感研究需要做较多的理论梳理工作,增加了研究难度。如果理论范式选择不当或者含糊不清,很容易出现研究成果缺乏延续性、相互之间无法对话的情况。以最基础的情感分类为例,心理学界至今关于情感表达是否独立可分以及可独立细分为其他几类情绪尚未达成一致,多数研究将情感简单地划分为积极、消极和中性三类,且有些学者认为积极情绪和消极情绪是在相同维度上相反的两极,并通过研究证明愉悦和不愉悦的情绪是独立的。而另一派学者则质疑情绪的两面性,认为情绪交织混杂,无法独立区分。不过尽管存在分歧,诸多学者还是将情感视为可分,例如美国心理学家Ekman提出基础情绪理论,将情绪细分为喜悦、愤怒、悲伤、厌恶、恐惧、惊奇等六类;Plutchik基于进化规则提出多维度情绪模型,定义了8 种基本双向情绪;Mehrabian 构建情绪—唤起—支配(PAD)模型进一步综合描述情绪的不同状态。在此基础上,Ekman的六类维度理论的接受度较广,但现有的旅游情感研究中,未必都遵循这个分类维度,而是直接基于自己的需求进行分类,这导致诸多研究成果之间难以展开对话。例如在Hosany的综述中就可以看到,已经有大量旅游相关的情感量表问世,但却没有一个共同遵守的分类标准。在这种情境下,旅游情感研究要获得更多学科的认可,存在较大难度。
与此同时,在现阶段的旅游情感研究中,大多数研究属于应用导向性,聚焦于利用大数据发现情感规律,研究议题集中在形象感知、满意、目的地评价、目的地品牌与营销、游客情感与忠诚等方面,对游客的情感类型和偏好均缺乏探讨,且较少探讨情绪变化的因果关系,同时学者们对于情绪变化的解释是数据驱动还是理论驱动也未达成统一。简而言之,当前由于旅游情感理论本身的复杂性,导致这个研究话题的基本理论体系尚未建立,在范式和基本问题上尚未取得共识。
在情感信息的获取方面,海量用户生产数据日渐丰盈,为旅游情感研究带来海量数据资源,但是由于不是统一口径的官方统计数据,数据来源多样、结构不一,不同类型数据的精度和量化标准也不一样,例如评论、图片、标签和视频数据就存在如何统一量纲的问题,也存在如何与时空定位数据相结合使用的问题。与此同时,情感信息的生产和存储速度快、数量大,但变化也快,存在不稳定性和不确定性,受突发事件影响容易使数据源突然关闭,从而导致已积累的情感数据库失效或者不连续,例如2019年某平台爆出评论造假舆情,致使其所有的数据均被质疑其真实性;或者某搜索类平台企业宣布关停旗下旅游服务,导致过往积累多年的数据库无法再继续使用。就当前我国数据环境而言,旅游情感数据中的评论数据和图片数据的主要来源有传统的旅游OTA 平台(如携程和去哪儿)、新兴OTA 平台(如马蜂窝、驴妈妈)和跨界介入旅游的综合服务平台(如微信、美团、小红书和抖音)等。在这三类平台中,评论类内容勉强可以互通合并使用,但是在可供抓取的评论中,除了新近生产的数据较为齐全,时间较为久远的数据会经过平台的筛选,仅展示部分数据内容。而且在平台数据反爬取机制的干预下,能够抓取的数据未必是全数据,容易出现字段缺失,例如用户归属地这一重要信息就经常在平台的重点屏蔽范围之内。这些问题都非常容易导致数据不连续、不兼容等问题,难以展开长时间、大尺度的时空分析,相当可惜。面对旅游情感多源异构数据的不稳定性和不确定性,如何有效地加以整合、分析利用,是旅游学者面临的另一重大挑战。
尽管旅游情感研究存在上述3个挑战,但我们依然要看到这个交叉领域的研究潜力。相对于在多场合重复、场所根植性不大的日常购物活动,旅游情感是高情境体验活动的产物,这些记录在社交媒体上的情感数据,与观察法、实验法和问卷法所采集到的数据相比,具有真实性、全面性和实效性等优势。再加上这些数据具有时间和空间属性,所以当能够采集到一定广域范围内长时间跨度的数据时,旅游情感研究将能为我们带来令人兴奋的新视角。
从广度上看,旅游情感大数据可以全面揭示基于旅游体验的客源地与目的地的市场结构与演变特征。基于多平台采集带归属地的海量UGC 数据,我们可以获得一个目的地全面的客源市场分布状态,同时也可以获得一个客源地全面的目的市场分布状态,而且包括关注度(数据量)和情感倾向两个横向维度的信息和历年演变趋势的纵向维度的信息,这是传统问卷调查数据所不可能实现的研究广度。基于此,研究者可以结合常规自然环境数据和人文社会经济统计数据,如GDP、收入、消费数据的变化,建立多种校验机制并展开研究,例如跨地域大尺度的市场时空动态模拟。而且随着情感的细分,例如愤怒和失望,这个研究系列不限于简单的满意度或者好评率,而将会为广大学者提供丰富多样的研究机遇。
从深度上看,旅游情感大数据的时间颗粒度可以连续地细化到天,情绪(emotion)可以细分出多个维度,而且可以进一步提炼为情感(sentiment)和态度(attitude),这可以为研究者提供丰富的新话题,不仅将传统的满意度研究包含在内,而且彻底打破传统模型中以年度为主要单位的研究周期。这对于服务质量研究和事件研究而言,尤为重要。研究者可以针对某一服务质量、事件或者内容,从UGC 数据中获取消费者的反馈信息,更加科学客观地展开评估,也可以探讨旅游情感倾向与口碑等常见因素的关联机制,围绕常见的服务感知、满意度、消费偏好等话题,将UGC数据当做辅助校验数据加以验证。
总体而言,旅游情感大数据可以为我们带来诸多新的研究话题与可能,虽然在情感计算、理论支撑和数据结构上存在诸多挑战,但我们也应该看到它所具有的较之常规研究不能比拟的潜力,期待未来能有更多学者投身于这个领域的研究。
刘逸博士中山大学旅游学院副教授博士生导师
肖文杰
情感是一个复杂的概念,涉及个人主观经历、心理活动以及外界环境等多个因素,甚至可能被伪装,客观上难以对其评估。因此如何理解情感就成为科学家的困惑。早在20世纪50年代,心理学、神经学、行为学等领域专家分别对情感表达了不同的学术观点。然而神经学、行为学对情感状态下的大脑结构展开研究,其成果并不能构成情感分类理论。有关情感分类理论的研究主要由心理学界推进。60到70 年代,心理学界对情感的研究进入了高峰期,学者们在对话中逐渐形成了情感的两大取向:以Russell为代表的维度取向和以Plutchik为代表的分类取向。前者认为情感可由基本维度组合表达,后者提倡情感由基本情感类型构成。
上述两大取向在争论中不断发展,然而时至今日,仍然没有达成共识,而这个分歧也一直延伸到了旅游情感研究中。例如,2020和2021年杂志刊发的两篇论文都与旅游情感相关,但是采取的情感取向理论却不一样。其中Park 等于2020年发表的论文认为Russell提出的维度取向理论更具有优势,因此将维度取向的经典模型PAD 模型作为核心理论;而Zhang等于2021年发表的论文则偏向分类取向理论,其使用Ekman 提出的六种基本情绪理论。以上只是情感取向争论的缩影。这种分歧带来的挑战就是在旅游情感研究中,特别是大数据研究中,应该如何量化非结构化数据中的情感属性,究竟是按照六类情感来区分,还是按照PAD 环状情感模型来区分。最终旅游大数据的相关研究采取了更加保守的做法,直接把情感分类为正面和负面,以便量化测度,例如刘逸等学者在开发TSE 模型的系列研究中的处理。
情感分类理论的争论除了情感取向之间无法达成一致,在情感取向内部也还存在诸多争议,如:维度取向理论的基本维度是由三维还是二维构成? 分类取向理论由多少种基本情感构成? 情感是单级情感因素还是双极情感因素?
第一,情感分类理论争论的核心,是维度取向与分类取向之争。
维度取向认为情感是连续的,可由基本维度的连续函数表示。早期证据来自Schlosberg通过面部表情图片进行的实验,实验中表达六种基本情感的图片以一定顺序排列,却发现受访者容易将前后相邻图片表达的情感混淆,因此提出并验证情感是连续的假设。Russel则通过因子分析,发现基本情感维度能较大程度解释其他的情感。
分类取向认为情感是离散的、独立的,其他情感由多种基本情绪组合而成。Plutchik继承了达尔文进化论观点,认为情感是对刺激的反应序列,是对现实任务的适应。Ekman基于达尔文进化论框架,提出基本情感应该具有与其他情感不同的信号、特殊的生理反应等特征。愤怒、恐惧、悲伤等6种情感符合上述特征,因此被称为基本情感。
两者的核心分歧在于,如果情感是连续的,按照达尔文进化论观点,表达愤怒、恐惧等基本情感的面部表情信号以及生理反应等也应该出现与其他情绪相似的特征,不可能存在独特性。反之,如果情感是离散的、独立的,则受访者将表达不同情感的图片混淆应该是小概率事件,然而这与实验结果不符。
第二,情感是否存在第三维度也是争论的焦点。
即使承认维度取向的观点,情感应该由哪些维度表示仍然需要探索。在非语言表达的情感方面,Schlosberg对面部表情图片进行实验,认为情感可由愉悦—讨厌与关注—拒绝这两个维度来表示。在语言表达的情感方面,Russell和Mehrabian提出PAD 理论模型,认为语言表达的情感由愉悦—讨厌(P)、唤醒水平(A)和支配—从属(D)3个维度表示。此外,快乐、激活和效力3个维度以及评价、激活、效力3 个维度相继被提出9-10。
Russell认为对愉悦-讨厌、唤醒水平两个维度容易达成共识,但是对第3个维度的表示还存在争议,因为研究中出现了效力、支配、控制等多种表达形式,而且支配-从属维度比其他两个维度的系数要低。Russell认为控制、支配和效力等维度表达的是对未来的判断,可将其归纳为“认知”。而“认知”不是情感所独有,同时并不是所有情感术语都包括“认知”维度。这也解释了第三个维度不一致的现象,因此情感只能由愉悦-讨厌以及唤醒水平两个维度构成。
第三,基本情感类型的数量是否有公认的标准,也是尚未达成一致的议题。
学界认为基本情感类型最少有3种,最多的达11 种,其中以Plutchik 和Ekman提出的分类数较为通用。Plutchik 在2001年构建了三维环状情感模型,他认为其他情感可分为两类,即二级情感和三级情感,其中前者是相邻的基本情感组合,后者是非相邻的基本情感组合。Plutchik 认为“情绪是对刺激作出反应的推断复杂序列,包括认知评价、主观变化、自主和神经唤醒、对引发复杂序列的刺激产生影响的行为冲动”,并认为情绪由喜悦与伤心、愤怒与恐惧、接受与厌恶、惊讶与期待8种基本情感构成。对此,Ekman持反对观点,他认为人的基本情感具有九大特征,其中6个通用特征用于表示情感,独特的3个特征区别于其他情感。根据这九大特征,其认为基本情感包括愤怒、恐惧、悲伤、快乐、厌恶和惊讶。对此,Ekman的质疑者提出,如果情感是由独立的6种或者8种基本情感构成,那么这些构成后的情感术语应该如何表示? 为了解释这个问题,Ekman引入了“情感家族”的概念,指出家族内部包括多种相似的情感。至于爱、抑郁等其他情感术语则被认为是情感的某类属性,并不属于情感范畴。他认为其他情感是多种基本情感的组合,而其余更多的情感则被认为处于“基本情感家族”中。暂且不论对爱、抑郁等情感术语的理解是否合适,Ekman的质疑者对基本情感与九大特征的关系依然存在疑问。例如:九大特征是基本情感的充分条件吗? 除了基本情感以外,其他情感都不符合九大特征? Ekman对此辩解称,以目前的个人经验并未发现例外。
第四,情感维度是单级还是双极的?
双极是指情感维度由相反含义的情感词汇成对出现,如愉悦和讨厌、支配和顺从。早期Guilford假设情感维度是双极的,不少研究支持这个假设。但Green和Gold Fried辩称,如果假设成立,则可推断出愉悦和讨厌等双极情感术语呈负相关关系,然而实证结果并不支持上述推断。Russell认为,反对者提供的证据不足,因为实证结果受情感术语抽样不足及问卷格式的影响,也有受访者默认偏见的干扰。即使如此,由于无法证实上述干扰对实证结果的具体影响,不排除存在单级可能。Russell对自我报告情感结构进行主成分分析,从分析结果看,既有双极因素也有单级因素。尽管双极因素占较大比例,但是不能解释全部,因此争论无法达成共识。
笔者认为上述争论无法达成共识有很多原因,不过最主要的原因应该是来源于情感本身的复杂性。情感的复杂性主要体现在以下2个方面:一是区分基本情感的九大特征较为复杂,涉及信号、生理反应、前因事件等独特特征以及自动发生、自动评价、反应一致性等共同特征。二是情感实验中,受访者的默认偏见无法消除。事实上,不管是维度取向还是分类取向,都不能完全解释情感,还存在无法合理解释的现象。然而,学界对此较少关注,将主要力量集中于理论框架的应用。
除了情感基本范畴之外,我们还有多种情感范畴之外的情感术语,比如情感认知、情感态度、情感特征、情感情节等概念。Russell根据个人经验将第三维度的“效力”“控制”等理解为情感“认知”,认为情感“认知”并不是情感。Ekman则在解释爱、忧郁、悲伤等情感术语时,分别将它们看作情感态度、情感特征、情感情节,并将上述情感术语排除在情感范畴外。Ekman 虽然提出了不少备选的基本情感,然而备选情感是“非基本情感”还是“基本情感”的问题还处于搁置状态,鲜有学者对此展开论证,而这对推进基本情感类型数量达成共识非常重要。此外,研究主体对无法解释的现象的忽视和研究技术手段的限制在一定程度上也加剧了分歧。
综上所述,情感分类理论的争论是开展基于大数据的旅游情感研究的巨大阻碍。除了定性访谈和精准问卷调查,我们似乎很难高效率地开展基于海量的、非结构化的旅游情感计算研究。尽管如此,未来仍可以从旅游情感词典构造与确定其他情感与情感维度的量化关系两方面突破。一方面,基于词典的情感计算思路,可考虑从情感词典构建来实现突破。尽管国外学者提出了PAD 模型,但描述该模型的英文情感词典词汇量较少,而且缺少相应的中文情感词典。因此,构造适合PAD 模型的中文情感词典对于旅游情感计算非常关键。我们也可以尝试通过关系图、深度学习技术提高词典构造效率。另一方面,可以通过机器学习算法确定其他情感与基本情感维度的量化关系,这有助于标识其他情感在情感空间的位置,对文本情感的高效计算非常关键。
肖文杰吉首大学旅游与管理工程学院讲师中山大学旅游学院2021级博士研究生
邓 宁,熊婷婷
可视化素材作为当前旅游营销的主要载体,具有影响受众心理和行为的能力,可视化素材的挖掘和分析在旅游营销研究领域也成为一个非常重要的分支。本文在已有的可视化素材研究经验的基础上,分析了当前数字化营销的大趋势以及未来旅游大数据研究可能的研究方向。同时在总结旅游研究中可视化素材的来源和获取方式的基础上,提到了研究范式的创新,并提出了此类研究可能遇到的问题。
数字化营销基本上已成为旅游目的地当前最主要的营销途径和手段。数字化营销与传统营销的区别在于,数字化营销主要通过技术手段和数据驱动的方式,对营销全过程进行数字化描述和分析,其更有助于目的地在营销策略优化方面进行迭代而不断提升营销效果。2020 年全球数字化营销市场规模已达到3 500亿美元,且增速每年均保持在10%以上。互联网的普及和移动互联网的发展逐步成熟,促使手机成为数据产生和信息获取的主要途径。尤其是近5 年来,以抖音、快手、小红书、B站等为代表的新媒体平台的兴起,更是对数字化营销方式产生了颠覆性的影响。以抖音平台为例,其在中国市场的广告营收额仅2020年达到人民币1 000亿元。目的地数字化营销所使用的主流素材也已经处在从图片时代向短视频时代转换的过程中。以图片和短视频为代表的可视化素材对旅游这一体验型产品的营销与传播意义更为重要,其对受众的视觉刺激以及旅游动机的形成也更为直接。此外,短视频的背景音乐对体验类产品场景的营造效果如何,以及对受众自我认同感和旅游动机的唤起能力如何等也是未来值得研究的方向。
旅游领域中传统的定量研究多采用实证的研究范式,首先提出假设并通过问卷调查、统计年鉴或官方网站数据查询等方式收集数据,再利用统计学方法检验假设并找到变量之间的相关性。在数字化营销时代所产生的海量可视化大数据和用户反馈大数据之间,也可以建立起一个从可视化素材所挖掘的内容到受众反馈之间的相关性模型,进而为构建更科学的营销内容提供决策参考,同时也能够预测构建的营销内容所能引发的受众参与情况和激发效果。这在一定程度上可以推动数字化营销的研究朝更为实用的方向演进,同时也更符合管理科学中对理论问题实践化的要求。
近5年来,旅游大数据的学术研究受到越来越多的关注和讨论,尤其是移动互联网的快速发展促使手机各类App成为主流社交工具后,用户产生的数据(User Generated Content,UGC)渐渐成为旅游学者追逐研究的热点。从最早期以博客、攻略等为代表的文本型UGC,到最近几年越来越多人所关注的图片型UGC,再随着当前短视频和直播平台的大行其道,短视频等新媒介UGC的挖掘也渐入佳境。然而,基于旅游大数据的研究范式仍然无外乎从大数据的量化结果中去发现用户的旅游行为规律,并通过理论给予必要的解释。这类研究范式是基于早期的旅游实证类研究,在更大的数据尺度或新的数据维度上进行现象再发现,归根结底仍是数据的统计分析。但同时也有更多的研究者在深入思考“大数据的真正价值是什么”这一问题,并试图探索更智能化的方式辅助人们作出相关决策,诸如基于大数据的预测和推荐等,此类研究都属于从已知现象到未知规律的一种探索。在旅游营销领域,“营销内容如何才能影响潜在受众”这一问题一直备受关注。但此类研究大多采用问卷和实验等方式收集个体反馈信息进而加以分析,随着用户参与数据(engagement data)的可获取及其潜在价值的挖掘使得利用用户参与数据分析用户行为成为可能,其有助于学者根据真实的用户反馈数据去感知用户对营销素材的敏感程度、兴趣、激发效果等,这也将更具研究价值。
目前以大量图片或短视频作为分析对象的旅游类研究,其图片和短视频的获取方式除少数网站提供了可供数据下载的API外,大多数是利用计算机爬虫工具进行线上数据爬取。图片和视频网站一般能提供包括数据本身及其元数据(metadata)在内的多维度数据。国内旅游攻略网站如马蜂窝、新浪微博等,国外如Instagram、Flickr等是图片类研究素材的主要来源网站;抖音、快手以及国外的Instagram、You Tube和Tik Tok等是视频数据的主要来源。同时经过本研究团队的实践和验证,以上网站的数据在可获得性方面均可以保证旅游研究的基本需要。此外,用户反馈数据也是此类研究的重要组成部分,目前以上网站的用户评论,以及视频网站例如B站所支持的弹幕等,均提供了获取用户反馈的有效性文本数据的途径。当然,在技术实现和关注点方面,与早期图片研究主要聚焦于数字足迹所折射的游客时空行为不同的是,数字营销研究更关注图片内容和受众反馈,其利用计算机图像识别和更复杂的卷积神经网络等技术解构图片内容,极大地降低了旅游研究领域图片数据来源多样化的需求。
长期以来,旅游研究中的定量研究基本上是采用实证方法检验所提出的假设。而从其他学科跨入旅游领域的一些学者,已逐渐开始利用其他母学科的研究方法和研究范式进行旅游研究,为旅游研究范式提供了另一种思路。在旅游大数据这一交叉度更高的细分研究领域中,这种趋势也更为显著。其中在对营销素材的智能化构建和选择这一研究领域,笔者在论文中曾经将营销素材转化为计算机信息学中搜索引擎或推荐系统中排序的场景,通过比较排序结果的召回率(recall rate)和归一化折损累计增益(normalized NDCG)等,进而证明此方法得出的排序确实符合受众的选择。这是一个将旅游营销问题转化为计算机领域中推荐排序问题的研究,通过机器自动化排序的结果与被试排序的结果进行对比,验证了机器方法的合理性。具体方法的运用及研究范式可以参见邓宁等学者发表的论文。
除图片及视频等多媒体内容智能化构建这一研究范式外,还有另一种更为贴近现实场景应用的研究范式,即利用真实数据验证提出的算法。例如在对利用算法所构建的营销素材进行营销效果评估时,可以采用平台上的真实用户参与数据(engagement discounted cumulative gain,data),包含用户浏览量、点赞量、评论量等,根据时间序列将整个数据集合(包括素材内容、用户参与数据)分为训练集和测试集。一般利用训练集进行模型训练和参数赋值,测试集则用于检测所训练的模型,以验证算法在测试集上是否能达到预期所设定的结果。通常,可以将模型所获得的离散的图片内容与实际的用户参与度数据利用线性回归分析等方法判别所提出的模型与真实数据的拟合关系。具体研究范式可以参考贺泽亚等学者所发表的论文。
首先,对于可视化素材营销内容推荐类的研究,其前提是获取研究所需的数据。目前此类研究所使用的图片或视频类素材等均于互联网爬取所得,因此,此类旅游研究在数据获取方面具有一定门槛。其次,海外社交媒体平台的图片数据较为丰富和固定,Instagram、Flickr等均为较主流的图片分享网站。但国内分享图片的网站则相对缺乏,大多分布在诸如马蜂窝、新浪微博等平台上。而微信朋友圈作为国内最大的图片分享平台,却因其属于私人社交圈,涉及用户隐私等问题,因此这一渠道的数据基本无法用于科研。
目前图片或视频素材的机器分析是建立在计算机学科对图片和视频自动化标注的技术基础之上展开的。但显而易见的是,计算机领域目前所提供的开源工具,在语义解释方面并没有考虑旅游的实际场景以及旅游研究的需求,其所提供的机器算法更多是通用物体的识别结果。而当前机器提供的地标结果与旅游领域图片识别所需的地标需求之间、机器对图片情绪感知层面的识别结果与实际受众判读的图片结果之间仍有一定差距,这需要在研究时优化和改进图片识别的结果。
目前可以明确的是,类似于抖音、快手这类以推荐系统为基础的短视频平台,其视频播放量和用户参与度与平台推荐策略关系极大。平台会根据一定时间段内短视频的完播率及内容的受欢迎程度等进行流行度预测,并将具有高流行度潜力的视频及其相关视频或同类视频作为向用户推送的重点,这将导致用户参与数据受到平台推荐行为较大程度的干扰。因此对于如何消除平台推荐机制对用户参与数据的影响也是一个值得关注的问题,同时通过模型构建优质短视频内容预测用户参与度也是关键。
图片、视频等视觉类素材如何能够使受众喜欢并让受众乐于参与其中,这是数字化营销中内容构建的关键问题。但影响受众喜爱程度的因素众多,除视频内容本身之外,还包括平台的推荐机制、视频发布者的影响力等外部因素。而在排除各类外部因素后,能够影响受众观看体验和情绪激发的因素则主要为能获取受众真实参与和关注的视频内容本身。
邓宁博士北京第二外国语学院旅游科学学院副教授副院长硕士生导师熊婷婷北京第二外国语学院旅游科学学院2020级硕士研究生
张 坤,张津沂
“一图胜千言”,图片数据中包含着丰富的信息,既有文本信息不具备的显性视觉内容,也传递着情感等重要隐性信息。英国社会学家John Urry在1992年提出“旅游凝视”理论,这一旅游学经典理论认为视觉是游客感知旅游目的地的主要方式,从而在理论上奠定了图片摄影与旅游研究的紧密关系。近年来,随着摄影技术的普及化,图片成为游客记录其旅游经历最重要的手段,而移动互联网的发展更是为图片的信息传播带来新变化。具体来说,互联网技术迅速发展,一方面改变了网络用户的信息分享习惯和模式,用户生成的海量图片出现在社交媒体上,同时官方发布图片以及行业专业图像(如街景地图、航拍遥感图像等)也成为图片数据的重要组成;另一方面计算机技术的进步为科学高效地分析图片大数据提供了全新的视角和方法。旅游学者逐渐开始重视图片大数据的价值,加之计算机技术的进步,图片大数据研究成为旅游领域的探索热点。
图片大数据具有展示直观视觉内容、信息内容丰富多元的特征。具体来说,不同于文本,图片大数据展示着丰富的视觉内容,能够更加立体形象地传递旅游目的地形象,带给观者更加直观的视觉刺激。在目前旅游大数据研究中,由于用户生成数据UGC 获取难度相对较低,图片大数据研究主要以用户生成的图片为主。这些图片定格了游客在一瞬间的视觉感知,经过了拍摄者的筛选和分享,一定程度上表征着游客的偏好。与此同时,图片所反映的信息较为丰富,主要包括附带文本信息、附带时空信息以及图片本身的视觉内容。结合其附带的时空和文本信息以及图片本身的视觉信息,研究者能够建构出游客在当时的感知及其行为的时空变化。
如何精准有效地分析解读图片大数据的视觉内容和附带信息是图片大数据研究的关键。尽管图片数据包含丰富的信息,但传统的内容和符号分析难以处理大体量的图片数据。计算机视觉领域的技术进步为分析图片大数据带来了新思路,通过计算机深度学习算法可以直接对图片本身的视觉信息进行海量识别和标签化。
计算机视觉(computer vision)又称为机器视觉(machine vision),顾名思义是一门“教”会计算机如何去“看”世界的学科。在机器学习领域,计算机视觉与自然语言处理(natural language process,NLP)及语音识别(speech recognition)并列为机器学习方向的三大热点方向。计算机视觉技术主要的应用包括图像分类、对象检测、目标跟踪、语义分割和实例分割等,可以协助计算机从图像中捕获有用信息以帮助人们理解图像。这些计算机视觉技术为旅游图片视觉内容的解析提供了技术基础,从而为综合视觉内容和附带的地理时空及文本等信息,多尺度评估游客的旅游目的地感知,深度建构照片所冻结的游客感知提供了支持。
目前计算机视觉技术逐渐渗透到旅游领域,诸多学者在图片大数据的研究中引入了这一技术,对游客感知和旅游目的地形象有了全新认知。但是经过初步的探索应用,此类研究的局限性也逐渐凸显,主要表现在探索的深度和广度均有待提高、对图片信息的解读存在主观性偏差、研究产出知识层级较低3个方面。
旅游领域内的图片大数据与计算机视觉研究尚处于探索阶段,近期虽然涌现了很多的研究,但是技术探索应用相对狭窄,深度和广度不够。首先,目前其所借用或构建的深度学习模型多来自成熟的计算机视觉领域,旅游领域特色属性解读不充分。未来有必要探索运用旅游领域内的知识展开模型训练来贴近旅游场景的需求。其次,在图片数据来源上,目前应用最为广泛的是Flickr、Instagram、Facebook等社交媒体的数据;而旅游主题性的社交平台,由于图片附带地理信息的缺失、爬取存在敏感性及技术难度限制等,仍有很大的探索空间。
图片内容不但包括所呈现的景观、建筑、人物等显性客观信息,还包含认知层面的安全性、清洁度、经济发展程度以及情感层面的愉快、放松等隐性的主观信息。目前,计算机视觉技术对客观事物的识别,准确率已提升到相当高的程度,能够精准地识别和标签化图片的显性信息;但是对隐性信息的解读,受到主观性、文化差异等影响,尚不具备足够的说服力。
社会科学领域的知识产出主要分为3个层级:第一层级是描述性的知识,解释“是什么”的概念性问题;第二层级是相关性知识,解释“关系是什么”的问题;第三层级是因果性知识,解释“为什么? 怎么办?”的问题。但受制于计算机视觉技术在解读主观信息方面天然的劣势,目前运用计算机视觉技术的图片大数据研究的知识产出层级较低,主要以第一层级和第二层级知识为主,对于事物的本质机理和内在因果探索不足。在未来有必要融合其他数据,结合其他方法,多角度深入挖掘现象的本质,提升研究知识产生的层级。
运用计算机视觉技术对图片大数据的研究虽然存在一些局限性,但正是这些局限不断启发着我们思考和进步。在未来,基于图片大数据和计算机视觉的旅游研究必将走向多元化发展,在数据来源、分析技术、研究议题、研究路径和研究领域上均呈现交融多元的状态。
在图片来源方面,一方面研究者需要跳出单一数据平台,拓宽挖掘多社交媒体平台,构建多来源数据相互佐证的研究框架。另一方面,需要注意大数据的多样化结构属性,如街景数据、视频数据、地理坐标数据、声音数据、文本数据等的融合交叉将成为研究趋势。值得注意的是,计算机图形学(computer graphics)领域内迅速发展的增强现实技术(augmented reality,简称AR)和虚拟现实技术(virtual reality,简称VR)也带来了新视觉数据,这些新涌现的视觉类数据对旅游图片研究提出了新的挑战。
在视觉技术方面,目前研究者多是对已经公开发布的不同技术模型进行尝试,选择最合适的分析模型,或通过运用多种成熟视觉模型挖掘数据价值。在此基础上,研究者通过改良或自主训练符合旅游场景的技术模型,将逐渐成为加快计算机技术与旅游融合的研究趋势。
目前,图片大数据的旅游研究主要议题包括游客行为与感知、目的地形象、营销策略、主客关系、时空行为等,而图片大数据由于其丰富的信息在旅游研究的诸多方面都有重要价值。在未来技术进一步发展的情况下,研究议题必将走向多元化,涌现出更为小而聚焦的研究议题;即,更为关注前因后果的关联关系,更为关注心理学、社会学的原因探究和实证,更为强调基于数据属性的理论创新和延展。
旅游领域内诸多学者已经意识到了利用大数据开展单一研究的局限,探索多方法多路径的融合必定是未来的趋势。大数据方法、场地实验和实验室实验法、社会学定量定性研究法和生理仪器测度法等多种研究路径交叉融合,相互佐证,可以为更好地挖掘现象背后的本质提供解决思路。其中,大数据揭示现象,小数据解释机理将成为一种值得尝试的范式。同时,随着多领域知识溢出,基于图片大数据的旅游研究将全面与地理学、心理学、市场营销、计算机科学、管理工程等领域交叉渗透、多元发展。
作为总结,旅游领域运用计算机视觉技术对图片大数据已经进行了不少有意义的探索。未来研究应更关注旅游主题性数据、图片信息主观性解读、研究知识产出层级等焦点,在数据挖掘、AI技术建构、研究议题、研究路径等方向全面走向多元化、深入化发展。
张坤博士南开大学旅游与服务学院副教授张津沂南开大学旅游与服务学院2021级硕士研究生
郑伟民
早期,旅游活动常被认为是日常生活的溢出,这导致旅游学科往往被置于社会科学的边缘。近年来,随着“移动范式”的出现,旅游在社会活动中的重要性备受关注,旅游移动性也因此逐步成为旅游研究中的热门话题。另外,作为近几十年来发展最为迅速的行业之一,旅游业在促进目的地经济和社会发展的同时,也带来一系列尖锐的问题和挑战。因此,对于旅游移动性的研究有助于理解游客行为、揭示游客和居民的“主—客”空间交互关系、分析旅游活动与居民生产生活的互动机制,进而有助于优化目的地公共资源配置和规划、促进旅游与其他经济社会功能协同发展。因此,旅游移动性已成为近年来旅游研究的热点问题。
旅游活动具有高度的复杂性,涉及人与人、人与社会、人与环境等多重关系。因此,对于旅游移动性的研究不仅需要与旅游活动相关的经济社会和自然环境的信息,也需要大量游客时空移动数据。在过去很长一段时间,观察法和个体调查法是获取旅游移动数据的主要方法。这些方法需耗费大量人力和物力且效率低下,从而制约了旅游移动性研究的开展。近年来,得益于移动互联网和各种追溯技术的快速发展,实现了对个体时空数据的精确采集。这些海量时空数据已被广泛应用于旅游研究和实践中(如GPS和手机定位数据等),为旅游移动性研究提供了多维度、多层次的研究视角;大数据驱动的研究范式为更好地理解“游客个体、游客群体和旅游系统”的关系提供了前所未有的机遇,极大推动了旅游移动性相关理论的发展。
与过去的旅游移动性研究相比,大数据时代下的旅游移动性研究存在一些差异:
过去的旅游移动性研究往往侧重于宏观尺度(如旅游目的地间)的群体性研究,而对于微观尺度(如景区内部)的个体研究相对较少。其主要制约原因包括:微观尺度旅游移动性往往更具复杂性,同时收集微观尺度的个体移动性信息难度更大。随着追溯技术的发展,实现了微观尺度上对游客个体时空运动数据的精确收集,从而微观尺度的旅游移动性研究不断涌现。综上,海量多源异构时空数据为旅游移动性研究提供了更为综合性的研究视角(如图1所示),包括:游客个体和群体行为特征与旅游移动性的内在关联关系、游客时空运动模式与旅游分布的时间演化规律和空间迁移规律等。
图1 研究视角与研究思路
大数据时代下的旅游移动性研究本质上属于数据驱动下的旅游研究,该研究一般遵循“数据层-信息层-知识层-应用层”的研究思路(如图1所示)。具体而言,1)数据层:数据层的采集包括两个方面,一是通过遥感影像和无人机等手段获取旅游物理空间的建筑、自然、人文、社会和经济等信息,构建综合地理环境GIS系统;二是通过各种追溯技术采集海量多源游客时空数据,其目的在于构建游客足迹空间。需要说明的是,不同类型的时空数据具有不同特征和适用场景,这在过去的一些旅游大数据综述文章中已经有所提及。多源异构游客时空数据还需要经过一系列处理,诸如去噪/补全、聚类、表征和融合等方式。2)信息层:构建时空数据语义理解框架,基于时空数据挖掘的技术和方法,从海量时空数据中挖掘有价值的模式,包括频繁模式、周期模式和异常模式,实现“数据→信息”的传递。3)知识层:在挖掘的游客运动模式的基础上,进一步探讨游客行为模式与游客分布演化及迁移的内在机理,揭示“物理空间-足迹空间-认知空间”的相互关联关系,以发现普适性规律,实现“信息→知识”的迁移。4)应用层:探讨如何将所发现的知识应用于实践中,如旅游目的地规划与设计,目的地智慧旅游管理、服务和营销等方面,完成“知识→应用”的转化。
传统的旅游移动性研究大多从社会学的视角展开,而基于多源异构时空数据的旅游移动性研究则需要涉及多学科交叉的理论和方法。在学科交叉融合形成新领域的形势下,综合集成信息科学、地理科学、统计学、管理科学和行为科学等学科研究旅游移动性,不仅拓展了旅游移动性的研究视角,而且丰富和完善了旅游移动性研究的理论体系;也有助于推进旅游科学管理方法论进步、创新跨学科的旅游管理理论。
采集海量多源异构旅游时空数据,并广泛应用于旅游研究领域,给旅游移动性带来了前所未有的契机,但也带来一系列的挑战,包括:1)这些数据来源不同、质量不同、结构不同,因此,处理这些海量多源异构时空数据也面临着多源信息的融合、迁移和互补,异构信息的表达、建模和协同等一系列挑战性的问题。2)理论驱动和数据驱动是两类区别很大的研究范式:前者侧重于识别抽象的建构体以及它们之间的关系,该范式在社会科学和组织科学中占主导地位。但是由于对时间、精力和成本的要求极高,理论驱动研究中的实证工作受到很大的限制。后者则通过探索性方法从大型数据集中提取模式,并从这些模式中得出对经验上有趣现象的见解。然而由于模式是由现有数据中的关系决定的,所以数据驱动的研究面临着建立一个关于现象的凝聚性知识体系的挑战。基于海量多源异构时空数据的旅游移动性研究正好是这两类研究范式的交融地,既需要发挥理论驱动范式的“解释性”,也需要发挥数据驱动范式的“学习能力”。因此,如何有效融合两种研究范式将是该研究成功的关键。3)该研究属于多学科交叉的研究,涉及众多学科。让每位研究者都具备这些学科技能通常是不现实的,取而代之的应是促进拥有不同专业背景、不同专业技能的研究者开展跨学科和协作性的研究项目。
郑伟民博士厦门大学管理学院副教授博士生导师
齐珊珊 ,陈海龙
智慧旅游,也可以被称为智能旅游。 当前智慧旅游的发展已改变旅游业发展战略并塑造出了新的旅游商业模式。智慧旅游可以被理解为利用云计算、物联网等新技术,通过互联网/移动互联网,借助便携的终端上网设备,发布、搜索和处理各类旅游信息的活动。它使旅游相关者可以高效便捷地开展旅游信息管理和决策,提高旅游活动开展的效率。 它可以是一个信息管理系统,也可以是一种旅游活动方式。它将 “智能”(smartness)引入旅游目的地的开发中,以游客为中心,从满足游客 “吃 、住 、行 、游 、购 、娱 ”的服务需要为出发点,借助动态信息通讯技术(ICT)平台连接多个利益相关者,实现旅游活动信息及时交换,便利决策过程。
随着旅游信息化程度的加深和智慧城市的不断建设,智慧旅游已成为我国旅游研究中的热点问题。 从事智慧旅游研究的专家学者对中国的智慧旅游的发展展开了多方面探讨,相关研究可以被划分为4个主要方面:(1)探讨和梳理智慧旅游概念并尝试为其建立理论体系;(2)从实践角度出发分析智慧旅游产品质量服务模式以建立相关的分析模型;(3)探索智慧旅游为旅游业带来的新的市场策略模式;(4)以不同旅游目的地作为研究实例分析当地智慧旅游体系拓展智慧旅游在中国各地发展的可行性。目前的研究对智慧旅游在中国的发展作出了详尽分析,拓展了关于智慧旅游的相关研究话题。当前智慧旅游的相关研究集中在智慧系统和技术方面的探讨,尚未对中国现阶段的智慧旅游实践进行总结评估。因此,本文参考不同旅游目的地智慧旅游的实践,总结中国现阶段智慧旅游系统的基本模式和框架。
2010年是我国智慧旅游元年,“智慧旅游”写入了“十二五 旅游发展规划”中,并对智慧旅游城市试点工作进行了部署,确定了江苏镇江为“国家智慧旅游服务中心” 。 南京、苏州、扬州、温州、北京纷纷宣布了建设“智慧旅游城市” 的发展战略,有条件的城市则率先开展了智慧旅游的建设。2011 年7月,时任中国国家旅游局局长邵琪伟正式提出 “用10年时间基本实现智慧旅游”,标志着智慧旅游在我国已经从理念探索进入了实践阶段。近10年来,我国智慧旅游发展的重要节点有4个:第一,2010年镇江市规划建设 “中国智慧旅游服务中心” ,掀开了我国智慧旅游发展的大幕, “智慧旅游” 的概念首次被提出。第二,2012 年5 月北京、南京、武汉等在内的18个城市成为第1批国家智慧旅游试点城市,以引导和推动全国智慧旅游的发展。第三,2013年杭州、天津、广州等15个城市进入 “第二批国家智慧旅游试点城市”名单。全国33个试点城市在发展过程中,重点结合旅游产业发展方向,引导旅游目的地建设,聚焦智慧服务、智慧管理和智慧营销三大方面,加强整合旅游资源,创新旅游产品和服务,以信息化带动旅游产业向现代服务业转变,逐步提升了旅行社、旅游景区(点)、旅游酒店等旅游企业的现代科技管理水平。 第四,2014年被定为我国的“智慧旅游主题年”,引领中国旅游业全面进入智慧化时代。
目前各地智慧旅游的建设已经出现了多种模式和内容,详见表1。本文重点列举江苏省、浙江省以及广东省所开展的智慧旅游的目的地特点,以此总结中国智慧旅游实践的基本框架。从表1中的案例可以看出,江苏省的智慧旅游模式以利用智慧技术对景区进行监控和管理以及监控游客数据为主,以服务游客以及智慧景区开发为辅。 以杭州市为例的浙江省智慧旅游系统则采取打造智慧营销平台为主,由政府投资引导建立智慧示范景区;酒店、旅行社以及乡村适度配合,从而增强游客的智慧体验。 广东省大湾区的智慧旅游建设则以政府建立的智慧旅游平台作为主导,利用手机App辅助导游系统为游客提供智慧旅游相关服务。虽然每个地区都在不同程度采用了各种技术如现代信息技术和人工智能技术等,并关注旅游大数据的采集分享、利用智慧技术对目的地进行监控,然而,智慧旅游的智慧化水平与各个城市经济科技地位并不匹配。以广东省大湾区为例,其智慧旅游的制度设计与大湾区的制度创新领先地位不匹配 ,未能满足大湾区日益增长的旅游需求。 所以,旅游目的地对智慧旅游系统的正确开发和利用迫在眉睫,只有真正了解目的地对智慧旅游系统的需求、确定合理的智慧开发计划,才有可能帮助目的地的旅游发展以及增强当地旅游竞争力。
表1 智慧旅游和智能应用
图1 智慧旅游系统框架
根据我国各个地区智慧旅游发展的特点以及对智慧科技的应用,参考已有的智慧旅游目的地的5个应用层面:旅游资源及基础设施(物理层)、智能技术层、数据层、基于可利用技术和相应数据源进行创新的业务层以及体验层。本文梳理不同地区的智慧旅游应用和系统,总结出图1所示的智慧旅游系统框架。由图1可以看出,我国的智慧旅游系统大致分为3个层面:第一层,智慧旅游系统基本内容,其中包括目的地本身的基础设施以及公共服务平台和应用目标;第二层,智慧旅游系统的智慧表现,其中包括期待为游客提供的旅游服务,利用智慧科技对景区采取的旅游管理以及关于目的地的旅游营销策略设计;第三层,发展层,其中包括3个主要的发展阶段:以技术驱动为基本特征的初步发展建设阶段,以满足市场需求为特征的完善发展阶段,以信息共享为目标、良性互动为特征的信息公开、服务互动阶段。相对于其他两个层面,发展层对景区智慧旅游的发展起着决定性的作用,它决定着景区的智慧旅游发展模式和方向、智慧技术的应用主体以及智慧旅游的运营模式。值得一提的是,应加强探索智慧旅游目的地的筹备以及制定智慧发展规划,以此来确定应用的主体、开展运营的模式等。景区的智慧发展筹备离不开智慧科技的支撑和支持,这些技术包括:云计算、互联网、物联网、人工智能、大数据等。旅游目的地可以按照自己对智慧旅游的需求和所要呈现的智慧目的地形象参考图1对自己的智慧系统进行初步设定,选取合适的发展模式、服务对象以及合作对象进而决定要采用的智慧技术从而创建适合自己区域的智慧旅游目的地系统。
总的来说,有效地开发智慧旅游目的地可以为游客提供个性化的旅游服务带来更全面的旅游体验,具体体现在游前、游中、游后3个方面提升旅游者的体验。 游前:提供实时信息,做出明确决策;游中:获取实时信息、探索目的地、个性化服务、实时反馈;游后:延长参与体验、提供良好的反馈系统。不同的地区应根据自己的信息技术发展的成熟度、旅游资源的丰富程度以及用户群的需求来开发适合本地区的智慧旅游系统,克服大数据管理下旅游景区发展所带来的困难以及挑战,联合不同的应用主体,打造适合当地发展的智慧旅游运营模式。应以目的地可持续性发展为目标,利用智慧技术实现旅游景区的智慧化、人性化和个性化。
齐珊珊澳门旅游学院副教授陈海龙中山大学旅游学院2020级博士研究生