基于Airbnb数据的旅游共享住宿信任机制分析

2022-08-29 06:58李佳珂曾清清
电脑知识与技术 2022年20期
关键词:房源住宿房东

李佳珂,曾清清

(1.海南大学旅游学院,海南海口570228;2.聊城大学计算机学院,山东聊城252059)

1 引言

随着经济不断发展,旅游业不断活跃,人们在享受旅游带来的乐趣的同时,不得不承受高昂旅游住宿费用。近年来,依托云计算和物联网平台,共享经济得到不断推进和发展。作为共享经济和旅游业的融合产物,共享住宿也逐渐成为人们关注的热点。据统计,2017年“十一”黄金周,不少旅游者住宿到共享住宿平台提供的房间。据近年来《中国共享经济发展年度报告》结果显示,中国共享住宿业交易额在2020年达到225亿元,在全部住宿业客房收入占比达到6.7%。图1 展示了2015—2020 年中国共享住宿市场规模变化趋势。图2 显示了2016—2020 年中国共享住宿收入占全国住宿业客房收入比重变化趋势。由图可见,2018—2019 年是共享住宿市场热潮时期,之后共享住宿发展趋向平缓,2020年受新冠肺炎疫情影响,共享住宿市场进入寒冬季。为打破这种僵局,2020 年7 月,发改委等13部门印发的《关于支持新业态新模式健康发展激活消费市场带动扩大就业的意见》,明确提出鼓励共享住宿,发展生活消费新方式,至此,鼓励发展“共享住宿”首次写入政府文件。

图1 中国共享住宿市场规模变化趋势

图2 中国共享住宿占全国住宿业客房收入比重变化趋势

文献[1]以共享短租平台小猪短租网站的房源数据为例,分析了共享短租平台供给者端的房源及房东特征。该文献分析指出规模化的房东的定价往往高于离散化的房东,另外,共享房源的定价还会受到包括房源位置、配套设施、交通方便性、二手房房价等诸多因素的影响。文献[2]以Airbnb 与携程平台为例,对共享与传统住宿平台价值创造因素进行分析。文献[3]则从政府被动反应、政府主动引导和政府与平台合作三种不同监管机制出发,分析了城市共享住宿监管的路径、机制和措施。文献[4]则以Airbnb 共享住宿为研究对象,借助空间分析工具,对上海市2010—2019年期间共享住宿位置空间变化进行过了分析,并针对道路密度、经济水平、房源供给、服务群体与空间集聚等因素进行了加权回归分析和研究。文献[5]分析了Airb‐nb在共享住宿领域里的商业模式创新及其面临的业绩计量难题。文献[6]以Airbnb北京地区的在线短租数据为分析对象,研究了房源定价合理性对房源热度的影响关系。文献[7]2010—2019年北京市Airbnb数据为基础,运用GIS空间分析和空间变差函数方法进行时空演变及集聚特征进行分析。文献[8]则运用TRIZ 理论模型,提出了共享住宿标准体系的构建过程及体系框架。文献[9]从小猪短租平台上爬取的北京、上海、广州和深圳等地的6953 条有效房源数据,揭示了房客可持续消费行为的影响机制,为提升共享经济中消费者的可持续消费行为提供新思路。文献[10]针对共享住宿文献进行综述分析,指出2012—2015 年为萌芽阶段,2016—2019 年为发展阶段。文献[11]则对共享住宿中信任的概念、信任的类型、信任研究的理论基础,以及房客、房东视角下信任建立的前因变量、信任的对象和结果变量的剖析。文献[12]则分析了共享住宿发展的信任、监管两个维度,房东、游客、产品和平台四个方面的因素等对共享住宿的影响,探讨了包括案例分析归纳、深度访谈、文本分析、内容分析、结构方程模型、特征价格模型、最小二乘法、固定效应回归模型等研究方法。文献[13]则围绕如何正确引导共享经济健康发展中应对道德风险的挑战,以爱彼迎为单案例进行研究。

2 共享住宿平台Airbnb

民宿日益成为旅游过程中非常重要的一环,然而,很多旅客对于民宿还不是非常熟悉,导致民宿住宿量还不是很高,通过网站搜索可以看到北京某地的民宿信息如图3所示。随着民宿的不断发展,结合共享经济的推进,共享民宿已经成为民宿经济的重要分支。

图3 民宿信息搜索图

Airbnb 是共享住宿的先驱,其核心思想是采用点对点(peer-to-peer)住宿模式。通过把房东的空余房间与旅行者的住宿需求建立联系,实现了共享住宿,促进了旅游住宿的新发展。自2008 年成立以来,Airb‐nb 已经成为覆盖全球190 多个国家和地区、涵盖81000多个城市的全球共享住宿平台。2015年Airbnb引入中国,并迅速发展。

2.1 Airbnb数据分析

Airbnb 数据针对每个房源主要分为6个板块,即房源详情、评价信息、可订日期、房源位置、旅客须知、房东信息。具体如下:

1) 房源详情:房源名称、卧室数量、床数、卫生间类型和数量、最多容纳旅客数量等;

2)评价信息:房源收到的评论总数、房源旅客的如实评价信息等;

3)可订日期:房源最早可预订日期、房源最少入住天数、房源最多入住天数等;

4) 房源位置:房源所在省份、城市,所在经纬度,周边配套公交、地铁、交通信息等;

5)旅客须知:房源对旅客入住的基本要求、取消预订政策和交易提示、是否禁止携带宠物入住等;

6) 房东信息:房东的名字、联系方式、房东是否为超赞房东、房东收到的总评论数、房东自我介绍等。

表1 给出了Airbnb 平台上北京某地共享住宿房源的关键信息。图4展示了Airbnb网站展示的北京共享住宿数据。图5展示了中国香港共享住宿部分数据和比率分析。由上述图表可见,相对于民宿信息搜索结果,Airbnb 共享住宿平台发布的数据更为详细和稳定。

图4 Airbnb网站展示的北京共享住宿数据

图5 中国香港共享住宿数据展示(部分)

表1 Airbnb数据示例

2.2 地图标记

本文采用LocalSpace Viewer 进行地图标记。LocalSpace Viewer是一款集成多种在线地图资源,包括百度地图、天地图、影像、标注。该软件特点是浏览速度快、支持载入天地图影像、腾讯影像等多家影像数据、支持载入天地图地图、标注、道路标注等。以中国香港共享民宿为例,地图标记的具体步骤如下:

第一步,先从Airbnb 网站(http://insideairbnb.com/get-thedata.html)下载中国香港共享民宿的数据,找出其中的listings.csv文件;

第二步,打开listings.csv 文件,找到经度纬度对应的列,如图6所示。需要注意的是,经纬度数据每一行的位置有时候不一致,需要调整位置;

图6 中国香港共享住宿数据展示(部分)

第三步,复制每个共享住宿的经纬度数据到一个单独的Excel文件,比如Hongkong.xlsx;

第四步,打开LocalSpace Viewer 软件,选择工具箱菜单中的“Excel转KML”工具如图7所示,弹出对话框如图8所示;

图7 Excel转KML工具示意图

第五步,在图8对话框中,选择“打开XLS”,选择Hongkong.xlsx,选择经纬度列的编号,然后选择生成点,生成KML 文件,显示结果如图9所示。

图8 Excel转KML工具对话框图

图9 中国香港部分共享住宿标记图

2.3 爬虫设计

网络爬虫(又称为网页蜘蛛、网络机器人、网页追逐者),是一种按照一定的规则,自动地抓取Internet 网信息的Python 程序或者脚本。通过适当设置需要爬取的特征,网络爬虫可以获得有效信息。本文通过下载Airbnb网络爬虫,爬取了北京共享住宿网站的信息,爬取过程如图10所示。通过爬取数据,获得每个共享住宿的有效信息字段,包括价格、浴室数量、卧室数量、床的数量、网址、可住旅客数量、所在城市、纬度、经度、评分、评论数量、具体评价信息、星级、附加服务信息等。

图10 Airbnb网络爬虫爬取过程图

经过20小时的爬取,获得5543条共享住宿信息,上述信息保存在Excel 表格中,通过导入LocalSpace Viewer 进行地图标记,结果如图11所示。

图11 北京部分共享住宿标记图

需要指出的是,Airbnb网站提供了部分城市的共享住宿地图标记图,但国内仅限于北京、上海、中国香港三地,其他城市Airbnb分布图可以通过本文的方法进行地图标记。

3 共享住宿信任机制分析

共享住宿信任值是一个非常关键的变量,影响了旅客的选择,一般来说信任值受到多个变量的影响[14-17],如表2所示。

表2 影响共享住宿信任机制的关键变量及其含义

3.1 回归树信任机制分析方法

因变量作为信任的重要载体,体现了房客对不同房源的信任度的高低。信任水平高,房客与房东之间更容易建立信任关系。因此,随着共享经济不断发展,信任值越来越体现其重要性。

回归树法是一种比较有效的信任值因素分析方法。具体步骤包括:

1)采用网络爬虫爬取某地区共享住宿房源的信息,信任相关的要素包括卧室数量、床位数量、最大可容纳人数、总评论数、同类房源平均评论数、差评率等;

2)计算实际收到的评论数量与同类房源平均评论数的差异率作为信任的替代变量;

3)建立若干个回归树模型,模型筛选出对信任水平造成影响的主要因素、作用方向、作用强度信息;

4)分析回归树各级节点,分析出某个信任因素对信任水平的影响度。

3.2 信任机制分析其他方法

与信任机制相关的其他方法还有很多,主要有:

1)核密度估计

核密度估计主要用于房源点位数据的空间聚集度分析,即共享住宿房源在空间扩散的距离衰减规律。

2)空间自相关

空间自相关主要用于分析地理位置相近的不同共享住宿房源,描述分析其相关度。莫兰指数是一种评价空间自相关的系数,其含义是用于判别空间是否存在自相关。

空间自相关方法分为全局自相关和局部自相关两类[4]。

式中:Id为全局相关莫兰指数;Ii为局部区域自相关性;n为所研究房源的数量;Xi、Xj为区域i、j的共享住宿房源密度;wij为空间权重矩阵;S2为区域观测值方差[4]。

4 总结

本文针对共享住宿Airbnb 平台的数据进行分析,采用Py‐thon 网络爬虫进行数据爬取,之后采用LocalSpace Viewer 进行地图标记,方便对Airbnb 数据进行展示。另一方面,针对共享住宿信任机制,以Airbnb数据分析结果为基础,分析了回归树、空间相关性等方法。

猜你喜欢
房源住宿房东
男生女生住宿差异大赏
给黄鼠狼当房东
袋熊房东炼成记
在线民宿首次出租间隔时长影响因素研究
——基于信号理论视角
民宿市场占比已超星级酒店
海鸟遇上恶房东
住宿业