吴 涛,汪 璐,秦 建 新*,向 隆 刚,曾 芷 萱
(1.湖南师范大学地理科学学院/地理空间大数据挖掘与应用湖南省重点实验室,湖南 长沙 410081;2.武汉大学测绘遥感信息工程国家重点实验室,湖北 武汉 430079)
“社会感知”作为一种研究人类时空行为特征、揭示社会经济现象的理论和方法,已广泛运用于城市功能区识别[1]、用户时空行为研究[2-5]、城市规划[6]、旅游活动类型判别[7-10]等方面。近年来,地理空间智能(GeoAI)作为地理空间科学和人工智能深度融合的交叉学科,有力提升了对地理现象过程的动态感知、智能推理和知识发现的能力。大数据时代基于社会感知的地理空间智能研究和应用主要有个性化路径[11,12]、灾害预测[13]、测绘[14-16]、智慧交通[17-19]、智慧医疗[20,21]、智慧养老[22,23]、智慧政务[24,25]等。在智能出行方面,Hung等[26]采用加权方法最小化出行规划的距离成本;Sun[27]提出以最小链路出行时间和出行距离为优化目标的多目标动态路线选择模型,保证乘客在最短出行时间和距离上选择可靠出行路线;Zhou等[28]提出一种基于朴素贝叶斯兴趣数据挖掘机器学习的智能旅游路线规划算法。上述研究在出行规划中鲜有考虑个体意愿,导致推荐的出行路线个性化不足;部分研究虽然分析了个性化的出行方案,但并未与时空环境信息进行充分的动态连接,如李迎[29]在地理兴趣区域推荐模型中仅考虑地理因素,未引入时间因素进行更全面的用户偏好信息挖掘。
综上,为弥补出行方案个性化的不足,本文基于出行方案推荐与时空环境信息动态连接的现状,提出基于众源时空信息的个性化路线服务框架,利用众源时空大数据感知公众的出行偏好,将大众对不同地点的偏好、时间与成本预算等信息映射到实际路网空间中,融合个人意向进行动态建模分析,以期为用户提供合适且个性化的出行方案。
本文根据社会感知的研究框架[30],提出基于众源时空信息的个性化路线服务框架(图1a),包括众源感知、智能推荐、路线规划、行程共享4个模块。1)在众源感知模块中,对OSM、大数据展示等平台提供的众源时空大数据进行预处理,验证其信息可靠性,然后由智能推荐、路线规划、行程共享3个模块进行引导,设计出符合众源感知的出行路线;2)在智能推荐模块中,将从百度地图、OpenStreetMap、Flickr、社交网站(如 Facebook、新浪微博等)获取的众源数据[31]融合并根据用户偏好信息,通过客户端进行搜索,结合改进的隐马尔可夫模型(Hidden Markov Model,HMM)与动态路线优化算法,即可针对实时兴趣点的人流量、道路拥堵情况、用户偏好等信息对用户进行智能推荐,同时还可使用拓扑语义匹配查询历史轨迹,减少互联网的信息超载,推荐与用户偏好类似的区域,提供更好的定位服务与出行体验;3)在路线规划模块中,客户端将用户数据传入系统,系统将用户的特定需求与实时路网数据、POI及其热度数据[32,33]结合,筛选出符合用户需求的景点类型,而后将结果可视化,以供用户选择出行路线。4)在行程共享模块中,用户通过移动设备在网络平台上发布包含图片(像)、文本语义的感知信息,在社交媒体共享其行程[34],平台将组织与存储用户行程规划和实时旅游信息(如景点交通情况、附近推荐等),并将历史用户的多样化出行路线进行可视化制图,同时,后端服务器将共享的旅游信息等融入智能推荐模块,方便其他用户检索与查询。图1b为基于众源时空信息感知的个性化路线服务场景。
图1 基于众源地理数据的个性化路线服务框架及场景Fig.1 Personalized routing service framework and scenario map based on crowdsourcing geographic data
在个性化路线服务框架的路线规划模块中,本文利用众源时空大数据改进的HMM模型[11],根据个人意愿、POI热度和路线约束进行动态路线规划。改进的HMM模型表达式为HMM=(O,S,P,G),其输入参数为观测状态集O、观测序列S、POI数据集P、路网G和POI-PP(投影点),其实现流程(算法1)为:1)使用POI的推荐信息计算每个POI的大众推荐度,并构建第一层隐藏状态,检查与观测序列相对应的所有观测状态,并检查每个观测状态下的所有POIs,得到每个POI在相应状态下的大众推荐度,通过分析POI的大众推荐度即可得到用户在不同时期对POI的偏好;2)构建第二层隐藏状态,该层考虑了路段与POI之间的距离,设置一个距离阈值,计算POI在该阈值内相邻路段的所有投影点,即可得到POI在第二层隐藏状态路段上的投影,这些POIs的投影可表示为每个隐藏状态的候选点;3)利用路网G计算两个POI点之间的大圆距离GD、不同观测状态下投影点之间的路线距离RD以及POI到投影点之间的大圆距离PD,并利用POI的热度值计算观测概率,即某状态在不同时间内所有POIs的热度值及其对路段的投影,将二者相乘得到每个POI投影点的观测概率EP,并计算每个POI投影点从状态Si到Si+1的转移概率TP;4)将上述步骤计算得到的数据与参数导入HMM,利用Viterbi算法即可生成最优路线的POI访问序列,即根据用户个人兴趣满足用户需求的最佳出行路线[35]。
算法1 基于两层映射的HMM路线规划方法
Input:States of observation O;A sequence of observation S;POIs Dataset P;Road network G;The recommendation of POIs PP
Output:Optimal personalized route R
1:PopIndex=calPopularityIndexInfo(P,PP);// 计算每个POI的大众推荐度
2:Spoi=Sequence(O,S,P,PopIndex);// 每个观测状态下的所有POI
3:Sproj=Project(Spoi,G);// 得到POI在路段上的投影
4:foreach hidden state in sido
5: RD=getRouteDistance(Sproj,G);// RD代表两个投影点之间的路线距离
6: GD=getGreatCircleDistance(Spoi,G);//GD代表两个POI之间的大圆距离
7: PD=getPOIToProjectionDistance(P,Sproj);// PD代表POI到投影点之间的大圆距离
8: EP=getEmissionProbability(Sproj,PD);// EP 代表POI投影点的观测概率
9:foreach projection of the POIdo
10: TP= getTransitionProbability(Sproj,RD,GD);// TP代表从Si到Si+1的转移概率
11:endfor
12:endfor
13:R=createIndividualRoutesModel(EP,TP,G);
14:returnR;
基于众源时空信息的个性化路线服务平台(图2)运用众源时空数据接入机制与智能路线规划、语义轨迹数据的组织查询机制、前后端与线下平台的协作机制等核心技术,为用户动态规划智能出行方案,其系统架构包括前端、后端服务器、数据库、网络四方面。前端即搭载的微信小程序,接收数据平台发布的数据并验证其可靠性,提供个性化旅游路线设计、历史轨迹搜索、景点介绍、用户留言板、出行图片发布等功能,可及时、准确、完整地根据用户偏好和实际路网信息为用户提供个性化路线服务;用户通过微信小程序搜索引擎和轨迹语义查询,获取不同主题的景点推荐度、周边服务等信息。后端服务器由基础GIS服务构成,包括腾讯在线地图开放平台和云端服务器。腾讯在线地图开放平台可以提供实时路网数据、兴趣点数据,通过调用腾讯地图服务提供的API接口完成相关算法。后台的核心数据管理部分是基于腾讯云端服务器(AMD EPYCTMRome 2核、八通道DDR4 4 G内存、5 Mbps带宽)部署的SSM框架,即通过Spring的IOC特性和AOP特性实现对象间的依赖关系并支撑便捷解耦,通过SpringMVC与Spring的无缝链接实现灵活的数据验证、格式化和数据绑定机制,通过MyBatis实现业务系统对后台MySQL数据库的管理和维护。面对业务突增带来的资源不足问题,腾讯云服务器可随时在线增加服务器的CPU、内存、硬盘及带宽等配置[36],或增加服务器数量以解决问题。
图2 个性化路线服务平台——TinspirationFig.2 Personalized routing service platform——Tinspiration
长沙市是我国中部崛起和长江中游城市群的重要战略支点,2019年开始从传统意义上的智慧城市向新型智慧城市演进,2021年入选“智慧城市+智能网联汽车”首批国家试点。岳麓区是长沙市独立的行政建置,常住人口数量位居长沙市各县市区之首,拥有岳麓山等生态景观、岳麓书院等89处文物保护单位、中南大学等16所高校,因此,本文重点选取长沙主城区的岳麓区为研究区域,研究基于众源地理数据的个性化路线服务体系。研究数据包括从OSM平台获取的实验区2019年实际路网数据,并根据不同主题的大众推荐度从百度地图开放平台获取76个POI作为实验点,将其分为大学、主题乐园、古迹、剧院等12个主题。
本研究进行两组实验,实验1选取大学、公园、主题乐园、古迹、博物馆、剧院6个主题为实验对象,实验2选取名山、商场、公园、剧院、大学、车站6个主题为实验对象。为验证不同时段POI热度值对路线规划的影响,本文获取不同月份的POI热度数据分别进行实验。将POI热度划分为0~0.2、0.2~0.4、0.4~0.6、0.6~0.8、0.8~1.0共5个等级,通过改进的HMM模型得到不同月份的最优路线(图3、图4)。由图3、图4可知,随着月份改变,路线也发生相应变化,缘于人们在不同月份对POI的关注度不同。例如,实验1中,5-6月世界之窗的大众推荐度高于海底世界,而在7-9月大众更偏向后者,主要是因为7-9月天气酷热,不适宜室外主题乐园游玩。随着POI关注度提升,规划路线对其选择率也增大,但由于距离因素,关注度最高的POI并不意味着最佳选择。本文同时考虑POI间的路线距离等因素计算出最优路线,且在大多数路线中,候选点一般是该主题中大众推荐度最高的POI。例如,实验2中,5-12月的最优路线保持一致,说明选取名山、商场、公园、剧院、大学、车站6个主题规划路线所展示的POI推荐度最高,进而说明在改进的HMM模型中,热度数据作为一个影响因素与POI的选择关系密切。
图3 实验1 中6个主题不同月份的最优路线Fig.3 Optimal routes of six subjects in each month in experiment 1
图4 实验2中6个主题不同月份的最优路线Fig.4 Optimal routes of six subjects in each month in experiment 2
实验1和实验2分别基于1月份和9月份数据,对本文改进的HMM模型与传统HMM模型和最短路径分析方法进行对比(图5、图6)。传统HMM模型仅依据已有的POI规划路线,不考虑POI的大众推荐度,其提供的规划路线与本文方法在博物馆、主题乐园、大学3个主题中选取的POI热度等级区别很大,选取的皆是热度等级最低的POI(图5),获取的路线并未融合大众偏好。最短路径分析方法仅考虑了距离因素,忽略了其他影响个性化路线规划的因素,其提供的规划路线仅选取了途经名山、商场、公园、剧院、大学、车站6个主题中路线最短的POI,规划路线在商场主题中仅考虑距离因素,选取POI热度较低的万达广场(本文方法选取热度值明显高于万达广场的五一广场)(图6)。因此,传统HMM模型与最短路径分析方法得到的路线规划结果可能只是由大众推荐度较低的POI组成的一条相对不受欢迎的路线,无法满足出行者的个人意愿,对大众吸引力较低。本文改进的HMM模型根据状态序列随时间变化而建模,将时空特征与静态数据相结合,不仅考虑了不同时期POI与环境间的相互作用对人们出行的影响,还考虑了不同月份POI的热度值,得到的路线与POI热度符合率较高(图5、图6),可在短时间内提供满足用户需求的最优路线。
图5 实验1基于1月份数据3种方法获得的最优路线Fig.5 Optimal routes obtained by three methods based on the data in January in experiment 1
图6 实验2基于9月份数据3种方法获得的最优路线Fig.6 Optimal routes obtained by three methods based on the data in September in experiment 2
本文提出基于众源地理数据的个性化路线服务框架:基于全局路网与众源数据的联系,将众源时空信息与出行者的个人意愿映射到实际路网空间,借助改进的HMM模型进行动态建模,最后选取长沙市岳麓区不同月份的POI热度数据进行实验。结果表明,基于众源地理数据的个性化路线服务框架可根据大众的偏好与意向,在短时间内灵活规划不同时空背景下的出行路线,能够响应用户的多样化需求,设计出一条贴合用户特质和偏好的出行路线,极大提升用户的体验感受,以此助力智慧城市的建设,打造文旅融合新生态。本研究在以下方面有待进一步探讨:1)保护用户隐私,借鉴其他方法完善基于众源时空信息的个性化路线服务平台;2)完善服务器应急机制,以应对突发情况下的数据稳定获取问题。