公交一卡通MaaS平台中的用户画像系统设计与实现

2024-05-07 11:13麦家健
中国新通信 2024年3期
关键词:数据仓库画像公交

麦家健

摘要:MaaS(Mobility as a Service,出行即服务)是交通出行发展的趋势,公交一卡通公司依托自身在交通领域的优势开始建设MaaS方面的探索。为充分挖掘用户价值,提供精准服务,本文提出利用平台数据资源,运用大数据建设用户画像的设想,详细描述了有关技术路线和架构设计,并设计了面向公共出行领域业务用户标签体系,描绘了有关应用场景。为MaaS盘活数据资源,提升服务价值提供了新思路。

关键字:MaaS;大数据;智慧交通;用户画像

一、引言

随着近年来移动互联网的发展,在交通出行领域兴起了一个新的服务模式MaaS(Mobility as a Service,出行即服务),即由统一的服务提供商整合不同出行方案,为用户提供一站式出行服务。在当下企业数字化转型的浪潮中,为了精准识别用户需求、提供定制化服务、拓展业务范围,MaaS服务商愈发重视用户画像系统的构建,运用大数据技术精确了解用户,并有针对性地开发产品和服务,提高市场竞争力。

二、Maas出行服务发展概况

(一)Maas的发展起源

一般认为,MaaS(Mobility as a Service,出行即服务)的概念最早由芬兰智能交通协会主席Sampo Hietanen在2014年的欧盟智能交通系统大会上提出。MaaS参考了云计算的“XX即服务”(IaaS、PaaS、SaaS)理念,强调交通工具的使用而非拥有,通过降低公众对私家车出行的依赖,达到缓解交通拥堵、降低碳排放等一系列问题。欧美国家随即开始商业化尝试,并创建了MaaS平台,如Whim、Ubigo等[1]。

(二)Maas国内发展

随着国际MaaS发展热潮,我国各级政府部门纷纷出台一系列政策文件,推动MaaS发展。在2019年,党中央、国务院发布的《交通强国建设纲要》提出“大力发展共享交通,打造基于移动智能终端技术的服务系统,实现出行即服务”的战略部署[2]。交通运输部、北京、上海等10余个省市均将MaaS纳入有关十四五发展规划。

在產业落地层面,国内主要有两种类型MaaS平台。一是互联网企业建设运营的MaaS平台。这类平台以某家互联网厂家的服务为核心,整合有关出行服务资源,提出一体化的出行解决方案。例如,高德地图,其核心服务是基于地图的信息检索及出行规划,是一个优质的出行服务平台入口。高德地图通过与其他交通出行服务商合作,为用户提供出租车/网约车、共享单车/电动车、公共交通、小汽车、飞机、铁路、货车、长途客车等一揽子出行服务。滴滴出行以出租车和网约车为核心业务,对外延伸租车、共享单车、客运等一系列出行服务[3]。

二是传统公交集团/公交一卡通公司通过数字化转型建设运营的MaaS平台。广州市的MaaS平台是基于“羊城通出行”“如约巴士”“如约的士”等现有出行服务平台,整合一站式出行服务平台,从打通市内交通方式和票务系统出发,逐步接入飞机、铁路、城际、航运等交通方式[4]。

三、面向MaaS的用户画像设计与实现

(一)引入用户画像的必要性

1.MaaS的发展与制约因素

公交卡一卡通公司基于自身的定位及优势运营MaaS,其发展通常有以下路径:一是从传统交通服务领域延伸至本地市民服务、本地生活服务延伸;二是打通出行链,为用户提供一站式/一票式的MaaS平台,提供更便捷的服务;三是深耕用户价值,建设碳普惠等平台,引导绿色出行理念,提高用户活跃度。

但在发展的过程中也常常遭遇以下困境:

(1)数据孤岛现象。公交卡一卡通公司通常拥有公交地铁刷卡、班次、站点数据乃至其他出行场景的数据,但这些数据往往存在于孤立的系统中,并未共享与整合。

(2)用户数据缺乏加工。公交卡一卡通公司通常只是记录用户出行消费的原始数据,未加工推导出用户的出行信息,如用户的出行习惯、职住关系等,无法定制个性化的出行服务(如定制公交等)。

(3)未能精准识别用户特征。没有充分利用系统中留存的用户数据,无法准确识别用户所属群体、消费偏好,影响了业务的多元化拓展。

2.解决思路

当下数字化浪潮席卷世界,各企业纷纷进行数字化转型,运用云计算、大数据、人工智能手段重构业务,提升组织效能。从数字化的角度审视MaaS的内核,不难得出以下结论:MaaS 实质上是交通领域新型供需关系组织者,其本质是以数字信息为核心生产要素,对各类交通方式进行一体化供需即时组织优化,从而实现交通供需的动态均衡和精准匹配[1]。用户的“人”数据则处于核心地位。MaaS构建大数据平台为基础的用户画像体系,深挖用户价值,成为突破上述发展困境的一个抓手。

3.基于大数据的用户画像系统

用户画像(persona)这一概念最早出自交互设计/产品设计领域,由交互设计之父 Alan Cooper 提出,他提出用户画像是真实用户的虚拟代表,是基于真实数据的目标用户模型[5]。显然,关于用户的海量数据是构建用户画像的基础,MaaS用户画像可以看作交通大数据的具体应用。

(1)数据平台设计

数据平台是一种能够为企业提供数据分析能力,支撑上层数据应用并促进企业数字化转型的底层基础设施。它包含数据存储和数据计算分析等能力,通过汇集各方数据,提供全生命周期的“采集-存储-分析-管理-应用”软件支持。经过数十年的发展,数据平台的架构经历了数据库、数据仓库和数据湖三个阶段,并开始出现湖仓一体的融合趋势[6]。

数据仓库具有规范性,可集中存储和计算结构化数据,但成本较高,无法处理半结构化和非结构化数据,扩展性一般且扩展成本高。数据湖具有更大的存储容量,支持高效访问多种类型的数据,但不支持事务处理,数据质量难以保障,并且缺乏一致性和隔离性。湖仓一体指的是将数据湖和数据仓库的优势融合在一起,形成一体化且开放式的数据处理平台。通过湖仓一体技术,数据处理平台可以支持多种数据类型的统一存储,并实现数据在数据湖和数据仓库之间的无缝调度和管理,上层可以通过统一接口进行访问、查询和分析。总体而言,湖仓一体通过引入数据仓库治理能力,将高效建库和灵活建湖两个优势融合在一起,提升了数据管理效率和灵活性[6]。

在技术选型方面,本文采用PostgreSQL和Hadoop来支持数据仓库和数据湖。结构化数据采用PostgreSQL数据库进行管理,而车辆GPS轨迹和系统日志等半结构化/非结构化数据则存储在HDFS文件系统中,相当于数据湖。同时,借鉴湖仓一体中的“仓外挂湖”理念,可以通过外部表的方式在PostgreSQL中访问HDFS中的文件,实现元数据的统一管理。特别地,由于MaaS系统需要存储和分析大量的空间数据,通过在PostgreSQL中加载PostGIS插件,可以高效地进行空间计算任务。

(2)数据架构

从数据管理的角度看,构建用户画像的过程实际上是通过数据建模对原始数据进行ETL(Extract, Transform, Load)处理,进行汇聚、清洗和加工。然后结合机器学习(人工智能)等手段进行标签提取,最终形成专题的数据集市。通过用户画像数据及其上搭建的应用,可以进一步为其他应用提供支持和赋能。

系统架构图如图1所示。

数据源层主要包括组织内外部数据,通常由各业务系统提供。内部数据包括公交一卡通系统、金融核心系统、APP及小程序日志、客服系统及自营商城等。外部数据主要是出行服务商提供的数据,通过前置机或数据接口方式提供,包括公交管理平台、客运系统、航运系统、停车系统等。在数据结构类型方面,客服系统的用户咨询投诉记录、公交平台提供的GPS轨迹属于半结构化/非结构化数据。

数据层按照企业级数据仓库(EDW)的标准划分为贴源层(ODS)、数据仓库层和数据集市层。

贴源层(ODS层)实现了数据的初步汇聚和整合,业务系统直接抽取出来的数据先留存在ODS层进行缓存。这些数据从数据结构和数据之间的逻辑关系上都与业务系统基本保持一致。ODS层承担了一定的数据转换任务,将原始数据进行初步的清洗,并将其转换为符合数据仓库需要的格式。例如日期类型有“YYYY-MM-DD”“MM/DD/YY”等多种格式,经过清洗统一整理为“YYYY-MM-DD”格式。

数据仓库层的任务是从ODS层通过ETL过程,将数据映射到相应主题域上。数据仓库的主题域在设计阶段通过数据建模确定,一般符合第三范式(Third Normal Form,3rd NF)并保持较粗的颗粒度。根据MaaS业务特性,常设定主题域包括当事人(Involved Party)、事件(Event)、渠道(Channel)、设备(Equipment)、清算(Clearing)、行程(Trip)、场景(Scenario)等。

数据集市与数据仓库没有特别明确的界限。一般可以理解为数据集市基于数据仓库构建,前者可以看作后者的一个子集。数据集市主要面向部门级业务,只面向特定主题。它聚焦于单个业务线,相较于直接访问复杂数据仓库可以提高效率。在本文设计中,数据集市的数据是根据业务需求进行加工的,符合维度建模(Dimensional Modeling)规范。用户画像数据(用户标签体系)可以看作是客户数据集市的一部分。

应用层是基于数据集市数据构建的360用户画像应用系统,用于对MaaS用户进行精准刻画,还可以提供可视化分析和交互界面。进一步,根据用户画像标签运用聚类和分群对细分市场进行研究。360用户画像应用系统的结果数据可以为产品开发、市场营销和风险管控等系统提供有力支持。详见下文。

(3)用户画像标签体系

标签是对某一种用户特征的抽象和归纳表示,同时也可以用来表示一类用户。用户画像主要由用户标签组成,标签的构造、分类和体系设计对用户画像系统的使用效果具有直接影响。

①标签分类及标签化

用户画像标签按照变更频率一般分为静态标签和动态标签两类。静态标签是指用户自身的属性,如性别、年龄、地域、职业等,通常不需要频繁更新。动态标签则是指用户的行为、兴趣、互动等实时变化的属性,如浏览记录、购买行为、评论互动等,需要不断更新。

用户画像标签按照处理方法一般分为三种类型:统计类标签、规则类标签和机器学习挖掘类标签。其中,统计类标签是最基础也最常见的标签类型。例如,对于某个用户来说,其性别、年龄、职业、活跃时长、活跃天数、活跃次数等标签可以从用户注册数据、用户访问、消费数据中统计得出。统计类标签构成用户画像的基础。规则类标签基于用户行为及业务规则构造。例如,对于MaaS上“低碳出行高频”用户这一分类标准的定义可以为“每月公交、地铁交易合计30笔以上”。机器学习挖掘类标签通过机器学习方法挖掘产生,用于对用户的某些属性或某些行为进行预测判断。例如,根据一个用户的出行习惯判断其对某交通工具的偏好。

本文所采取的分类方式主要从业务出发,结合数据源特性以及业务需求进行设计。

属性标签:通过用户的注册信息,获取用户的基本属性。可列举为:用户性别、年龄层、虚拟卡开户机构、注册未使用等等。

行为标签:通过用户的使用习惯,获取用户的行为模式,标签用户的行为偏好。可列举为:模块访问频率(咨询模块、功能模块)、访问时长、场景功能交易数据等。特别地,MaaS普遍提供多个出行场景,每个场景都需要根据用户使用习惯构造标签进行刻画。

风险控制标签:对于存在高危行为的用户(如恶意欠费),特别开辟风险控制标签进行管控。

②标签体系管理

上述标签分类并不是扁平积累,实践上会逐层拆分成更细的颗粒度,组织成具备层级结构的标签体系。优点是方便管理多个标签,让散乱的标签体系化;其次可以直观反映标签之间的业务关联;最后可以为后续应用提供灵活的标签子集。

根据实际业务需求,划分场景标签,如图2所示。

4.应用示例

MaaS用户画像投入使用之后,可以在多个领域发挥作用。

在新产品开发及精准营销方面,通过上文所述的聚类技术对用户进行分群,为具有相似出行习惯、兴趣爱好和消费能力的用户设计产品,并定向投放促销资源。例如,对于工作日经常乘坐公交地铁且换乘的用户,运营商可以与出行服务商合作,提供联乘优惠,并将其定向发放给有“通勤”“公交场景_高频”“地铁场景_高频”标签的用户。同时,针对车主(即“路内停車_高频”或“路外停车_高频”或“充电桩_高频”标签),可以开展汽车后市场业务,并定向发送促销车辆保养、保险等产品的信息。

在风险管理方面,可以根据用户的异常行为开发“设备安全风险”“客户失信风险”“潜在问题客户”等标签,并采取相应的措施。对于存在客户失信风险的用户,如恶意逃费、非法提现的用户,平台会及时将其列入黑名单,并限制其使用各类出行场景服务;对于潜在问题客户,如投诉后反馈不满意的用户,平台会提供人性化的服务,切实解决用户的问题,提高用户满意度。

在协助公共管理和为政府部门提供政策参考方面,MaaS基本覆盖了出行领域的所有场景,包括绿色出行(公交、地铁、共享单车)和自主出行(停车、充电桩),以及部分城际交通(客运、航运)。通过对标签化及统计的分析,可以全面了解用户特别是常住人员在各种出行方式上的占比分布和时空变化规律。这些数据可以为政府部门制定专题报告、进行研判,并为公共资源投放、绿色出行优惠及当地文旅推广提供依据。

四、结束语

通过建设MaaS用户画像,可以方便运营商更好地了解平台(主要是公共交通)用户的需求、行为和偏好,从而优化公共出行服务,提高用户体验和满意度。从主管部门的角度出发,还可以促进公共交通事业发展。通过分析用户画像,可以了解用户的出行行为和偏好,研判潜在的公共交通需求和市场,为公共交通发展提供参考。这是贯彻交通强国战略、推进公交发展、推广绿色出行的有力工具。

参考文献

[1]周瑜芳.MaaS发展展望与思考[J].人民公交,2022(12):72-77.

[2]中华人民共和国国务院.交通强国建设纲要[Z].2019.

[3]杨君仪.MaaS案例比较研究与旅游出行场景应用构建分析[J]. 绿色·智慧·融合——2021/2022年中国城市交通规划年会论文集,2022:2852-2866.

[4]董志国.一站式交通出行融合支付MaaS平台的实践与思考——以广州为例[J].交通与港航,2022,9(02):9-14.

[5]Cooper A.Robert Reimann R. Cronin D.About Face 3:The Essentials of Interaction Design [M]. New Jersey: Wiley Publishing Inc,2007:19-22.

[6]CCSA TC601 大数据技术标准推进委员會.湖仓一体技术与产业研究报告,2023.

猜你喜欢
数据仓库画像公交
威猛的画像
一元公交开进太行深处
“00后”画像
画像
基于数据仓库的住房城乡建设信息系统整合研究
等公交
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
基于数据仓库的数据分析探索与实践
潜行与画像