大数据赋能科技馆客流分析
——以中国科技馆观众大数据分析平台为例

2023-10-16 02:42韩景红任贺春
自然科学博物馆研究 2023年4期
关键词:科技馆客流场馆

韩景红 任贺春 杨 涛 李 璐

一、 引言

国家在《中华人民共和国国民经济和社会发展第十四个五年规划和2035年远景目标纲要》中明确指出,“建设智慧城市和数字乡村”“完善城市信息模型平台和运行管理服务平台,构建城市数据资源体系,推进城市数据大脑建设”“推动景区、博物馆等发展线上数字化体验产品,建设景区监测设施和大数据平台,发展沉浸式体验、虚拟展厅、高清直播等文旅服务”[1]。作为“智慧城市”的有机组成部分,“智慧科技馆”为“智慧城市”的未来发展提供了生动的应用实践。科技馆的“智慧化”体现在通过引入高新技术应用促进数字化转型的发展趋势。

中国科协于2021年发布的《现代科技馆体系发展“十四五”规划(2021—2025年)》中指出:“推动全国科技馆智慧化建设。鼓励运用智慧化手段开展导览、预约、个性化推荐等观众服务,提升参观体验。运用信息化技术实现数据自主采集分析、决策辅助,提升场馆运行管理的智慧化水平”[2]。

通过对观众大数据的统计、分析,能够实现对场馆内客流监测与统计、数据挖掘分析与展现,为科技馆客流控制及安全预警提供数据支持;同时可通过评估客流的增长情况,描绘观众画像和参观规律研究科技馆科普服务的覆盖度和薄弱环节,优化公共服务资源配置,为场馆的智慧运营管理提供决策参考与支持。

二、 研究背景

(一)科技馆的服务创新需求

随着我国科技水平的不断提升,公众逐渐重视对新技术的学习和体验,以及对科学兴趣的培养,越来越多的公众热衷参观科普展览和参加科普教育活动。中国科技馆利用充满科学性、知识性、互动性的展览展品和体验式的教育活动,为公众营造了一个科学的乐园。中国科技馆新馆建成开放十多年来一直深受社会公众的喜爱,观众量持续攀升。每逢节假日、黄金周,科技馆里总是人头攒动、热闹非凡,但是过于拥挤的环境也会影响观众的参观体验,同时带来较大的安全风险。近年来,为更好地了解和掌握观众所需,提升管理和服务能力,采用移动互联网、大数据等先进的信息技术手段,创新更加人性化的贴身服务,已成为中国科技馆的迫切需求。

为了更深入地研究观众的信息与行为,中国科技馆进行过很多研究与尝试。例如通过线上票务系统获取观众的身份证号和手机号码,从而得到观众的性别、年龄等信息。但是票务系统无法解决对观众实时位置监测的需求,也没有办法了解到观众的兴趣偏好;通过客流密度系统可以获取观众的实时位置,但是却缺少精准的人物画像信息,只能做粗略的客流统计;通过人脸识别系统可以获取观众的人脸信息,能做到对个体的准确识别,但是涉及观众的肖像隐私,信息采集率并不高。因此目前亟需更先进的技术手段解决客流的监测与分析问题。

(二)客流监测与分析技术发展现状

通过对各类客流监测与分析新技术的充分调研,基于运营商的大数据技术能够满足场馆对客流监测和数据统计分析的绝大部分需求。运营商大数据具有用户数据量庞大、可信度高、更新及时、增长速度快及连续性价值等优势[3]。现代人生活已离不开网络和通信服务,我国三大运营商客户总量已超23亿户,其中5G套餐客户数也已超过12亿户,用户几乎覆盖了全国范围,且均为实名认证客户。作为大数据平台的基础,底层数据能力的夯实能够为上层数据的合理化应用提供基础与保障,同时运营商大数据在安全性、稳定性等方面也能提供可靠的保障[4]。

三、 案例探究

(一)科技馆客流监测与分析的类别与意义

科技馆客流的监测与分析是观众的人物画像、兴趣爱好、行为习惯等典型特征分析的基础,也是场馆运营者和管理者都要共同研究的课题。笔者通过对科技馆观众长期的观察与分析,将观众与场馆运营相关的问题梳理成四类。

1. 客流分析

客流分析需要从科技馆的客流规模、客流趋势、客流分布三方面进行统计分析。客流规模主要统计场馆观众总人数、日均接待量及同环比变化,客流趋势主要分析实时客流趋势、时点客流趋势、日/月客流趋势及不同日期类型观众量,客流分布主要统计分析各展区的观众分布情况和展品对观众的吸引力。

通过客流实时监测,管理者可以了解实时客流数量,通过对重点客流监测区域的实时监测和预警处理,提高预警处置能力。对客流总体的洞察可以分析观众的整体参观意愿和客流变化的趋势与规律,为运营管理决策提供数据支撑。

2. 观众行为分析

观众行为是科技馆运营管理者最关注的问题,也是客流分析的重点。观众行为分析需要统计分析科技馆观众的驻留时长特征和游览特征,其中观众驻留时长特征需要统计观众驻留时长、游览频次、重游率等,观众游览特征需要分析城市交通方式、到访场馆交通方式、首访展区和游览路径组合等。

观众行为分析从观众驻留时长和游览偏好的角度,探索观众的参观规律和游览偏好,为场馆间组织联合活动、规划参观路线、更新优化展品提供数据来源。

3. 观众来源分析

观众来源分析需要统计本地客源和外地客源的构成情况。观众来源分析是对客源市场的整体把握,分析客源结构可以为科技馆有针对性的宣传与推广提供数据参考。

4. 观众画像分析

观众画像分析需要对观众性别、年龄、消费水平和行为偏好等多指标进行统计分析。刻画好观众画像能够多方面反映目标受众的特征,助力场馆的个性化服务、精准营销和推广。

客流监测与数据统计分析的结果可以应用到场馆运营管理的方方面面。通过对客流的统计与监控,可将场馆内的实时客流情况展现在馆内大屏幕和官方网站上,以提示观众做好参观安排;通过客流系统与票务系统的联动,还可实现对场馆内观众限流、分流控制;通过对场馆各楼层、展厅进行客流统计与分析,可以为场馆的运营提供数据支持,根据实时动态的展区客流情况,可对观众的游览路线进行合理规划与引导,从而使馆内客流量均衡、平稳,避免出现部分展区过度拥挤的现象;更加细致的区域划分客流统计,辅助驻留时长数据还可以对展区、展品的受欢迎程度进行评估,为展览内容迭代和服务品质提升提供数据参考。

(二)中国科技馆客流分析关键问题

1. 室内精准定位问题

物理位置定位精准是运营商大数据明显的优势特征,也是场馆客流分析最重要的基础条件。但在场馆室内进行精准定位,尤其是要做到与展区、展品位置相匹配的定位对于运营商移动信号监测也是非常难的问题。

通过对5G移动网络技术进行充分的研究,找到了适合场馆室内定位的解决方案。首先利用LampSite 5G室分设备将场馆划分为若干信号分区,再根据展厅、展区的定位需要,调整LampSite 5G室分设备的信号覆盖区域来实现与展区形状相匹配的区域划分,从而实现展区级别的精准信号覆盖。然后用场馆的CAD图纸对科技馆进行建模,一比一地复制出整体建筑的数字孪生模型。

针对被监测对象,通过网格基站适配交叉算法和漂移数据处理算法等算法进行基站筛选,然后再利用MR(Measurement Report,测量报告)三角定位模型算法对目标进行定位,最后通过s1-u(用户面接口)信令数据和MR指纹库定位算法来完成精准定位。这样就可以定位观众目前处于哪个展区,甚至计算出更加精准的位置,并且可实现实时轨迹跟踪[5]。

MR是移动终端在信道上以固定时间间隔周期性地向基站报送所在小区的下行信号强度、信号质量等测量报告。基站将移动终端报送的下行信息和收集到的上行物理信息传送给基站控制端,并由其收集与统计。

基于MR的三角定位算法(见图1)是结合MR场强信息及网元工参信息,利用主小区和2个邻区形成的三角形,计算三角形的重心,并进行场强加权偏移,从而获得定位结果。然而,现网MR数据邻区信息不全的现象占较大比例。因此,基于MR的三角定位方法可实施性不强,定位误差也相对大。为提升定位精度,需要基于指纹库的MR定位算法[6]。

图1 三角定位法示意图

基于指纹库的定位方法,即特征匹配法,源于数据库定位。它需要预先通过S1U_HTTP(用户面接口超链接协议)数据和MR数据构建指纹数据库,根据指纹库信息实时对MR数据进行匹配指纹数据库定位。对于一个待定位的MR记录,首先确定它的上报小区以及邻区信息,即接收自本区和邻区的信号强度,然后在该MR归属主小区的网格集合中,查找特征信息与当前MR中包含的特征信息最接近的网格,最终以此网格的位置作为该 MR的位置[7]。比较而言,基于接收信号强度的位置指纹技术更适合于复杂的室内环境。能够较准确的区分室内外用户,并实现室内分层的覆盖评估及定位,且定位精度较高。

2. 目标用户筛选问题

目标用户筛选的问题也是基于运营商大数据客流分析必须解决的问题,因为被5G通信基站和室分设备监测到的用户不一定都是科技馆的观众,同时也包含场馆的工作人员、合作伙伴和从科技馆周边路过的人群。如果不将这些人员的数据剔除出去,将会对数据统计结果产生较大的影响。所以针对每一类非观众人群设计了单独的算法,经过一段较长时间周期的监测,筛选出在工作时间准时出现在场馆区域内的目标,把他们标注为常驻工作人员。把有固定规律出现的目标筛选出来标注为合作伙伴。把只出现在科技馆室外,未进入展厅的目标同样筛选出来,标注为路过人群。筛除非观众人员数据之后,剩余的才是科技馆的真实观众。经过精细筛选的客流数据能让统计分析结果更加精准,更具可参考性。

3. 单一运营商数据拟合问题

基于运营商大数据客流分析的另一个问题是我国的移动通信运营商有三家,这三家的用户总和才是全部移动通信用户,那么是否可以用一家运营商的用户数据来进行客流监测和数据统计呢?经过深入的研究,发现来科技馆参观的移动用户是有较稳定的规律可循的,只用一家运营商的用户数据也同样可以做好场馆客流的统计分析。每一家运营商都有对应的市场用户占比系数,例如根据三大运营商公布的2023年上半年数据显示,中国移动拥有5G套餐用户7.21亿户,中国电信拥有5G套餐用户2.95亿户,中国联通拥有5G套餐用户2.32亿户,那么中国移动的5G用户占比约57.78%,而运营商针对不同城市都会有对应的移动用户占比系数,用本地区的移动用户占比系数来反推出全部用户数在统计角度是有参考价值的。在此基础之上,通过长达半年时间与科技馆票务系统日客流数据的对比分析,得到了基本稳定的规律。中国移动用户日均客流占比均值约为45.08%。根据这一结果,又针对科技馆客流量的实际情况调整了中国移动用户占比系数,经过调整后的拟合结果更加接近实际情况,对客流的统计分析更具有实际操作层面的参考意义,因此用一家运营商的大数据也可以完成对客流发展趋势的分析研究(见表1)。

表1 中国科技馆日均客流占比统计表

四、 观众大数据分析平台功能设计及实现效果

针对中国科技馆客流分析完成技术选型并解决了一些阻碍应用的关键问题之后,对客流分析的功能需求进行了分类规划设计,根据需求的关联性将需求分为场馆整体分析、馆内关联分析和馆外关联分析。

场馆整体分析是对场馆观众规模进行动态监测,对观众来源、观众画像、观众游览轨迹、行为偏好等进行综合分析,为馆内客流管理、服务人员配置、展陈布置和宣传推广等工作提供参考依据;馆内关联分析是监测各楼层、展厅客流量,对各楼层、展厅间观众转化情况进行分析,洞察不同楼层、展厅的观众画像、驻留时长等,为展览、教育活动策划和展品设计等提供参考依据;馆外关联分析是对中国科技馆所在的奥林匹克公园园区和全市各大景区客流情况进行监测、数据统计和对比分析,对于市内重点景区的关联关系、观众游览路线等进行分析,为中国科技馆与奥林匹克公园区域和全市各景区开展联合活动、协调发展提供参考依据。完成功能需求分类规划之后,还要对分析需求和所需要的数据要求进行详细设计,梳理出数据在时效性和颗粒度等方面的要求(见图2)。

图2 观众大数据分析平台功能需求规划设计图

(一)场馆整体分析

场馆整体分析功能包括客流分析、观众来源分析、观众特征分析及观众游览行为分析(见图3)。

图3 观众大数据分析平台场馆整体分析界面

观众大数据分析平台的客流分析功能基于每15分钟采集一次的实时监测数据,实现了对科技馆实时客流的统计,并以3D热力图的方式展示各楼层的观众实时分布情况。通过折线图的方式展示科技馆当日的小时客流趋势和日客流趋势。

观众来源分析功能可以分析观众的客源构成,通过对手机信号驻留城市时长即可判断出是本市客源还是外省客源。系统会根据算法进行判断,无论手机号归属地是哪里,只有长期居住于本市的用户,才会被算为本市客源,而短期内来京的用户会根据其长期居住省份算为各省的客源。观众来源分析是对客源市场的整体把握,分析客源结构可以为科技馆有针对性的宣传与推广提供数据参考。

观众特征分析功能可以根据手机号的注册信息和行为监测结果对观众的人物画像进行详细的刻画,包括对观众的性别、年龄、住宿地、到访频次、行为偏好进行统计和分析。平台还会根据手机号的注册信息过滤掉重复数据,以提高数据的准确性,例如一人多机、一机多号、物联网号码等情况均不会进行重复统计。平台对观众抵京的交通方式也可以实现分析,根据观众购买机票、火车票和出现在机场、火车站等情况推断出观众的抵京方式,从而也可以依据观众画像特征进行有针对性的宣传与推广。

观众游览行为分析功能可以对观众的平均驻留时长和游览展厅的路线进行分析。解决了室内定位的精度问题,平台就可以通过监测观众处于哪个室分基站的信号覆盖范围内来判断观众在哪个展厅,并能计算其在该展厅的驻留时长。通过不同室分基站监测到观众手机信号的先后顺序即可得出观众在科技馆内的游览路线,进而实现观众行为分析,探索观众的参观规律和游览偏好,为规划设计展览和更新优化展品提供参考依据。

(二)馆内关联分析

馆内关联分析功能包括楼层分析及主题展厅分析。这两类分析功能是在楼层和主题展厅不同层面上实现的实时客流趋势分析、观众画像分析、观众行为分析、展厅驻留时长分析和楼层、展厅间客流转化率分析等。依据分析结果,可为场馆运营管理提供数据支持,根据实时动态的展区客流情况,对观众的游览路线进行合理规划与引导,从而使馆内客流量均衡、平稳,避免部分展区过度拥挤的现象(见图4)。

(三)馆外关联对比

馆外关联分析功能包括科技馆所在的奥林匹克公园园区客流分析、与其它景区观众游览行为对比分析。奥林匹克公园园区客流分析对园区客流量进行排行统计,并对园区内各景点的观众画像进行对比分析。科技馆与全市4A景区的关联分析可以实现近日到访过科技馆与任意一个4A景区的观众重合率,为场馆间订制场馆联票和组织开展联合活动等提供数据参考依据(见图5)。

图5 近7天科技馆与全市4A级以上景区关联前10名

五、 应用前景展望

我国科技馆的兴起较发达国家晚,但是近年来发展迅速,据最新统计我国达标科技馆有446座[8],且每年仍有新的科技馆不断建成。如今科技馆已成为很多城市的一张重要名片,同时也备受青少年和家长们的青睐。目前,我国的科学普及正逐步向规模化、行业化方向发展,全国各地都在大力加强科普设施的开发与建设,积极出台相关激励政策,促进科技资源科普化,提升公民科学素养和创新意识。

中国科技馆观众大数据分析平台通过对场馆内及周边区域移动终端的监测与统计,结合大数据技术分析观众的参观行为,实现对观众特征、来源地及客流量的分析与展现,为场馆流量控制及安全预警提供数据支持。同时还对科技馆的服务规模及观众增长情况进行评估,通过长期客流量监测积累,研究科技馆的科普服务覆盖度、全国观众的参观规律、场馆运营的薄弱环节,对科技馆优化公共服务资源配置,提升运营管理水平提供了决策参考。该平台是大数据技术在场馆客流分析方面的有益尝试与典型案例,必将会带动大数据技术在科普场馆智慧化建设中的广泛应用,为科普事业发展注入科技的力量。

猜你喜欢
科技馆客流场馆
客流增多
科技馆一日游
会前视察 支招亚运场馆利用
创新标准打造绿色雪上运动场馆
深圳科技馆新馆
冬奥之约,场馆先行
灾难来临,我不怕——科技馆一日游
场馆风采
参观诚毅科技馆
基于自学习补偿的室内定位及在客流分析中的应用