面向个性化信息服务的图书馆移动用户行为分析模型设计

2018-01-10 07:33汤妙吉
现代情报 2018年1期
关键词:移动用户分析模型维度

汤妙吉

(广州南洋理工职业学院图书馆,广东 广州 510925)

·业务研究·

面向个性化信息服务的图书馆移动用户行为分析模型设计

汤妙吉

(广州南洋理工职业学院图书馆,广东 广州 510925)

总结国内外图书馆移动用户行为的研究现状,为面向个性化信息服务的图书馆移动用户行为分析模型设计提供参考。采用理论研究与模型分析相结合的方法,从数据采集、数据处理与数据应用三方面研究用户行为动作序列和用户行为特征之间的关系。以前端操作行为与后端业务数据库相结合的方式定义和表示图书馆移动用户在iOS App、Android App与Web页面上与产品UI的隐形反馈行为,采集移动用户客户端基础信息字段、用户行为相关字段、配置Flume 3个方面数据,引入时间维度、用户维度、部门维度、资源维度、行为维度、入口渠道6个维度进行数据仓库层面的建模,从用户行为序列预测与用户兴趣引导两步实现数据应用。

移动图书馆;用户行为;个性化;信息服务;模型设计

随着移动终端的快速发展,人们已不仅仅是通过坐在计算机前获取图书馆信息,更能够利用手机、平板电脑等移动终端随时随地的访问数字图书馆,获取其感兴趣的资源,移动技术在数字图书馆中的应用为图书馆个性化服务带来了一次新的发展机遇。目前移动终端和普通计算机终端相比,在处理能力、处理方式以及操作形式上都有较大差别,移动终端更偏向于轻量化的处理,其最终目的是为读者提供更为快速、便捷、灵活的应用效果。因此如何发挥移动终端的特点,在此基础上更好的为读者提供个性化信息服务,是当前需要解决的一个重要问题。

1 国内外研究现状

1.1 国外研究现状

随着越来越多的图书馆整合数据库、优化信息化手段,图书馆能够为读者提供越来越多快速便捷的信息服务。在图书馆为读者提供诸多便捷服务的过程中,最引人注目的是图书馆给读者提供的个性化信息服务。个性化信息服务是指根据用户的特定需求有针对性的为用户提供相应的信息服务和知识服务[1]。图书馆推出个性化信息服务,在很大程度上节约了读者的时间、提高了读者获取知识和信息的效率,受到了大量读者和用户的欢迎。

目前为读者提供个性化信息服务的方式有多种,较具代表性的有3种:1)国外多家高校图书馆使用的Mygateway。Mygateway系统能够保存读者在访问图书馆各种数据库时产生的访问路径、访问页面、访问专题等相关的信息,并将这些信息分门别类进行处理,有针对性的为读者推送一些新的、用户可能感兴趣的页面或信息,提高读者获取其感兴趣知识的效率。2)通过电子邮件的方式为读者定时推送信息。这种服务方式需要读者预先在图书馆相关的服务系统中登记信息,尤其是需要读者主动提交感兴趣的专题、知识点和兴趣。之后图书馆以此为依据,定期向读者邮箱中推送相关的资讯。著名的INGENTA机构就采用这种服务方式。3)利用图书馆信息服务系统功能记录用户长期以来的访问过程、访问兴趣和爱好。根据这些信息为每个读者建立虚拟化的个性图书馆。比如瑞典计算机科学研究所就能够为访问该图书馆的研究者建立虚拟的个人图书馆,日本大多的高校图书馆也推出类似的虚拟化个人图书馆信息服务系统。

综合近年来全球各国所推出的数字图书馆个性化服务的发展现状和发展趋势可以看到,在所有的这类应用系统中,都是根据用户或者读者的喜好有针对性的为读者推送相关的信息和知识,从而提高用户获取知识的效率。这种应用模式经过实践证明能够极大的提升读者在图书馆的体验效果,成为图书馆提供信息服务的一个主要发展方向。

1.2 国内研究现状

国内在面向个性化信息服务的图书馆移动用户研究中引入了对用户行为的分析功能。如:宋文杰等人研究学生和工作人员这两个群体在对待移动图书馆这种新技术方面存在的差异,支持TAM模型中两个核心变量(感知易用性和感知有用性)对使用移动图书馆行为意向的影响[2];明均仁等人结合移动图书馆的特点,引入绩效期望、努力期望、感知趣味性、感知风险、信息质量、服务质量、社会影响和促成因素8个变量,构建基于UTAUT的高校学生使用移动图书馆的技术采纳模型[3];吴丹等人以国内某高校图书馆OPAC后台日志为基础,采用日志挖掘法对移动端与桌面端的用户后续点击行为进行统计分析[4];梁欣指出目前国内图书馆移动服务模式存在着重实践、轻用户的现象,图书馆应以用户为中心来设计与优化移动服务模式[5]。

国内图书馆移动用户行为分析的具体模型设计与实现主要表现为接入第三方或者图书馆自己开发。在数据分析这个模块,目前国内图书馆大多使用的是传统数据统计服务或新兴数据公司提供的第三方服务。以百度统计、Google Analysis为代表的传统数据统计服务,前端嵌入SDK采集数据、后台查看相应统计数据的方式成为一些图书馆的首选。这种方式的缺点有4个:1)统计范围只能是简单的访问量、点击率与活跃数;2)各统计模块之间的控制、调用、传递关系依赖性强;3)统计数据源不受图书馆控制;4) 无针对用户需求的分析功能。而以神策、GrowingIO为代表的新兴数据公司根据传统数据统计服务缺点提出了相应的解决方案,但需要不菲的接入或私有部署费用,这笔费用对于公益性质的图书馆来说过于昂贵,加上新型数据公司在业务上侧重于电商领域的数据分析,对于图书馆行业的分析模式也处于探索阶段,没有成熟的模板可以利用。

为此本文重点针对图书馆移动用户行为,结合图书馆自身业务特点,设计图书馆移动用户分析模型,充分利用开源框架实现相应功能,力图通过对移动用户行为的分析,让图书馆为读者提供更好的个性化信息服务。

2 研究思路

以面向个性化信息服务的图书馆移动用户行为分析为目的,以向用户推送感兴趣的内容为服务最终目标,在分析图书馆移动用户内在特征和外在需求的行为上,采用理论研究与模型分析相结合的方法开展研究。

第一步,从图书馆移动用户行为的基本定义和表示方法入手,梳理清楚面向个性化信息服务的图书馆移动用户行为分析过程中应该如何对用户行为进行定义和描述,并给出表示用户行为的基本数据结构。

第二步,设计图书馆用户行为分析模型。通过分析图书馆移动用户行为的特征与意图,提高图书馆用户行为分析模型理解用户行为的准确性,真正做到为用户提供所需要的各种个性化信息推送服务。

第三步,针对不同的图书馆移动用户群体,分析其差异性与特征,研究图书馆移动用户行为分析模型动态更新技术。让所设计的用户行为分析模型并不是一个简单的静态应用模型,而是能够根据用户群体的特征和差异动态的进行更新,使得用户行为分析模型能够针对不同的应用场合、应用对象展示出不一样的分析能力。

第四步,将研究成果应用到图书馆实际的参考咨询服务中。让读者在使用图书馆移动服务时能够享受到图书馆自主提供的关联数据和知识,提高图书馆信息构建服务能力,提升读者使用图书馆移动服务的体验效果。

3 用户行为基本定义和表示方法

图书馆用户行为数据一般分为用户打分、喜欢或不喜欢的显性反馈行为与页面浏览行为、消费行为的隐性反馈行为。两者的详细比较如表1所示。

本文所研究的面向个性化信息服务的图书馆移动用户行为主要指的是表现在iOS App、Android App与Web页面上的用户与产品UI的隐形反馈行为。这些隐形反馈行为伴随着属性数据在前端引起UI变化或者在后端产生服务通信,从计算机技术角度来说就是负责从前端采集所需的完整用户行为信息,从后端服务日志、业务数据库中读取相关数据,将两部分数据做整合用于后期的数据建模。

表1 显性反馈行为与隐形反馈行为的比较

图1所示是一次移动图书馆的注册流程。

图1 移动图书馆的注册流程图

从图1中可以看出,如果仅仅依靠后端的数据库只能知道在一定时间内新增了多少新注册移动图书馆的用户。而通过采集用户在前端的操作行为,则可以分析出全部新增移动图书馆用户的5个数据:用户浏览海报页面的数据、点击“注册”跳转注册页面的数据、点击“获取验证码”的数据、点击“提交”注册信息的数据、后台注册成功的用户数据。所以定义和表示图书馆移动用户行为,一定要前端操作行为与后端业务数据库相结合,前端用户行为数据用于分析转化率,帮助后端业务数据库挖掘出更多的有用信息,方便后台产品业务做结合。

4 分析模型设计

在传统图书馆各种应用、服务、管理系统中,由于对用户行为模型研究不充分,缺乏对用户行为数据的深度挖掘,导致图书馆服务系统不能够为读者提供高质量个性化信息服务。所以在研究图书馆移动用户行为分析时,应将研究重点放在移动用户行为的建模方法上。研究用户行为动作序列和用户行为特征之间的关系,剔除用户行为中的一些个性化信息的干扰,采用模型的表示形式,快速、准确地将用户行为动作序列映射到用户行为特征上,解决移动用户行为分析中的核心问题。

面向个性化信息服务的图书馆移动用户行为分析模型总体数据架构分为数据采集、数据处理与数据应用三大块。如图2所示,数据采集层负责从前端App、H5页面、服务器日志采集数据,通过Kafka接入后存入Elasticsearch中,数据处理层负责数据的抽取、清洗、建模,然后存入MongoDB与MySQL中,整个过程由Airflow任务调度管理系统来进行管理与监控,产出的数据最终提供给应用层使用。MySQL与MongoDB业务数据在数据采集层仍是重要的数据源,同时考虑到图书馆数据增长相对于电商数据很缓慢且没有很明显的需求,整个过程暂时搁置Hadoop。

4.1 数据采集

主要采集图书馆移动用户客户端的数据。由于图书馆各种移动端应用并不全是图书馆负责开发,所以这部分工作由移动系统各团队负责采集并将采集到的数据写入kafka,图书馆这边以kafka作为source,通过flume直接将采集到的数据以天为单位sink至hdfs中。相关采集的字段如下:

1)移动用户客户端基础信息字段。可分为26个字段,详见表2。

图2 图书馆移动用户行为分析模型总体数据架构

字段名中文名称可取值字段名中文名称可取值opt_system_type操作系统类型android、ios、windowsuser_account用户账号opt_system_version操作系统版本ios_10.0、android_5.0user_dept用户部门location_gps_long地理经度位置user_post用户职位location_gps_lat地理纬度位置user_role用户角色network_type网络类型WIFI、3G、4G、2Gdevice_brand设备品牌network_operator网络运营商名中国移动、中国联通、中国电信、中国网通、中国铁通、阿里通信、京东通信action_type动作类型login(登陆)、logout(登出)、startup(启动)、install(安装),background(切换到后台)device_type设备机型device_imei设备IMEIaction_result动作结果成功、失败device_resolution设备分辨率action_erro动作错误action_create_time动作时间毫秒时间戳app_nameApp名称app_key应用键值install_way安装途径校园局域网、分享二维码、appstore、应用宝、小米应用市场、华为应用商店extra_data其他参数启动时候上报上次使用时长(毫秒)app_versionApp版本user_dept_number部门编号user_name用户名ip_addressip地址

2)移动客户端用户行为相关字段。可分为23个字段,详见表3。

3)配置Flume。Flume是一个分布式、可靠和高可用的海量日志采集、聚合和传输的系统,支持在日志系统中定制各类数据发送方,同时提供对数据的简单处理,并写到各种数据接受方(比如文本、hdfs、hbase等)的能力[6]。在本模型设计中,需要在base action topic和user action topic中分别配置sources、sinks和#channels,即被监听的源目录、目的目录和通道目录的配置,把文件事件持久化到本地硬盘上,然后在hdfs上相关目录形成以天为分区、小时为单位的的日志文件。至此,数据采集的工作告一段落。

4.2 数据处理

面向个性化信息服务的图书馆移动用户行为分析模型的数据处理,主要指业务数据仓库层面的建模。首先根据图书馆需求拟定出符合业务发展的数据模型,然后根据该数据模型的表示方式从MySQL、MongoDB中的业务数据和Elasticsearch中的用户行为、日志数据中提取数据进行筛选,通过ETL过程编写Python脚本完成分析功能,由Airflow负责任务处理和存储,最后将形成的数据存入MySQL中,建立能应用于深度分析、供数据应用层使用的多维数据模型。作为集中存储数据的中间平台,数据仓库的建设重点在于数据建模与ETL过程,并不生产和消费数据。数据仓库建设方案如图3所示。

表3 移动用户客户端用户行为采集字段

图3 数据仓库建设方案

面向个性化信息服务的图书馆移动用户行为分析模型采用维度建模法。维度建模法是Kimball最先提出的概念,将数据抽象为事实表与维度表两种,而根据二者之间的关系将整体的模型划分为星型模型与雪花模型两种[7]。用维度建模法来建模的优势在于可以按照不同维度预处理数据,提高数据分析时的效率。比如根据时间维度预处理统计与分类。

结合图书馆具体业务,本系统引入6个维度:时间维度、用户维度、部门维度、资源维度、行为维度、入口渠道;数据指标上,主要有点击总人数、点击次数、注册人数、拒绝人数,每个指标分别有增量值和总量值两种;数据粒度上,时间维度细分到以小时为单位,部门维度细分到读者专业。图4为相应的星型模型。

从图4可以看出,图书馆移动用户行为分析模型只建立了tb_dim_time时间维度、tb_dim_user用户维度、tb_dim_resources资源维度、tb_dim_action行为维度四张维度表,部门维度和入口维度以字符串的形式放到tb_fact_lib_usage事实表中,这是为了避免重复查询,提高分析效率。在用户维度、资源维度、行为维度3张表中设立与图书馆业务数据库中相应数据id链接的prod_xxxx_id字段,方便与业务数据库中的信息进行同步。当业务数据库中的相关信息发生变化时,通过ET更新数据仓库信息[8]。ETL过程则采用编写Python脚本、引入增量更新机制与Airflow任务流管理来实现。

4.3 数据应用

图书馆对移动用户行为进行建模和分析,最终是为了引导读者能够更好的利用图书馆中的各种资源,开展学习和研究活动,充分发挥图书馆中馆藏资源的价值。因此在研究和设计移动用户行为分析模型和应用技术之后,结合图书馆对用户行为分析的结果,设计有针对性的读者引导模型和机制,可以使图书馆能够主动的为移动用户群体提供高质量的信息和知识服务。

在设计用户行为引导机制时需要考虑的不仅仅是用户操作界面设计的信息构建问题[9],还需要将之前分析的用户行为特征进行逆向预测。根据用户已有的用户行为序列分析出用户行为特征,然后再以此特征为依据预测出用户下一步可能感兴趣的行为序列[10]。由用户行为特征预测用户行为序列是对用户行为分析模型的数据应用。预测到的用户行为序列可以为用户的下一步行为引导做铺垫。最后对用户潜在的行为动作序列进行优化设计,提高每个操作步骤对用户的吸引力。

图4 图书馆移动用户行为分析模型

用户行为引导可分用户行为序列预测与用户兴趣引导两步实现。首先,通过分析用户行为,抽象描述用户的行为特征,对抽象的用户行为特征反向表述出用户行为的基本步骤,将用户行为的表示形式与用户行为特征建立对应关系,然后在进行用户兴趣引导时对每个步骤的用户行为进行专门设计,开发出友好的界面和操作流程吸引用户眼球,使用户有兴趣沿着预先设计的行为步骤逐步操作下去,将图书馆移动用户行为分析模型的数据应用朝图书馆希望的方向发展。

5 结 论

建立面向个性化信息服务的图书馆移动用户行为分析模型,能够让图书馆更好的发现移动用户行为的特征以及需求[11],为图书馆给这些读者提供更高质量的知识和信息服务奠定基础,也将进一步调动读者访问图书馆的兴趣和积极性,让图书馆能够在有限的时间和空间上抓住读者的需求,将读者吸引到图书馆中开展更深入的学习和研究。

[1]陈鹤阳.国内外移动图书馆用户行为研究综述[J].图书情报工作,2016,60(22):135-144.

[2]宋文杰,朱学芳.基于TAM模型的移动图书馆用户行为意愿研究[J].图书馆学研究,2015,(11):71-77,60.

[3]明均仁,张俊,杨艳妮,等.基于UTAUT的移动图书馆用户行为模型及实证研究[J].图书馆论坛,2016,(11):1-9.

[4]吴丹,金鑫,王林琳.移动图书馆与非移动图书馆用户后续点击行为比较分析[J].图书情报工作,2016,60(18):27-34.

[5]梁欣.图书馆移动服务模式优化研究——基于用户信息行为的视角[J].现代情报,2012,32(9):75-79.

[6]杨海锋.用户移动搜索行为研究综述[J].情报理论与实践,2017,40(4):138-144.

[7]陈亚睿,田立勤,杨扬.云计算环境下动态用户行为认证的机制、模型与分析[J].系统仿真学报,2011,23(11):2302-2307.

[8]黄传慧,万力勇.高校学术用户移动学习信息查询行为影响因素分析[J].现代情报,2017,37(3):52-56.

[9]汤妙吉.信息构建研究进展[J].情报资料工作,2015,(1):58-64.

[10]刘锦宏,余思慧,徐丽芳.移动数字图书馆用户行为模型构建研究[J].大学图书馆学报,2015,(5):93-98.

[11]汤妙吉.图书馆智能化专业学科服务平台建设[J].现代情报,2016,36(6):100-102,107.

DesigningtheAnalysisModelofLibraryMobileUserBehaviortoFacilitatePersonalizedInformationService

Tang Miaoji

(Library,Guangzhou Nanyang College,Guangzhou 510925,China)

The current research status on library mobile user behavior at home and abroad was summarized in this paper to provide a reference for designing the analysis model of library mobile user behavior to facilitate personalized information service.With theoretical research and model analysis combined,the relationship between the action sequence of user behavior and the characteristics of user behavior was studied in three aspects,i.e.,data collection,data processing and data application.Front-end operation behavior and back-end business database were combined to define and denote library mobile users’ invisible feedback of product UI on iOS App,Android App and Web.Three types of data,namely,the basic information field of mobile user client,fields related to user behavior and Flume were collected,and six dimensions including time,user,department,resource,behavior and entrance channel were introduced to set a DW-based model to finally realize data application by two steps—user behavior sequence prediction and user interest guiding.

mobile library;user behavior;personalise;information service;model design

10.3969/j.issn.1008-0821.2018.01.017

G250.7

A

1008-0821(2018)01-0121-06

2017-06-26

2016年广州市科技创新委员会软科学项目“从化高校-企业-农村地方区域信息服务”(项目编号201609010073);2016年广州市科协项目“‘云’阅读与移动图书馆技术的宣传及推广”(项目编号K20160603)。

汤妙吉(1980-),女,馆长,副研究馆员,研究方向:校地信息资源共享、移动图书馆。

孙国雷)

猜你喜欢
移动用户分析模型维度
基于BERT-VGG16的多模态情感分析模型
层次分析模型在结核疾病预防控制系统中的应用
光的维度
“五个维度”解有机化学推断题
全启发式语言分析模型
人生三维度
用户对移动网络服务偏好学习技术综述
IFC4结构分析模型应用技术