晁明娣
(南京森林警察学院,江苏 南京 210046)
当前,互联网发展迅猛,物联网、云计算、大数据等新概念层出不穷,不断影响着人们的生活。借助科技和网络的力量,图书馆不仅能够采集用户多方面的数据,还能依托庞大的用户数据,分析用户需求,精准服务用户,提高图书馆的利用率。故可以借助用户画像的方式精准地构建图书馆服务。用户画像是对海量数据的整合、筛选、挖掘与应用,实现大数据知识的利用、增值与再创造,以数据信息标签刻画用户图像全貌,及时了解用户需求并进行精准营销。笔者从用户画像构建图书馆精准服务这个角度出发,首先探讨了其现状与基础概念,然后深入分析了用户画像模型构建、基于用户画像的图书馆精准服务体系模型构建以及优化对策等。
笔者于2019年2月10日登录中国知网(CNKI),以“用户画像”+“图书馆”作为“篇名”进行关键词检索,共检索到相关文献35篇。由此可见,虽然相关研究成果较少,但是用户画像的研究同样也引起图书馆学领域研究者的关注,正处于研究发展阶段。邵波、刘速等较早概述了用户画像的概念、特性及作用,并介绍了用户画像在图书馆中的应用,为图书馆基于用户画像的创新服务研究奠定了基础。陈添源、胡媛、丁雷等主要从技术和方法的角度,对数据进行多角度描述和整理,从多个时空粒度构建用户画像,并探讨图书馆用户的差异化行为特征。刘丹等则分别从阅读推广、资源推荐、学科服务以及个性化服务等视角,讨论了用户画像在图书馆中各项具体工作的应用,为图书馆精准化服务的进一步研究给予启示。潘宇光、常盛等将用户画像理论与智慧图书馆建设相结合,提出在构建智慧图书馆的过程中,基于用户画像的构架与实现途径,从而为图书馆的智慧构建和智慧服务提供依据。
综上所述,图书馆界已经开展了基于用户画像的相关理论研究,研究者们都提出一些关注的核心要素和方向,为图书馆在大数据时代背景下的服务应用开拓了新视野和新途径,使该领域的理论研究与实践的结合更加紧密。但目前的研究,大多还停留理论阶段,对用户数据研究的深度和广度还有待加强,用户群体特征、使用偏好、用户与图书馆的潜在关联在图书馆提供的服务中并未得到有效的体现,且多局限于目前图书馆应用情况的简单介绍,没有开展针对理论成果的实践性检验以及应用具体的评价模型与实证分析,因此在实证研究方面相对不足,有待于在今后的研究探索中进一步讨论。鉴于此,笔者以用户画像为切入点,在深入分析用户显性和隐形需求的基础上,构建标签化的图书馆用户画像模型,并对图书馆实际应用案例进行实证研究,以期促进图书馆用户画像精准服务的深入研究。
进入网络信息数据时代后,国内的图书馆也在积极打造数据化平台,以帮助用户更加便捷迅速地获取咨询与服务。图书馆的精准服务,是基于数据化平台实现的,其精准服务表现为被动化和主动化服务两类。当前,这种基于数据化平台的信息服务,仍更多地处于被动化服务的状况,如图书馆的数据咨询会根据用户的咨询、检索、阅览记录、借阅记录等生成被动化的数据和记录。虽然这类被动化的数据服务,依然可以根据用户输入的需求获得较为精准的数据匹配,但是在当前竞争激烈的数据化时代,被动服务难以为用户提供精细周到的愉悦体验。而当前图书馆在主动化服务方面开展的工作,则主要集中于图书借阅到期催还、预约新书到馆提醒等流程性的服务提醒,而在数据内容方面的精准服务较为欠缺。这也正是笔者致力于探索研究的内容。
图书馆的精准服务,可以引入“用户画像”的概念并加以应用。
交互设计之父Alan Cooper较早提出用户画像的概念,指出用户画像是真实用户的虚拟代表,是建立在真实数据上的目标用户模型。用户画像也称为用户角色,是一种勾画目标用户,联系目标用户诉求与设计方向的有效工具。用户画像最初是在电商领域得到应用的,在大数据时代背景下,用户信息充斥在网络中,将用户的每个具体信息抽象成标签,利用这些标签将用户形象具体化,从而为用户提供有针对性的服务。笔者认为用户画像是基于海量真实用户数据,构造出能够反映真实用户的虚拟形象,其目的是为了通过预测用户真实需求,有针对性的为读者提供服务,最终能够提高用户的服务体验。
用户画像由一系列数据构建起来的反映真实用户特征的数据化虚拟投射,它反映了真实用户群体的诸多特征,比如用户真实的学历、专业、阅读偏好、登陆时间习惯等,这些都是构建用户画像的基础数据支撑。
用户画像是就如同真实用户在虚拟数据化世界中的身份代表,因此它必须要能够提取出真实用户的典型特征并具化为独特标签,从而与其他用户进行区分。用户画像构建所依赖的典型特征一般包括用户的静态属性与动态属性。静态属性是指真实用户短期内并不会发生变化的属性标签,如性别、年龄、学历、专业、职称等信息;动态属性则是指会随着时间、情境、其他因素等变化的属性标签,如性格、阅读偏好、情绪状态、阅览习惯等。通过对真实用户在图书馆数据化平台中互动的痕迹,可以提取出用户的静态与动态属性,从而抓取关键信息分类筛选,构建属性标签,最终刻画出独特专属的“用户画像”。
图书馆的精准化服务依托于用户独特的个性指征,需要满足用户多样而动态的需求。因此对用户个体化信息全面细致的采集与分析都十分重要。而用户画像的构建,正是基于对用户数据的收集、统计、整理、分析,最终形成丰富的画像。用户画像构建的过程,其实就是图书馆所需求的对数据的利用与再创造。用户画像可以为图书馆的精准服务提供海量客观有效的数据支撑,从而据此探寻客户的真实需求,提升图书馆的服务效率,优化用户的阅读互动体验。
图书馆的馆藏资源浩如烟海,而用户画像可以提升用户与图书馆资源的匹配度,帮助用户快速地找出所需的资源。一方面,用户可以通过设置私人固定的检索或推荐模式,进行个性化检索,获取个性化推荐等。另一方面,用户的一些潜在需求也可以通过用户画像的方式得到实现与满足。根据用户的不断检索、互动、在线阅览、评价打分、交流分享等一系列信息行为,可以不断地丰满用户画像的细节,构建出潜在需求的模型,从而主动及时地为用户进行有针对性的推荐,实现个性化的精准服务。
大数据技术的出现,促使图书馆数字资源间的协同与互联达到前所未有的深度和广度,尤其是移动阅读终端的多样化和普及化为我们带来了多领域、立体化、全方位的图书馆大数据。对图书馆用户画像数据模型构建主要从数据采集和标签建模两方面入手。
用户画像数据采集,是构建用户画像的初步环节,可以分为以下3类。
(1)用户静态数据采集
用户使用数字图书馆时,会在用户账户注册时,输入自己的基本信息,如用户的性别、年龄、学历、专业、单位、职称等静态数据。这些静态数据,将会形成用户画像的基本轮廓,图书馆用以对读者进行初步识别判断。
(2)用户动态数据采集
读者用户在浏览信息资源时会产生浏览痕迹,其所形成历史记录存储在后台数据库中,这类数据为动态数据。其中包括用户搜索的关键词、下载文献主题、订阅及收藏的内容以及用户近期内登录图书馆的次数、浏览时间等。这些数据将会让用户画像更加清晰形象,便于图书馆进行精准的识别与服务。
(3)用户第三方数据采集
除了较为普遍的静态与动态数据采集,用户画像还可以借助第三方社交软件进行数据采集。如图书馆允许用户将数字图书馆的账户与用户的QQ、微信、微博账户等授权绑定,可以直接用微信号、QQ号或者微博号等登录数字图书馆账户。与此同时,由用户授权允许数字图书馆可以调阅并使用用户第三方社交软件的相关信息数据,从而使用户画像更加立体、全面。
用户画像标签建模是构建用户画像的关键环节。通过对用户数据的采集整理,再对用户数据进行分析抽象出标签,在此基础上逐级分类形成宏观画像。当前数字图书馆的衍生让用户画像的标签结构从传统的单一模式转变为复杂模式,只有进行更加纵深的用户画像标签挖掘,才能满足当前大数据时代图书馆精准服务的深层次需求。所以,笔者从以下6个角度讨论了用户画像的标签建模。
(1)用户基本信息标签
用户基本信息标签主要用于描述用户的基本情况,如用户的姓名、性别、年龄、籍贯、身份、学历、专业、单位、职称、居住地址、联系方式等,都属于近期不会变动的静态信息,这些信息能够“描摹”出用户的基本形象。如“年龄”体现用户处于青年、中年抑或老年阶段;“专业”体现用户的理工科或者文科学习背景等。
(2)用户兴趣偏好标签
用户兴趣偏好标签,主要反映图书馆用户的关键词检索、在线阅读时长、页面内容浏览、收藏、网上预约、续借等操作行为。通过用户关键词检索情况,可以表明用户在阅读检索方面的兴趣偏好;用户在线阅读时长,可以表明用户浏览数字图书馆网址的时间节点、页面停留的时间长短,长时间停留表示兴趣较大,短时间表示不感兴趣;用户页面浏览内容,体现用户对数字图书馆资源的兴趣主题与所属领域;用户收藏的主题内容,可表明用户在阅读相关的图书资源后,将其感兴趣的主题内容进行了收藏,从而更加明确指向用户的兴趣偏好;用户的预约情况,主要体现用户的潜在阅读兴趣等。
(3)用户行为习惯标签
用户行为习惯标签,主要反映用户在数字图书馆使用过程中的一些潜在行为习惯特征,如用户每周的平均登录次数、阅览与下载次数、对文本延伸内容的点击阅读情况等。登录次数可以反映出用户的周期性行为习惯;阅览与下载次数可以反映出用户对在线阅读与离线阅读的行为偏好;对文本延伸内容如引文或类似推荐的点击阅读情况,可以一定程度上在反映出用户对阅读深度的偏好情况。
(4)用户情境属性标签
用户情境属性标签,主要是指用户在使用数字图书馆的时空情境属性,包括地理位置、时间、天气、温度等一些客观信息。首先,通过对时间信息的持续收集,可以整合归纳出时间属性对用户阅读兴趣偏好的影响。如某些用户喜欢在每天固定的时间点进行阅读活动。其次位置信息,则需要用户开放数字图书馆关联查阅用户移动端定位信息,通过收集用户所在的地理位置、位置类型、周围人群情况或社会关系等,整合地理空间对用户阅读行为的影响。如有的用户在学校教学楼登录数字图书馆的次数明显多于在市中心。最后是外界环境信息,如天气、温度、噪音等外界环境因素变化而带来的影响,如随着光照、噪音的变化,用户选择的服务项目是否也发生变化等。
(5)用户心理特征标签
用户心理特征标签,主要通过用户在数字图书馆公共平台上与书籍文本和其他用户之间的互动情况进行采集。如从用户的书籍笔记、阅读评论、文本打分、转载分享、交流谈论等行为中,可以获取用户对阅读文本类型主题的偏好情况,用户评论内容中文本表达倾向直接或者委婉,用户是否习惯于与其他用户分享交流等信息,从而更加准确地描摹出用户的心理特征,以便采取更加精准的数字化服务。
(6)用户社交网络标签
用户在数字图书馆中的用户画像,不仅仅依托于用户与数字图书馆之间的交集,还可以根据用户权限,从更加广阔的用户社交网络方面获取,从而形成用户的社交网络标签。如数字图书馆可以开放权限,允许用户采用微博号、QQ 号或者微信号等账号一键登录,从而获取用户的微博、微信或者QQ 信息。而这些较为私密个性化的用户社交网络信息,可以帮助图书馆快速构建用户画像在社交网络方面的个性化细节。
以上6个用户画像标签中,基本信息和兴趣偏好标签可以较为明确地表现出用户的显性需求,而行为习惯、情境属性、心理属性、社交网络等标签则可以在一定程度上反映出用户的隐性需求。
在用户画像基本形成后,图书馆可以更加快捷准确地把握用户的核心诉求与真实兴趣,从而构建自身的精准服务体系。
根据前文梳理,基于用户画像的图书馆精准服务体系总体结构框架图,如图1所示,主要包括客户层、中间数据处理层、后台数据库层共三层。三层各自独立又相互联系,如电脑和手机端的服务器放在客户层,方便直接对接用户,为用户服务,根据对中间层用户画像数据的处理,结合用户的显性与隐性兴趣需求,向用户呈现个性化定制的精准资源服务,同时它也是后台数据库层信息的主要来源。
图1 图书馆精准服务系统总体结构框架
图2 基于用户画像的图书馆精准服务技术实现流程
通过用户数据的采集、分类、整理、分析,为用户设置标签分类,再将多体系的标签数据整合出用户的特征化信息,从而描绘出具体的用户画像,找到用户的显性与隐性需求,实现图书馆资源与用户需求的有效匹配。具体技术实现过程,如图2所示。
(1)后台数据库层
后台数据库层,主要进行源数据的收集,包括并不限于对图书馆各种类别文本资料的分类收集与存储管理、对用户浏览借阅行为数据的收集、对管理人员维护整理数据的收集等。这些数据主要从用户端处获取,也可以从第三方数据如微信微博等的共享处获取。
(2)中间数据处理层
中间数据处理层,主要用于实现用户标签构建、用户特征化聚类和用户画像数据库集成。用户标签构建,是依靠从后台数据库收集到的信息,按照不同的标签维度进行分类,如前文所述的用户基本信息标签、用户行为偏好标签等,以便初步绘制用户画像。用户特征化聚类,则是基于用户标签建模基础上,选择不同标签维度的交叉重合结合内容和行为对用户进行聚类,根据用户群的典型特征进行内容推送等服务,再从用户对待内容推送的接收或拒绝不断修正用户的聚类特征。
经过不断地对用户标签细节构建和用户特征化聚类,将逐渐形成围绕每位用户的蕴藏了大量数据的多层次多维度的标签与特征,从而形成每一位用户的独特画像。这些经过不断采集筛选和更新的用户信息数据,是图书馆对用户进行个性化针对性分析的基础,是精准服务的前提。
(3)用户层
通过对用户画像的数据反馈,图书馆可以充分了解每位用户的真实需求,在最终的用户层向用户提供个性定制服务或者即时主动的推送等,最终实现人性化的精准服务。
当前,以用户画像构建图书馆精准服务的理念被业界不断推广并实施,在具体的实施过程中,可以从以下几个角度进行优化。
在用户画像构建过程中关键环节的用户画像标签构建时,情境标签是较易被忽视的一个标签。这是由于图书馆构建用户画像建模体系时,是真实人物在数据平台的虚拟投射,更容易聚焦于用户本体信息与行为信息等与用户直接相关的数据信息,而较少地考虑到实际情境对用户使用图书馆服务的影响。然而,用户的阅读行为实际上往往和具体的情境息息相关。图书馆应当重视用户阅读的立体情境信息,构建情境标签,从而实现更加精准的服务。
用户画像的构建需要持续不断地更新。这是由于用户的知识系统、兴趣点、短期情绪都在不断地变化,其阅读喜好也会随之改变。图书馆可以在用户允许的前提下,跟踪采集用户的即时动态,从而实现精准服务。如当用户在淘宝中输入某类药物的关键词进行采购时,图书馆可以迅速捕捉到相关讯息,从而在后台数据库中查找筛选出匹配的文本书籍,进行精准推送。
在用户画像建模过程中,将会采集到海量的基础数据,其中也存在许多无效的冗余数据,需要进行过滤剔除。图书馆可以借助多种技术手段进行用户画像特征挖掘,如采取判别分析、聚类分析、范例推理、关联数据等方法,对海量数据进行加工降噪处理,从而构建较为精准的用户画像,找出用户深层次的潜藏需求,实现个性推荐的精准服务。如根据身份标签进行筛选判别,同样是推送学术动态内容,针对教师和学生的不同身份判别制定不同的推送内容方案,前者适于推送学术元素更多的研究课题类学术内容,后者适于推送以学术讲座、学术活动为主的学习性的学术内容资料,以此满足不同身份人群对同一类型资料内容的不同层次的需求。
用户画像构建的过程就是对用户行为特征分析挖掘的过程,也是图书馆推送匹配等精准服务的基础前提。从用户画像构建的视角出发,提出了以多维度标签构建的图书馆用户画像模型,并以此为基础构建图书馆的精准服务体系。并提出从基本信息、兴趣偏好、行为习惯、情境属性、心理特征、社交网络6 个维度建立用户画像的标签体系,丰富用户画像的数据来源和类型,提升用户画像的精度与饱满度。基于用户画像,笔者提出了图书馆精准服务体系模型的总体结构与技术实现,并对基于用户画像的图书馆精准服务体系进行优化,提出了重视立体情境化的用户画像标签构建、借助用户允许权限跟踪用户即时动态、借助技术手段瞄准个性推荐精准服务的建议,以期促进当前图书馆用户画像精准服务构建研究的进一步深入。