刘晓婷,杨 超,赵宇鹏
(河北北方学院,河北 张家口 075000)
随着大数据、人工智能、云计算等技术的广泛应用,社会逐步向智能化方向发展。党的十九大报告提出建设智慧社会,这是对信息社会发展趋势判断的科学部署。图书馆应当牢牢把握信息化发展带来的机遇,为图书馆智慧化发展以及为读者提供更好的智慧化服务不断开辟新路径,从而更好地推进智慧社会的建设。
近年来,用户画像在电子商务、医疗卫生、旅游业、图书馆等领域都有应用。相关研究表明,用户画像技术的运用,对深入了解用户需求,实现信息服务个性化和精准化有显著作用。用户画像最初在电商领域中得到应用,当前也是在电子商务领域的应用最为成熟,主要体现在根据消费习惯等用户行为数据,推荐个性化商品和服务信息,从而实现精准营销。在医疗卫生领域,主要体现在根据用户健康信息行为进行健康信息推荐。在旅游行业,主要应用于旅游信息推荐。在图书馆行业,当前主要是应用于精准读者服务方面,用户画像技术在图书馆领域尚属起步阶段。
用户画像的概念最早由Alan Cooper提出,是指构建能够反映目标用户真实数据信息情况的虚拟模型[1]。简单地说就是用户信息标签化,是通过用户的基本属性信息、行为信息兴趣偏好等特征性数据,对用户进行聚类分析,形成并建立基于用户需求的普遍性和差异性模型。
使用CNKI统计分析工具对检索结果进行分析发现,国内最早对用户画像技术在图书馆领域的研究是在2014年,从2017年开始发文量持续上升,2018年后的发文量占全部文献的93%。文献研究表明,用户画像已经成为近年来国内图书馆学、情报学领域的热点研究方向。
通过对所收集的文献全文进行详细的阅读和分析,对当前国内用户画像技术在图书馆领域的研究进行梳理。研究主要集中在4个方面,其中对用户画像模型构建方面的研究最多。
1.2.1 用户画像模型的构建
陈添源[2]基于高校移动图书馆的特定情境,通过对高校师生进行问卷调研的方式,对人口统计、使用行为、使用心理进行统计,并利用因子分析、聚类分析和判别分析法选取适宜的用户画像个数,从而构建其用户画像标签体系;李晓敏等[3]为实现智慧图书馆精准实体图书推荐,对读者的自然属性、兴趣属性、社交属性与图书的相似性进行匹配,构建智慧图书馆用户画像;于兴尚等[4]以读者基本信息、阅读行为、心理特征、社交网络、情境感知5个方面作为数据源,构建用户画像。肖海清等[5]为促进高校图书馆阅读推广,从数据采集层、数据处理层、标签抽取层、用户交互关联层及应用实现层5个层面,构建了基于阅读推广内在循环为机制的参与式用户画像模型;杨群等[6]基于大学图书馆微知识服务,规划微知识服务流程,设计了基于用户画像的微知识服务体系模型。张宇等[7]基于图书知识服务系统,通过读者基本信息、情境信息、内容偏好信息和互动会话信息4个方面对用户画像模型进行构建,为图书馆知识服务系统提升了效率和精度。
1.2.2 用户画像算法与技术
李伟等[8]基于经典k-means算法,提出了一种基于马氏距离的多视角二分k-means算法,优化在多视角聚类中陷入局部最优的缺陷,设计了高校图书馆用户画像框架;廖运平等[9]将图书馆用户画像分成面向设计与面向营销两类,并分别探析二者的内涵、特征、创建方法和创建步骤;吴智勤等[10]对当前科研用户画像存在的算力算法不足、标签不全和不准的问题进行分析与改善,提出了基于社交网络方法和知识图谱技术的用户画像标签的构建策略。朱会华等[11]运用数据挖掘、知识聚类,创建基于用户画像的读者荐购、学科荐购、采访荐购模式。
1.2.3 图书馆精准服务应用
毛玉兰[12]构建图书馆用户画像,用以提升图书馆阅读推广精准性,显著提高阅读推广工作效果并提升读者服务满意度;李晶洁等[13]以天津商业大学图书馆为例,依托读者数据并从多维度建立数据模型,构建用户画像,并通过用户画像对优化馆藏结构建设和服务提出建议;刘海鸥等[14]从用户画像大数据收集、处理、存储和安全4个方面具体阐释移动图书馆大数据应用策略,促进用户画像在移动图书馆知识发现、知识产权保护、精准推送等方面的具体应用;张若兰[15]对于智慧图书馆情景化知识推荐服务方面,设计了基于用户画像服务的目标与服务流程,并总结相关应用经验。
1.2.4 用户画像相关隐私问题研究
周林兴等[16]剖析了图书馆用户画像在构建和使用过程中存在的隐私问题,从意识、管理、技术和法制4个层面提出相应策略,从而更好实现图书馆用户画像隐私治理。
用户画像建立在真实而复杂的众多数据基础上,其核心是用户信息的标签化,需要将不同的用户通过差异化的标签进行描述,将用户特征标识出来。图书馆用户画像标签体系,基于高校图书馆用户需求,用户画像标签首先需要包含读者人口属性,其中包括性别、专业、年级、身份类别(如教师或学生)。读者心理属性分为兴趣属性和社交属性两类。兴趣属性主要是指读者线上和线下使用图书馆获取文献的偏好,涉及线上电子文献的查询、浏览、下载、阅读和纸质文献查询、借阅情况,包含电子书、论文、视频和纸质图书与期刊。社交属性主要是指读者与图书馆相关事物的互动,如图书馆网站平台的话题讨论、微信公众号发文的评论、相关学科内容的关注与分享、图书馆推广活动的参与等。读者行为属性,主要是指读者线上或线下使用图书馆的行为方式与特点,如访问的方式、访问终端、经常访问的时间段、每次访问耗用的时长、访问的频率等。构建的高校图书馆用户画像标签体系,如图1所示。
高校图书馆用户画像的构建要遵循两个原则:一是能够代表读者的全部特征,能够将读者对图书馆资源的利用和图书馆服务的使用情况准确地表述出来;二是能够满足高校图书馆业务需求,把图书馆开展的工作和服务所需的支持数据尽可能全面涵盖。构建用户画像可按照以下流程进行。
(1)基础数据的采集。数据的获取来源于图书馆管理系统、图书馆门禁系统、座位管理系统以及图书馆门户网站的网络日志等。图书馆管理系统保存读者的基本信息,如专业、年级、年龄、性别、身份,还包括读者借还书信息。图书馆门禁系统记录了读者入馆频次、入馆时间及时长。座位管理系统记录了读者习惯使用的阅览室、座位号、学习时间、频次等。图书馆门户网站记录了读者检索、在线阅读文献、互动留言等信息行为。涉及的读者数据按照用户画像标签体系分为读者人口属性数据、读者心理属性数据、读者行为属性数据,再根据这些特征对读者进行画像。收集到的用户画像数据可分成两类:一类是静态数据,另一类是动态数据。不会实时变动的数据是静态数据,如读者人口属性数据,而会实时变动的数据为动态数据,如读者心理属性数据、读者行为属性数据。根据用户的静态数据能够了解用户的基本需求,根据用户的动态数据可以为用户提供精准的个性化服务。
(2)数据预处理。其主要是对收集的数据进行结构化和清洗,对存在噪声和缺失、错误、不规则的数据,进行清洗、去除、转换等处理。由于高校图书馆的数据量很大,数据中包含很多冗余数据,必须去除重复数据。
(3)用户画像构建。用户静态数据主要来源于高校图书馆信息管理系统数据库,从数据库直接采集后,采用抽取、转换、加载技术。而动态数据是实时变化的,需要用权重来衡量数据的重要程度。根据用户画像标签体系,用一些较为成熟的大数据工具软件构建用户画像和画像的权重。由于用户画像无法完全准确地描述一个群体,要根据不断变化的读者数据进行不断的修改,更符合读者的特征。
近年来,在高新技术的飞速发展下,高校图书馆逐渐向智慧图书馆转型发展,要求图书馆服务更加个性化、精准化、主动化,服务内容和服务方式也更加丰富多样。将用户画像技术应用到智慧图书馆的建设中,对资源精准推荐、数据统计、馆藏资源建设、学科服务等图书馆服务将会有很大帮助,从而更好的满足读者需求。
图书馆资源的精准推荐,是指能够按照高校师生的信息需求为读者主动推送馆藏信息资源,包括馆藏纸本图书、期刊,电子图书、期刊,数据库信息等。以往无差别的资源推荐,对于图书馆来说往往是付出很多的劳动,但效果不理想。高校图书馆资源精准推荐,对促进高校阅读推广、提高资源利用率有重要的作用。
通过系统构建师生用户画像,对图书馆读者不同维度和不同层次的标签信息进行组织与挖掘,将其与馆藏资源包括馆藏图书和期刊相匹配,读者人口属性更能反映一类读者的共性需求,读者心理属性和行为属性更能体现每一读者的个性需求,从而精准地实现对读者的资源推荐。在用户画像的技术支持下,图书馆能够提高资源推荐的精准性,促进高校师生信息利用,为开展各项线下和线上阅读推广活动提高成效。
高校图书馆每年都有较多的经费用于资源的采访,对于一些经费不充足的高校,资金的利用率就显得尤为重要。在每年图书馆资源采访工作中,如何能将经费用在最能满足师生需求的资源建设上,是各个高校资源建设方面都在深入研究的问题。
基于用户画像技术,根据用户人口属性、心理属性、行为属性生成个人画像和群体画像,并对图书信息资源按中图法和学科进行分类,对文献信息资源和用户数据进行数据清洗、降噪,数据发掘、聚类等,最终结合本校图书馆采访的基本方向和原则,将近几年新出版的图书信息资源和高校师生的画像相匹配。以此在基于读者资源需求、馆藏资源利用率、学科建设需求的基础上,为图书采访提供科学的、有依据的荐购。
高校教师承担教学和科研的双重任务,科研往往是由团队合作来完成的,团队中的成员多数在人口属性和兴趣属性上具有一定的相似性。与此同时,每一个团队成员在读者属性、行为、偏好上也存在个体差异,从而有利于为不同的读者制定不同的学科服务策略。
学校各个学科的重点研究领域,对研究团队及个人,在深入采集读者属性、行为、偏好数据的基础上,通过数据挖掘与分析用户数据,构建群体和个人用户画像,根据用户画像把握和预测用户的科研兴趣偏好,把握科研需求,分析用户的研究领域热点问题、研究趋势、合作学者、学术影响力、研究成果分析等,并为科研团队成员推送个性化的科学情报服务。
用户画像能够让智慧图书馆掌握师生实际和潜在的信息需求特征,通过对图书馆业务进行数据统计分析,为图书馆未来发展决策提供支持和帮助。
例如,可以通过用户画像分析不同专业和年级的学生到图书馆进行借阅、自习、参加读者活动、使用图书馆智慧空间等设施的需求;分析图书馆组织的各种读者活动,每种活动更吸引哪类读者参与;按照学科对馆藏资源进行分类,分析用户对各个学科的资源需求等。基于用户画像,智慧图书馆读者需求得以全面呈现,各项服务向精准化发展,并为未来图书馆工作与发展提供方向指引,促进图书馆服务水平和读者满意度的不断提升。
当前,各地高校图书馆逐渐向智慧图书馆转型发展,从设备、技术、服务等方面进行探索和实践,为读者提供更加智慧化的图书馆服务。从用户画像角度,深入结合图书馆工作内容,探讨通过提高服务精准性来实现高校图书馆智慧服务的方法和策略,对提升高校图书馆服务水平和向智慧图书馆转型发展有重要的理论与实践意义。