王 木炎
(贵州省图书馆,贵州 贵阳 550003)
在大数据时代,用户每天使用互联网办公、社交、信息检索、发送邮件、学习等行为会使互联网虚拟空间充斥着大量的用户行为数据,这些用户数据汇聚成为互联网虚拟空间的大数据资源,并成为各个互联网公司分析用户行为、掌握用户行为偏好的重要资源。伴随着社交媒体、移动网络大数据规模的扩大,越来越多的学者对用户大规模数据挖掘并提供个性化推荐服务进行了深入研究,用户画像作为个性化推荐的重要工具,被广泛应用于各类移动电商,帮助互联网企业精准预测用户行为、定位用户个性化需求。用户画像是指使用爬虫程序对用户的上网轨迹、日志记录、浏览记录、社交媒体信息、电商交易记录进行数据爬取,对用户的教育背景、年龄构成、个性化偏好、兴趣习惯、学历层次等个体信息进行搜集,结合算法工具建立反映用户全部行为动态与个性化特征的信息标签[1]。在大数据时代,图书馆有效应用数据挖掘技术对用户个体信息数据全面搜集,能勾勒出反映用户兴趣与个性化行为偏好的信息标签,针对用户个性化特征开展阅读推广服务,有效提升阅读推广服务效能。
在图情领域,用户画像是图书馆借助大数据技术、数据挖掘工具、信息采集工具针对用户使用网络的日志记录、信息浏览记录及上网行为动态信息实现科学挖掘并进行有效信息标注的信息集合,能对用户的个性化需求进行深度挖掘,针对用户个性化行为有效预测,并将具有不同兴趣习惯、行为偏好的用户进行特定分群,对特定用户进行科学标注,智能区分不同的用户群,进而实现图书馆信息资源与用户个性化需求的精准对接。图书馆每年都会举办大量的阅读推广活动,这些活动的规模有大有小,在内容、主题上也存在着极大的差异,但仍然不能满足读者日益多样化的阅读服务需求。针对读者的个性化需求,图书馆可使用数据挖掘技术、算法工具对读者在图书馆使用过程中产生的各类行为数据、信息数据、网页记录、日志记录有效搜集、清洗、筛选、标注,建立用户画像,对读者的个性化阅读需求科学预测,精准匹配阅读资源,让用户的个性化阅读需求及时得到满足[1]。如大连市图书馆依托自身庞大的馆藏资源数据与用户行为数据,引入大数据算法工具构建用户画像,针对用户潜在的阅读需求有效预测,读者绑定身份证件就能进入“我的图书馆”品读图书馆智能推荐的书籍。
数据采集是图书馆用户画像构建的基础工作,数据规模越大、采集效率越高,用户画像的清晰度也就越高,图书馆对用户行为动态、兴趣偏好、兴趣习惯掌握得越充分,越能有效对用户的个性化需求进行预测。用户画像数据分为静态数据、动态数据两部分。静态数据包括用户的籍贯、年龄、社会阅历、教育背景、职业、住址、工作单位等信息;动态数据是描述用户社会属性与个性化特征的数据信息,包括用户的阅读兴趣、特长爱好等显性信息,也包含用户网络浏览记录、网络日志、社交动态、网络浏览内容等隐性信息[2]。因此,图书馆可以使用爬虫工具、算法工具对用户身份卡、图书馆登记资料、线上注册信息、社交媒体记录、网站浏览下载记录、移动服务终端使用记录等数据进行采集,保障用户画像构建具有充足的数据。
用户的网络使用行为具有很大的随机性,在使用图书馆门户网站、移动终端、社交媒体过程中会产生大量行为动态数据,为保障用户画像具有较高的清晰度,需要对用户网络使用过程产生的每一条数据进行分析与挖掘。图书馆借助日志挖掘工具与大数据技术对具有相同语义特征、结构特征的数据聚类归纳,过滤掉与用户个性化偏好、兴趣特征无关的冗余数据,筛选出反映用户兴趣习惯的数据,提高数据集成度。在数据搜集过程中,要针对读者管理系统、知识发现系统、文献资源检索系统、移动服务平台、门户网站中直接反映用户行为动态的数据信息,包括用户社会属性、社交互动、网络行为、网站登录、资源下载、点赞、收藏、分享等,充分利用爬虫工具与大数据算法工具进行深度挖掘,并按照关联规则、语义规则清洗、筛选、分类,进行格式转换,转化成为可识别、可利用的数据库文件,进行统一存储与利用[3]。
用户画像是反映用户行为动态、兴趣偏好的标签化数据集合,分为用户属性特征画像和用户行为特征画像两类。图书馆构建用户画像需要针对各个用户管理平台、门户网站、移动客户端中的用户属性数据、用户行为数据进行采集,并进行语义化标注,建立反映用户属性特征、行为特征的数据文本,并对数据文本进行标注,进而勾勒出用户画像。用户属性特征画像的构建需要对包括用户属性的信息,如年龄、姓名、职业、工作单位、学历、教育背景等数据进行采集;用户行为特征画像构建需要搜集包括用户互联网检索、查询、标注、下载、互动、转发等行为动态数据[4]。用户在使用图书馆过程中,不仅包括网络行为动态数据,也包括实际行为动态数据,如用户的图书借阅、图书查询、期刊订阅等,这些实际行为数据更能反映用户的习惯偏好与阅读兴趣,更能为图书馆预测用户个性化阅读需求、借阅行为提供参考。
智慧阅读推广服务是一项系统性的工作,需要兼顾用户识别、阅读服务、阅读推广的各个环节。这就要求图书馆在运用用户画像开展智慧阅读推广服务中,要基于用户画像做好用户群体的划分,对每个用户的个性化阅读需求精准定位,不能以无差别批量化方式向用户推广阅读资源,需要以读者为中心,保障读者的服务体验。实践证明,具有较高用户黏性的知识类产品往往具备特定的用户群,如豆瓣是定位于文艺青年的知识分享工具,有较高的用户体验度;知乎是定位于特定索引话题的知识推荐工具,它通过大数据技术对用户群特定知识需求进行语义关联,根据用户的兴趣偏好勾勒用户画像,建立面向用户群的个性化标签,为用户智能推荐知识资源[5]。
图书馆应全面加强以用户兴趣特征作为分类工具的智能推荐工具的建立,从面向用户个性化推荐服务的阅读资源数量与覆盖面着手,打造满足用户全时域、全场景的智能阅读推广服务平台。此外,图书馆需要以用户的个性化阅读体验为核心,充分借助用户画像和智能算法工具打通智慧阅读推广服务中的各个环节,打造适用于多种阅读场景的智慧阅读推广服务机制。图书馆根据用户兴趣特征实现阅读资源个性化推荐,不仅保障了阅读资源的流动性,也促进了阅读推广服务的持续性,提升了用户阅读推广服务体验。
在图书馆智慧阅读推广服务中,图书馆使用大数据算法与智能推荐工具能针对用户行为偏好建立阅读推广服务平台,并借助5G网络与AR工具针对用户个性化阅读需求建立沉浸式阅读场景,能有效提升用户的阅读体验。在人工智能时代,读者迫切需要沉浸式阅读场景进行深度学习,传统的数字化阅读推荐方式主要是图书馆员根据读者意见以新书推荐、读书论坛、线上竞答、名家论坛等活动开展阅读推广服务,具有一定局限性,不能兼顾每一位读者的个性化需求。依托用户画像塑造沉浸式阅读场景,根据读者的个性化需求使用可穿戴设备、VR/AR工具为读者智能推荐阅读资源,可以对用户的需求信息精准把握,为用户量身定制沉浸式阅读推广服务方案,使读者能在沉浸式阅读场景中快速检索、精准查新、深度阅读,获得良好的阅读服务体验。
基于用户画像的图书馆智慧阅读推广服务模式构建需要从技术模块、资源模块、推广模块、服务模块4个维度入手,建立起完善的智慧阅读推广服务模式,为用户提供个性化阅读推广服务。
基于用户画像的图书馆智慧阅读推广服务模式技术要素包括大数据技术、传感器技术、智能分析工具、个性化推荐算法等。用户画像在用户行为动态特征、社交属性特征分析方面具有一定的优势,能根据用户的个性化阅读需求智能推荐阅读资源。公共图书馆需要根据不同类型的用户群,全面运用大数据技术、传感器技术对用户不同场景中的信息数据进行采集,并使用大数据技术筛选出高价值的用户信息,及时对用户画像修订补充,发挥出技术优势,使用智能分析工具标注用户的个性化需求特征,依靠智能推荐算法为用户推荐符合其个性化阅读偏好的数字化资源,保障用户的智慧阅读服务体验[6]。
资源模块是图书馆智慧阅读推广服务的重要组成部分。基于用户画像对数字文献资源智能分类,将符合不同用户个性化需求的文献资源分别存储到不同的资源数据库,可满足不同用户群的阅读需求。用户画像进一步提升了数字文献资源的利用率,使用户的个性化需求与阅读资源更能精准匹配,用户借助智能推荐工具也能更便捷地获取数字阅读资源,更能在碎片化时间进行阅读。因此,图书馆需要基于用户画像建设个性化数字文献资源数据库,更新数字资源种类,丰富数字资源内容,为用户提供更加便捷的个性化资源推荐服务。
推广模块是基于用户画像的图书馆智慧阅读推广服务时应用的社交媒体、数字平台、门户网站。数字化的阅读推广服务包括新书推荐、知识推送等。基于用户画像的智慧阅读推广服务呈现出个性化、共享化的特点,图书馆根据用户画像可以使用智能算法工具依托微信公众平台、官方微博、微信小程序、抖音、今日头条等社交媒体面向用户个性化推荐,并基于用户阅读偏好制定阅读服务方案,最大程度上满足用户的个性化需求。
服务模块主要面向用户提供沉浸式阅读服务、个性化推荐服务,由于当前图书馆进行数字化转型致力于为用户提供深层次、共享化的阅读服务场景,以构建沉浸式、情景式、交互式的阅读空间为目标,因此,图书馆基于用户画像的智慧阅读推广服务中需要以用户为中心,为用户提供深层交互学习的阅读服务。这也就要求图书馆基于用户画像使用VR/AR技术在服务端口输出情景化信息,让用户通过可穿戴设备、虚拟现实眼镜随时随地进入虚拟阅读场景深度学习。
人工智能时代,图书馆借助大数据技术多元化搜集用户信息数据可构建出反映用户行为特征与兴趣偏好的用户画像。用户画像依托算法工具、智能分析工具、人工智能技术可根据用户的个性化需求智能推荐数字阅读资源,并借助VR/AR技术为用户构建沉浸式阅读场景,满足用户深度学习、深度共享的需求。在智慧阅读推广服务中,还需要智能感知用户的行为动态,精准把握用户的阅读需求,借助社交媒体、数字平台精准进行数字资源推荐,使用户阅读服务需求得到有效满足。