董 丽
(湖北医药学院图书馆,湖北 十堰 442000)
随着大数据技术、移动互联网技术对各行各业的渗透,数据资源呈现出量式聚集、创新变革、引领转型的新特点,其应用价值进一步显现。医学院校图书馆作为生物医学信息服务机构,有着丰富的数据储备,用户在利用图书馆的过程中又会产生大量数据,对这些数据资源进行有效的开发利用,可以获取更多有价值的信息。实时关注用户信息行为和需求的持续变化,重视用户海量数据的研发和利用,动态把握用户的需求偏好、预测需求导向,精准识别其个性化需求,为其提供多元化、定制化的精准服务,与图书馆的价值理念和服务宗旨完全契合,是医学院校图书馆积极应对时代变化与社会发展的重要选择。而以用户数据为驱动的用户画像技术日益成为精准服务的重要工具和技术手段,推动着精准服务的实现。
医学院校图书馆作为生物医学信息收集、加工、存储并提供利用的重要机构,在为用户提供医学信息、推广和普及健康知识、进行医学信息的深层次加工及医学研究向医疗实践转化过程中发挥着积极的助推作用[1],承担着为医学教学、科研、临床工作以及公众健康素养培养提供教育服务与信息保障的重任,也承担着为医学科研管理机构提供决策支持的重任,其发展水平直接影响着医学学科发展与人才培养、公众健康素养的总体水平。
基于互联网技术、大数据技术的广泛应用,图书馆用户的信息行为与习惯在持续转变,原有资源优势明显弱化,现有服务供给水平无法与当代用户需求相匹配,因此医学院校图书馆应强化社会参与职能,主动适应时代要求,科学调整自身的定位,优化服务设计,以丰富馆藏资源为基础、以高新技术为支撑、以用户多样化需求为中心,致力于打造集医学教学、科研、临床应用信息获取与整合于一体的医学信息服务中心;集医学人才培养、公众健康信息普及与素养培养于一体的学习中心;集数据挖掘、学科发展分析评估预测、科研与管理决策支持于一体的知识服务中心,为用户提供精准化的服务,以促进医学院校图书馆的发展与转型,更好地服务于社会发展。
大数据驱动下,用户需求日趋复杂多变,贴合用户需求的服务才是最合适的服务,为此,图书馆精准服务应需而生。其注重对用户现实需求和潜在需求的挖掘,以用户需求为导向,为其提供差异化、深层次的嵌入式服务。医学院校图书馆提供精准服务是解决当前用户需求个性化、多样化与图书馆被动式、粗放式服务之间矛盾的重要途径,也是图书馆提高服务效能,实现服务转型的重要方式。
笔者通过实地考察法与网络调查法,结合文献调查法,总结出大数据环境下医学院校图书馆精准服务供给现状:即国内医学院校图书馆界对精准服务的研究,是理论先行,实践还处于初步摸索阶段。对用户需求的全方位掌握是实现精准服务的基础,医学院校图书馆专业性强,其信息需求主体为在校师生、教学科研人员、管理人员、附属医院管理人员和医学专业医务工作者[2],由于其类型复杂多样、需求差异性大,因此对其进行多维度地精准识别难度较大;对可用技术的科学应用是实现精准服务的关键,目前医学院校图书馆对有效方法和可用技术的实务性运用还处于应对方案的探讨与论证阶段,还未涉及具体的模型构建、平台搭建等内容,仍有待进一步践行。针对医学院校图书馆专业特点、发展水平与现实困境,探索精准服务实践方式的研究还非常少,优秀的实践案例更是缺乏,用户信息的整合与智能化利用、精准服务内容与模式设计、技术实现的突破和效果评估体系的完善,都还有很大的探索和创新空间。
精准服务是一项复杂的系统工程,我国图书馆现有服务供给水平还无法与当前用户需求相匹配。在理论支持、技术衔接、人才储备、资金投入到对外部环境的感知与适应方面,还有待全方位加强。医学院校图书馆有其专业特殊性,受自身条件与发展水平所限,存在更大的困境:受区域经济发展水平影响,医学院校图书馆事业整体建设水平不平衡、资源分布不均,服务能力与水平参差不齐;基于用户类型的多样化特点,其层次差异性大,需求日趋专业化、精细化,因此图书馆对其隐形深层次需求的挖掘既必不可少又难度大;用户相关数据增长速度快,尤其是临床数据庞杂,多源异构,不易获取与保存;医学院校图书馆对馆员的知识水平和专业素质要求高,不仅要具备图书情报分析能力,数据处理与应用能力,还要具备一定的医学专业知识储备。
大数据技术的日趋成熟,为精准服务的实现提供了新思路和新方法。精准化服务以全方位利用用户数据,精确识别、精确分析、精确管理用户需求为基础,而大数据技术为数据资源的获取、整合、分析、处理提供了必要的技术支持。用户画像技术是其中的重要工具之一,通过加强用户研究,挖掘用户行为痕迹中隐含的数据,构建用户需求模型,掌握不同用户的特征、偏好和需求,精准识别核心用户,间接发现用户的结构变动和信息需求变动,基于用户应用场景,将用户数据和资源数据双向结合[3],从而帮助图书馆实现资源、服务、产品的科学定位,帮助图书馆从用户角度有针对性地调整、改善服务内容设置与提供方式,实现用户需求与图书馆服务供给的快速对接与精准匹配。
用户画像的构建,是以采集、存储、计算、管理用户海量数据为基础,重点对用户特征进行多方位、多维度地细致描绘与分析,使之标签化,生成模型,最后形成反映用户行为特征与需求偏好的动态精准画像。用户画像的构建可以实时了解用户的现实需求、潜在需求,预测未来需求,帮助图书馆精准把握用户需求,推进覆盖面更广、更高效的精准服务,助力图书馆服务增值,提高用户满意度、忠诚度。
用户画像勾勒的基础是庞杂数据的收集整理。图书馆用户画像来源数据包括静态的基本属性数据,如用户姓名、性别、年龄、学历层次、类型等相对固定的体现用户属性特征的信息,主要来源于图书馆管理系统里的用户注册信息,还包括动态的持续发生变化的行为数据识别、跟踪用户动态与行为轨迹。如图书馆管理系统里的用户查询、借阅、荐购数据,网站、数字资源服务系统里注册登录、点击浏览、检索下载等数据,微信、微博、QQ等移动平台的访问、浏览、订阅、收藏、留言、咨询、评价等数据。在充分保障用户隐私的前提下,以主动采集、被动采集、直接采集、间接采集等多种方式捕捉用户数据,可以通过调研、调查问卷、跟随观察、案例推理,也可以通过图书馆管理系统、资源整合发现系统等平台获取用户的数据。静态数据可以对用户进行初步识别判断,形成用户画像的基本轮廓;动态数据将会让用户画像更加清晰形象,使用户画像更加立体、全面。
构建用户画像需要大量用户数据支撑,而医学院校图书馆数据来源广,数量巨大,质量参差不齐,有结构化数据、半结构化数据与非结构化数据,而且以非结构化数据居多,可以实现对多源异构数据的统一整理,但难度系数很高,费时费力。为了更好地记录和挖掘这些数据,需要进行网络化管理,对不同类型的数据资源进行整理,有效组织、整合在一个统一的数据平台,常用的如Hadoop、Spark。画像精确度与数据全面性正相关,要注意通过用户交互界面的反馈信息不断补充、完善用户行为数据,确保用户数据采集的可靠、可信、完整。
构建用户画像的核心工作是通过知识工程或机器学习,从繁杂的数据中抽取共同的特征值,贴上标签,并运用算法模型与技术进行分析,对用户的行为、需求偏好等进行预测。
可获得的用户数据是分散的、海量的、多样化的,需要标签化,以便于理解、便于计算分析。用Hadoop、Spark 等计算机算法对数据进行反复地清洗、集成、变换、归约等预处理,以发现有价值的信息,初步完成用户识别和标签化;用SPSS 聚类分析、贝叶斯分类等方法找出共同特征,准确把握用户基本属性、行为属性、兴趣偏好等方面的不同特征,将用户数据进行分类,用高度精炼的特征标识来描述用户,贴上特定的标签;一个群体会有多个不同标签,不同的群体之间也会有标签的重合,每个标签对用户的影响强度也不同,这时需要计算标签的权重来反映不同群体的核心特征。用户标签反映的是用户的兴趣、需求趋向,权重值则表明了用户偏好指数、兴趣度、活跃度、需求度等的概率指数。通过多种方法的综合运用,对用户数据深层挖掘、精准分析,完成对不同用户的标识与行为建模。
在跨系统数据整合、数据分类采集、数据分析形成多维度标签体系的基础上,得到最终数据,利用可视化技术呈现清晰化、精准化的画像,它可以是个体的用户画像,也可以是具有共同特征的群体的用户画像。它将用户的基本属性、行为特征与对图书馆服务的期待联结起来,完整地表达了用户的现实需求,也超前预测了用户深层次的潜在需求,看到的不只是当下,还有未来发展,这样才能跟上用户的需求变化。很重要的一点是,用户画像的形成不是一蹴而就的,也不是一成不变的,它的应用是一个动态的、不断修正的过程。因为信息环境是持续变化着的,用户的信息行为与需求是动态变化着的,要实时监控并制定方案来应对用户数据的变化,通过模型预测新的标签,评估测试既有画像,运用持续的反馈机制来维护、更新、优化用户画像,实现对用户的全面判断和评价。
在功能实现层面,用户画像广泛应用在解读用户特征、识别用户需求、实现精准服务中。针对医学院校图书馆精准服务研究与实践中遇到的难题,笔者从以下5个方面探讨用户画像视域下医学院校图书馆精准服务策略。
用户需求是图书馆发展的根本,要始终以用户需求为服务的出发点和落脚点。用户画像从用户基本属性、行为特征的大数据出发,捕捉用户的外在显性需求,挖掘用户的潜在隐性需求,全方位掌握用户诉求,勾勒用户信息全貌,并以此为基础来为用户提供定制化的精准服务,凸显了图书馆以用户为中心的服务理念。要结合用户画像的构建,突破传统服务的被动模式,主动去了解用户的需求,实施“走出去”战略,进临床学院、进医院、进社区,打破机构、时间、空间的限制,向更广泛的覆盖范围发展,实现资源、服务主动找用户,帮助、支持用户获取与利用他所需要的服务,真正满足用户所需,实现精准服务。
图书馆既要满足用户需求日益多元化,同时又要实现其个性化、专业化和精准性。医学院校图书馆的用户从师生到临床医护人员,再到社会大众,其需求从信息获取到生物医学研究,再到民众健康知识普及与素养提升,复杂多变,图书馆实时跟踪获取、研究用户需求及动态变化显得尤为重要。只有结合用户画像的描述,区分不同用户群,定位目标用户,精准识别用户需求的差异性,图书馆服务供给才有可能实现与用户需求的双向精确匹配。同时,要求以事实数据为基础和依据,由主观推测向客观分析转变,包括用户基本特征、行为习惯、兴趣偏好、信息利用能力等与用户需求趋向相关的信息,这是基本要求也是关键所在。
从用户需求角度规划图书馆发展战略,服务供给从“粗放型”向“精准型”转变,是图书馆实现精准服务的重要举措。实时掌握用户特征变化与资源利用动态并结合用户画像的构建。一是为图书馆馆藏资源建设、空间设计、服务设置提供科学决策和指导性方案,最大程度上实现精准的资源优化配置,提高实际效用;二是针对不同用户群的不同特点、需求,不同阶段的不同层次需求,从资源、服务的精准营销到精准推荐,再到精准供给,适时适度,快速精准,确保所提供的服务和用户当前或下一步的需求合理匹配,提高服务的适用性,提升图书馆资源利用率与服务效能。
精准服务的推进与实现,很大程度上取决于服务人员的知识水平和综合能力,而随着互联网技术、大数据技术的深入发展和应用,用户需求日趋专深,对图书馆提出了更高的要求。医学院校图书馆专业性很强,图书馆员需要具备多方面知识和能力,要有主动服务意识,要具备图书馆专业基本技能和情报分析与决策能力,数据分析和应用能力,还要有一定的医学专业知识储备。要实现高效匹配用户需求的目标,医学院校图书馆必须培养智慧馆员,能够跟踪医学领域研究进展、了解业界动态,具备学习新技术、新知识和提升自身综合技能的能力,增强服务的专业性、创造性,才能不断地实现精准服务。
用户画像的构建与精准服务的供给需要根据信息环境与用户需求的变化、服务效果反馈来持续不断地更新。一方面要跟踪采集用户的即时动态,对比分析不同阶段的数据,关注精准服务前后的变化,同时挖掘新的有价值信息,为进一步推进服务收集一手资料;另一方面要建立以完整性、准确度为导向的健全的反馈评价机制,加强与用户的有效互动,根据用户的反馈,真实地了解存在的问题以及用户的体验感受与期望,对服务效果进行全面地评估,为精准服务的完善、优化提供科学依据,提高用户对图书馆的认可度、满意度,增强用户黏性。
新技术的变革和普及往往能够为图书馆转型和服务创新带来新机遇,大数据、互联网等技术的发展,为图书馆提供精准服务的新理念提供了技术支撑。我国医学院校图书馆在推进精准服务,满足用户个性化需求、转变服务职能的道路上刚刚起步,从社会发展大环境与医学院校图书馆发展现状出发,结合用户画像技术在图书馆服务中的应用,不断探讨用户画像视域下医学院校图书馆精准服务策略,有助于提升图书馆整体服务水平与效能,改善用户体验,将有助于推动公众健康素养的提升,有助于“健康中国”战略的实施。深化精准服务系统理论构建,将用户画像嵌入到图书馆服务体系之中,还有待实践性检验以及科学的评价模型与实证分析,需要我们在今后的研究探索中进一步讨论与实践。