杨林霞
(中原工学院法学院/知识产权学院 郑州 450007)
传统意义上的科学数据服务包括三个层次:数据参考咨询服务、数据收集服务和数据计算服务[1]。但“互联网+”环境下,科学研究已进入“第四范式”[2],数据密集型科研活动成为用户科研行为的基本特征和普遍趋势,科研用户对数据服务依赖程度更高。这就要求图书馆拓展和深化数据服务职能,加快从基于三层次论的传统数据服务向基于科研数据生命周期的智慧数据服务转型升级。这将有利于提高图书馆科研数据服务的精准度和实效性。那么,究竟什么是智慧数据服务?科研用户数据需求与图书馆数据服务之间存在什么关系?图书馆又应当如何开展智慧数据服务呢?
图书馆数据服务是指以数据为载体,开展数据获取与提供、导航与检索、分析与再加工、保存与共享、管理与咨询等工作[3],以满足用户数据需求的服务模式。智慧数据服务是图书馆数据服务的迭代演进,是在智慧图书馆建设框架下,以用户需求为导向,以相关关键技术为支撑,利用数据采集、分析、挖掘等适用性新型工具,将数据服务嵌入到用户科研实践中,为用户提供以智慧数据为主要内容的个性化精准服务。它蕴涵两层意思:其一,关于“智慧数据”的服务。所谓智慧数据是指“具有一定格式、通常自带语义或程序,在一定的环境条件下可以独立产生行为和结果,或作为进一步整合分析或采取行为的基础。智慧数据是有语义的、可计算的,能够自主行为的信息单元”[4],智慧数据服务即是以“智慧数据”为核心和载体的服务。其二,智慧型或智能化的“数据服务”。亦即在“互联网+图书馆”思维指引下,把新兴适用性智能化设备、工具投入到数据服务中,以新技术带动和推进数据服务的升级。前者侧重于把“数据”变得“智慧”,后者侧重于把“服务”变得“智慧”,概言之,智慧数据服务是智慧数据同智慧服务的有机融合。
图书馆智慧数据服务具有如下特征:
第一,智慧数据服务的目的是为用户提供智能化、个性化、专业化的数据服务。以用户为中心始终是图书馆最核心的服务理念,也是最基本的价值旨归,智慧数据服务亦如是。在用户需求驱动下,开发数据资源,挖掘数据价值,满足用户数据需求,便是智慧数据服务的意义所在。
第二,智慧数据服务以关键技术为支撑,借助关键技术予以实现。曾蕾等认为,实现智慧数据的相关技术有“认知计算、深度学习、机器学习、人工智能、预测分析、图数据库、机器智能、语音处理、语义技术、自主载体、大数据、数据科学、物联网、文本分析、资源描述框架(RDF)、知识图谱、情境计算、关联数据、深层因果推理、本体、JSON-LD(一种轻量级的关联数据格式)、常识(Common Sense)、自然语言处理、语义搜索”等[5]。智慧数据服务是技术推动的结果,也须依赖关键技术得以推进和实现。
第三,智慧馆员是智慧数据服务的最终践履者。智慧数据服务要求馆员须同时具备先进的服务理念、扎实的图书馆专业知识以及熟练运用新技术的能力素养等,故而,加强教育和培训,促使普通馆员向智慧馆员的转型是推进智慧数据服务的主体性条件。
第四,智慧数据服务的范围极其广泛。“互联网+”时代,数据与人的关系越来越密切,图书馆用户在不断消费数据产品的同时又在不断生产着新的数据,这就要求图书馆合法合理而又科学有效地采集、分析、保存、管理、使用数据,为用户提供有价值的智慧数据服务,并将其贯穿于用户科研生命周期的全过程,嵌入到课程支持、学术科研、社交互动的各领域。
第五,智慧数据服务具有互动性、泛在性、灵敏性、主动性。互动性是指图书馆作为数据输入(采集各类数据)和输出(为用户提供数据服务)的中间物,与数据供应者、数据使用者存在广泛而深入的互动关系;泛在性是指数据的产生具有动态性,而用户对数据的需求又具有多变性,图书馆需要随时随地跟进、采集、整合、处理新数据,同时又必须调动一切资源满足用户多元化、泛在化的数据需求;灵敏性是指图书馆在接到咨询、导航等数据服务需求信号时,须予以快捷、准确的应答和反馈;主动性是指图书馆及馆员在进行资源推介、教学服务、科研支持时,应主动采集用户需求信息、主动提供专业化精准服务。
“互联网+”时代,科研用户与图书馆之间的关系多以“资源需求—数据服务”的形式存在,亦即图书馆通常以提供数据服务的方式来满足科研用户的文献获取、信息咨询、技术支持等需求,如文献传递、信息导航、资源推介、软件下载,又如协助用户进行数据分析、信息加工、知识抽取,等等。从图书馆是否提供数据服务和科研用户是否接受数据服务两个维度、以四象限图来分析这一关系能够更为直观地呈现实际效应,见图1。
图1 数据需求与数据服务之间的四象限图关系
如果图书馆没有提供数据服务,则无论科研人员是否接受了数据服务,都说明图书馆没有实现数据服务功能,如第二、三象限。如果图书馆提供了数据服务,而用户未接受数据服务(第四象限),则说明图书馆的角色实现不成功,造成了人、财、物力资源浪费,同时,科研人员也未获得有效的科研支持。其原因是多方面的,可能是图书馆的数据服务与科研用户的需求不相匹配,也可能是图书馆与科研用户间的交互通道阻塞,还有可能是该科研用户根本未从事科研活动、不需要数据服务。最理想的状态是第一象限呈现的状况,一方面,图书馆提供了数据服务,实现了自身价值;另一方面,用户获得了科研服务和支持,促进了科研活动。
显然,第一象限所呈现的情况创造了一种双赢局面,图书馆和科研用户都能够从中获益。至于双方的获益过程和模式,可以通过函数解析式分别进行更深入的探讨和分析。
首先,图书馆开展数据服务的收益函数:Y=Q×S×N-C。其中,Q即Quality,指图书馆提供数据服务的有效性或价值;S即Sale,即数据服务营销,亦即将图书馆的数据服务成功推向科研用户;N即Number,即科研用户使用数量;C即Cost,即图书馆提供数据采集、处理、存储、分析、挖掘、推送等服务的成本。
从这个函数上看,图书馆科研数据服务成功与否、实际效果如何最终取决于以下诸要素:①价值性,即所提供的数据本身真实有效、科学严谨,所提供的存储服务便捷可靠,所提供的数据分析和挖掘方法正确、结论可信……②适用性,即所提供的数据服务能够较好地与科研用户的实际需求相匹配,能够恰如其分地嵌入到科研活动中;③可持续性,即图书馆与科研用户之间能够建立起一种相互信任、共建共享的长效稳定协同机制,图书馆能够在此机制下持续地、动态地、有效地向不同科研用户输出数据服务;④广泛性,即图书馆向尽可能多的科研用户提供数据服务,得到数据服务支持的科研用户越多,图书馆的收益就越多,社会价值也就越高;⑤生态性,即控制数据服务成本,以最小投入获取最大收益。
其次,科研用户接受数据服务的收益函数:Y=Q×M。其中,Q即Quality,意同上文,是质量控制因素;M即Means,指用户接受、获取图书馆数据服务的方式,是过程控制因素。
从这个函数上看,若暂不考虑科研用户的主观需求意愿,排除其不能从事或不愿从事科研活动的可能,那么,数据资源本身的有用性和获取数据资源的渠道畅通性是其能够获得有效数据服务支持的最重要因素。换言之,如果图书馆提供的某项数据资源或数据服务能较好地消除用户科研中遇到的障碍,而且用户又能较便捷地获取该项数据资源,那么该科研用户就更有可能选择图书馆提供的该项数据资源或服务。
由此得知,图书馆能否提供契合科研用户需求的数据服务是图书馆与科研用户间可否实现双赢的决定性因素,而关键在于:保证数据质量、提高数据服务营销效率、畅通数据输送渠道。事实上,智慧数据服务的优势恰好也在于此。首先,智慧数据服务凭借适用的数据分析、挖掘工具和技术,能够提升数据的广泛性、真实性、可靠性和有效性,进而保证数据质量;其次,智慧数据服务通过小数据采集、管理和应用,能够把握用户资源使用动向、预测用户需求信息、开展个性化数据服务,进而提高数据服务营销效率;再次,智慧数据服务倡导虚拟服务和实体服务的深度融合、线上平台交互和线下面对面交互的相互促进,进而畅通数据输送渠道,实现立体式数据流动。故此,“互联网+”时代,图书馆提供智慧数据服务是满足用户科研需求的客观要求,更是图书馆数据服务迭代升级的内在要求。
面向科研用户的嵌入式智慧数据服务模式可简略表述为:图书馆及馆员以科研用户需求为导向,基于科研数据生命周期,完善科研数据服务管理制度,健全科研数据服务长效机制,利用图书馆智慧建筑和智能设备等硬件环境以及数据开发、存储、分析、挖掘、推送等软件技术,把智慧数据服务嵌入到用户整个科研活动中,以增强图书馆的科研服务效能,实现图书馆及馆员的价值并使其有效增值。
图书馆及馆员是智慧数据服务的发起者、施行者、监管者和维护者,但他们在智慧数据服务过程中所扮演的角色、发挥的功能有所不同。
图书馆组织的功能主要体现在顶层设计、制度安排、日常管理、环境创建等方面。第一,制定科研数据服务的规划、落实科研数据服务政策;第二,构建科研数据服务机制、拟定科研数据服务方案;第三,完善科研数据服务评价机制、提高科研数据服务反馈效应;第四,创新科研数据服务方法、拓展科研数据服务路径;第五,搭建科研数据服务平台、加强图书馆资源建设;第六,购置用于科研数据服务的硬件设备和软件技术、加强智慧图书馆环境建设;第七,培养馆员科研数据服务意识及能力;等等。
馆员是智慧数据服务的最终践行者,是各项软硬件技术的使用者。智慧数据服务的成效最终取决于馆员个体自身的服务效能以及同科研用户的协同效能,而影响服务效能和协同效能的主要包括开展数据服务的意识自觉、情感自控、意志自律等心理因素,以及进行数据服务所必需的知识、技术、能力等素养因素。从这个意义上说,设置专门的数据馆员岗位、培育专业的数据馆员十分必要。
高校图书馆科研数据服务的对象是有科研需求并开展或准备科研活动的各类人员或团体,主要包括教师、学生、教辅人员,以及由他们构成的各类学术团体和科研团队。不同的服务对象有不同的知识水平、专业方向、研究领域,因而有不同的科研需求,所以,智慧数据服务应坚持用户需求驱动,紧密贴合科研人员实际需求,提供个性化精准服务。
科研活动是科研数据生命周期的来源[6]。图书馆的智慧数据服务只有融入到用户的科研实践中才能收获最大效益,故而,智慧数据服务的内容应同用户科研活动相贴合、同科研数据生命周期相吻合,而其服务目标也应在遵循科研数据生命周期规律的前提下,致力于图书馆、馆员、科研用户等多主体的协同共赢。
根据综合数字监管中心(DCC)提出的监管生命周期模型、数据文件倡议(DDI)提出的组合生命周期模型以及英国数据归档中心(UKDI)提出的数据生命周期模型[7],结合图书馆数据服务的经验和特点,将科研数据生命周期模型归纳如图2所示。
图2 科研数据生命周期模型
此模型始于数据生成,终于数据应用。在此过程中,数据生成,即通过某种途径获取数据或创造数据(如文献搜集、问卷调查、社会调研、科学实验等)。数据生成后,进行筛选、分配、归档,去粗取精,去伪存真,这一过程亦即数据处理。然后将初步处理过的数据利用专业软件进行分析、加工,使其结构化或半结构化,此为数据分析。分析完成后找到能够用于科学研究的有效数据,此为数据发现。新服务理念,增强服务意识,提高服务能力,加快实现馆员自身的社会价值和自我价值;其二,对象性目标:通过智慧数据服务,强化科研支持,助力科研人员制定、落实、完成科研计划,加快科研产出;其三,工具性目标:合法合理、科学有效地采集、管理和应用数据,充分释放数据价值,使其真正为科研活动服务。接着将这些有价值的数据妥善保存和管理,便是数据保存。再根据科研需要进行检索、查询、浏览、下载,此即数据访问。最后,把通过访问获得的数据应用于科学研究,产出科研成果,便是数据应用。至此,一个数据生命周期完结,而通过数据应用所产出的科研成果将成为新的数据来源进入新的数据生命周期,如此往复,呈螺旋式上升的演进形态。
图书馆的智慧数据服务应扎根科研数据生命周期,立足图书馆的服务特点和比较优势。
数据生成阶段:①采集、分析和管理用户小数据,描述用户画像,了解用户需求信息;②参与用户科研活动,成为用户科研伙伴,协助用户制定研究规划;③提供信息导航、咨询回复、资源推介等服务,帮助用户进行科研数据准备和文献资源积累。
数据处理、分析、发现阶段:①为用户提供技术指导和支持,解决用户在数据处理、分析、发现过程中的技术难题;②协助用户进行数据检索、下载、清洗、分析、挖掘、传递等,帮助用户获取有效数据。
数据保存、访问阶段:建设和完善智慧数据服务平台,为用户提供开放存取服务,帮助用户即时存储、更新、浏览和提取科研数据。
数据应用阶段:①追踪用户科研进程,帮助用户实现数据发掘和知识发现;②协助用户进行科技查新,对科研项目及其成果的新颖性作出客观文献评价;③提供版权服务,做好版权识别与清理,帮助用户合理使用资源、规避版权纠纷。
基于图书馆可开发和拓展的智慧数据服务内容,可进一步探寻并确定图书馆智慧数据服务目标体系:其一,主体性目标:一是就图书馆而言,在科研数据服务过程中,做好顶层设计和制度安排,拓展图书馆服务职能,加速图书馆的转型升级;二是就馆员而言,以科研数据服务为抓手,更
毋庸讳言,在科研用户数据需求与图书馆智慧数据服务的关系上,一个较普遍的现象是:一方面,科研用户有数据服务的需求,但他们通常仅把图书馆作为一个“资源池”,而当无法有效获取资源时便转向其他渠道,缺乏向图书馆寻求帮助的意愿和习惯;另一方面,图书馆在数据、信息、知识、技术等方面具有鲜明优势,但极少主动追踪科研用户的科研动态,缺少可持续、个性化、嵌入式数据服务的理念和行动。无疑,图书馆是解决这一矛盾的主导力量,而确立正确的技术路线、找到有效的服务方式则是解决此问题的关键所在,如图3所示。
准备环节,图书馆应不断健全科研数据服务制度,制定科研数据服务流程,购置和更新必要的硬件设备及软件技术,建设科研数据服务平台,设置专门的科研数据服务岗位,并对专业数据馆员进行培训。通过一系列的准备,为图书馆扮演好数据创造者、数据专家、数据主管、数据馆员的角色创造条件、开辟道路[8]。
分析用户科研需求环节,图书馆应充分使用小数据分析技术。图书馆小数据是以读者为中心的高价值、多类型、数量有限和即时更新的数据集[9]。小数据分析的核心价值在于微观分析和个别管理——在用户许可的范围内利用监测技术、传感器网络技术等实时追踪、采集、存储、分析读者个体的年龄、性别、年级、健康状况、物理位置移动轨迹、社交活动、借还书情况、阅读行为、网络浏览痕迹、学习心理变化等“数据面包屑”,为读者精准地描绘出其行为、心理、思想和需求的自画像[10]。从而,一方面帮助用户更加客观地认识自己、把握自己的学习规律、管理自己的学习行为,另一方面也可以让图书馆更准确地了解和预测用户阅读活动需求、兴趣和方式变化趋势,为图书馆开展个性化精准服务提供参考和依据。总之,充分使用小数据分析旨在全面、准确地把握和预测科研用户的数据需求情况,以提高图书馆服务的精准度。
图3 嵌入式智慧数据服务技术路线及服务方式
开展智慧数据服务环节,图书馆应采取嵌入式个性化服务,即根据科研用户的实际需求,将图书馆的具体服务嵌入到科研用户的科研全过程,为其提供个性化精准服务。一般而言,图书馆的智慧数据服务有两种情形:其一,响应式服务,即被动服务,亦即当科研用户使用图书馆资源和服务时,及时予以响应和反馈,如参考咨询服务、导航检索服务、开放存取服务等;其二,主动式服务,即主动了解科研用户数据需求信息并提供有效资源供应及个性化科研服务,如协助科研用户制定科研规划,以及为科研用户提供数据分析、数据挖掘、科技查新、知识发现、数据推送等服务。
智慧数据服务评价和反馈环节,图书馆应采用问卷调查、个案访谈等方式深入了解科研用户在接受科研数据服务后的客观效果和主观体验,或者就科研用户利用图书馆数据资源的实际情况进行数据统计和分析,从而了解图书馆科研数据服务的实效性,进而改进智慧数据服务模式,提高服务效能。
嵌入式智慧数据服务具有三个基本属性。其一,技术性。技术是智慧数据服务最重要的驱动和支撑力量。一方面,新兴技术的快速发展使得图书馆不得不与时俱进,不断将其引入并渗透到服务之中,另一方面,包括语义技术、数据统计技术、数据聚类技术、数据分析技术、数据挖掘技术等在内的诸项技术是支撑图书馆智慧数据服务的核心力量。其二,社会性。智慧数据服务创建了一个全新的社会信息环境,图书馆、馆员、科研用户在这一特殊的社会信息环境中形成了以智慧数据服务为纽带的新型社会关系系统:图书馆间的合作联盟关系、图书馆与馆员间的相互依赖关系、馆员间的协作伙伴关系、科研用户间的共建共享关系、馆员与科研用户间的服务联动关系,等等。其三,人文性。智慧数据服务虽以数据为媒介,但最终体现的是人与人之间的关系,数据只是服务的载体和内容,人才是服务的根本。
实践中,图书馆既要把握好嵌入式智慧数据服务的基本属性,还要对以下几个问题给予足够的重视和警醒,并尽量避免或克服:
第一,避免技术滥用和资源浪费。一方面,从实际需要出发,立足校本、馆本采购设备、技术,避免盲目跟风和攀比;另一方面,降低智慧数据服务成本,扩大服务范围,提高服务有效性,对数据资源实现充分利用。
第二,避免数据服务中的法律问题和伦理问题。前者集中反映在知识产权问题上,后者主要体现在隐私权问题上。图书馆在进行智慧数据服务时,既要做好版权识别与清理工作,保证科研用户使用数据资源的合法性,又要保护科研用户的隐私权不受侵犯。
第三,避免数据应用低效或无效。提高数据服务的意识、能力和素养,合理利用数据开发、保存、分析、挖掘服务,充分释放数据价值,努力为科研用户提供个性化精准服务。
第四,避免人文关怀弱化现象。通过创建人性化的图书馆智慧空间、创设温馨的人文环境、建构同用户友好互动的交互机制、提供契合用户需求的数据资源精准服务等方式,确立并落实以人为本的智慧数据服务理念。
(来稿时间:2019年4月)