陈廉芳 许春漫
大数据时代高校图书馆嵌入式知识服务研究*
陈廉芳 许春漫
论文指出嵌入式知识服务与科学研究、知识计量的关联与区别,从嵌入式知识服务是图情工作特长,知识服务的开展需要嵌入用户需求,嵌入式服务需要深入知识单元等方面,分析高校图书馆开展该服务的必要性;说明嵌入式服务内容有用户需求的分析、研究项目的查新、研究力量的调查、前沿热点的分析和规律趋势的预测等五个方面,它的发展需要有人才、技术和制度等三个层面的保障。
嵌入式服务知识服务大数据高校图书馆
2011年5月,全球知名咨询公司麦肯锡发布的《大数据:创新、竞争和生产力的下一个新前沿》引起人们对大数据的广泛关注,该报告指出大数据已经渗透到当今每一个行业,成为推动业务职能发展的重要生产要素,海量数据的挖掘和运用将产生新一波生产率增长和消费者盈余浪潮[1]。大数据的发展使得科研方式产生了根本性的变革,数据密集型科研成为继经验范式、理论范式和计算机模拟范式后的科研第四范式,给科研工作带来大量包含非结构化或半结构化的数据爆炸,缺少合理的数据保存、共享和重用制度,缺乏有效的数据工具等挑战[2],这对图书馆的服务产生深远的影响。在大数据时代,图书馆需要重视用户数据与信息,利用数据分析技术与工具,提高图书馆服务的智能化来创新图书馆的服务与发展[3]。高校图书馆需要在大数据分析的基础上获知用户的需求、服务的绩效和用户的满意度来开展知识服务,以确保服务与需求的高度匹配。
知识单元是客观知识系统中具有实际意义的基本单位[4]。嵌入式知识服务是顺应科学研究环境的变化,以用户数据的计算来判断需求导向,动态地收集某一个或若干个学科领域的各种文献知识,从中抽取、选定知识单元,通过统计、对比、关联、综合、归纳、预测等知识分析方法进行深层次的知识重组开发,得出符合用户需求的辅助科研的知识增值产品。强调服务嵌入用户需求并深入至知识单元,有针对性地对知识单元进行整理和开发。
嵌入式知识服务以学科知识为整理对象,与以学科知识为研究对象的科研工作不同之处在于它以文献中的知识单元以及相互关联、分布、规律、趋势等为研究对象,生产知识增值产品但却不直接产生科研成果,通过辅助科研人员间接产生科研成果,服务层次虽已深入知识内容,但仍为图书情报工作范畴。嵌入式知识服务要求馆员具备一定的学科知识
背景,但其定位不是学科的研究专家而是文献知识的研究专家,其专长是运用知识统计学、计算机科学和用户心理学等科学进行文献知识分析,这种图书情报分析方法是各学科普遍适应的,而对于超出以文献知识单元为研究对象的各学科独特的研究方法,馆员遵循“有所为有所不为”的原则,有选择性地不予以涉及。
嵌入式知识服务需要运用知识计量学方法,但两者的目的不同。知识计量是对文献中蕴含的知识数量、质量和价值等的测量,是定量地对知识本身和知识活动及影响等进行测量的一个复杂的综合性研究问题,不仅涉及图书情报信息研究领域,而且与经济学和知识经济学研究领域、管理学和知识管理学研究领域密切相关[5]。而嵌入式知识服务是以用户的显性和隐性需求为出发点,面向特定科研而进行的知识单元整理,形成价值附加量高的知识增值产品,满足研究人员对该领域有关情况的快速掌握,为某一领域科研工作提供指导借鉴。
2.1 嵌入式知识服务是图情工作专长
对信息资源的搜集整理可以看作科研过程的一部分,更不要说对文献内容知识单元的整理,在此过程,科研人员能加深对学科知识的认知,还可能产生灵感思路。但是,对信息资源的收集和文献知识单元整理并不是科研人员的特长,而是图书情报工作领域的专长。随着资源的不断丰富,不通过专门文献信息组织机构,用户将不可能获取某一领域齐全的研究资料,图书馆就必然需承担起文献资源的收集、分类、标引和提供使用的任务;同样,随着文献信息的指数级增长,不借助专门的文献知识分析机构,用户也将不可能快速地了解某一领域发展动态,这就要求图书馆必须相应地嵌入文献知识进行内容的分析。
2.2 知识服务的开展需要嵌入用户需求
在大数据环境下,用户的个性化需求是深度化、多维、复杂、动态和易变的,表现出明显的情景敏感性[6]。在进行知识分析的过程中,需要与用户紧密联系在一起,针对用户的特定需求,协调合作共同分析文献知识,不仅要与用户的专业、兴趣、喜好等相吻合,而且要依赖时间、地点、科研用户任务以及用户与系统的交互历史等信息情景探索用户所需知识[7]。嵌入式服务在用户情景与文献知识内容两方面嵌入,馆员力图融入成为科研团队的一份子,既弥补科研人员图书情报分析能力的不足,有效地推进科研进程,又不影响科研人员对文献资料的全面透彻理解。
2.3 嵌入式服务需要深入知识单元
科研是为了认识客观事物的内在本质和运动规律而进行的调查研究、实验、试制等一系列的活动。大数据时代的到来催生出以数据密集型为特征的科研第四范式,科研从以单一学科为中心逐渐转变为多学科多领域协调合作。科研数据快速增长、信息源不断增多,研读所有文献变得越来越不可能;而且面对大量的专业文献,不经过统筹分析,不仅利用效率低下,还容易忽视重要文献;此外,新知识、新规律的发现还有赖于多学科交叉分析计算。因此,将科研中的非核心部分让渡于馆员成为一种需求,如科技查新、文献计量、定题服务和综述评论等都可以成为馆员对科研工作的外包业务。
嵌入式知识服务的开展需要以用户的科研为驱动,围绕用户的研究方向和科研选题进行,嵌入式知识服务的内容有包涵以下几点。
3.1 用户需求的分析
大数据环境下用户需求的获取方法,除了要分析用户学科、任务、兴趣等身份特征和采取多种形式咨询征集用户需求,更重要的是动态地收集分析用户与各种自动化系统交互中产生的数据。大数据思维分析用户需求具有从随机抽样到全体推测,信息分析混杂高效,寻求事物之间相关关系等特点[8]。首先,要收集用户数据,记录用户的基本信息,如年龄、学历、喜好、所属机构、科研经历、科研成果等,挖掘、关联并合成用户的点击、浏览、检索、标记和收藏等信息行为,资源载体类型、内容类型、学科主题和资源使用权限等使用处理情景,参考咨询、科技查新、定题服务、资源导航等服务接收情景。其次,整理分析数据,采用语义网的相关技术将收集到的用户数据进行规范化和标准化,转化成能被应用程序理解和使用的高级表示法,便于进行需求目标感知和预测。最后形成以数据为依据的决策服务,对科研用户个人或群体的当前任务、短期目标和长期目标等多层次的资源需求进行定位并动态地把握环境和需求的变化,使服务能够嵌入到科研活动的整个过程[7]。
3.2 研究项目的查新
图书馆以主动嵌入的姿态联系本校的学科院系,通过多种方式宣传查新途径,扩展知名度。首先,在与科研人员良好沟通的前提下,充分融入科研团队,调研该团队的研究方向、领域和未来前景,分析学术成果的发表数量、质量和进展阶段,横向对比同
领域研究机构的科研成果,帮助用户认识团队的科研水平、优势和劣势,扬长避短,建设特色优势项目。其次,对科研团队的课题申报项目和论文选题进行透彻的分析比较,确定查新点,抽取关键词,制定检索策略,通过搜索国内外各类型文献数据库、网络搜索引擎及Lib2.0碎片化信息,取得符合查新要求的相关参考文献资源,经过客观判断,形成有依据的公正权威的对比分析结论;以文献或事实鉴证选题的新颖性,避免重复研究,减少盲目性,保障研究内容的科学性和独创性,为用户选题的修订提供依据。再次,围绕某个研究方向,增强科研互动,贯穿整个科研项目的选题立项、研究过程、结论鉴定、专利申请、成果转化等,定期连续地跟踪、获取和推送国内外最新前沿动态,并用这些参考资料论证成果鉴定、评估、验收和奖励等的科学性和可靠性[9]。
3.3 研究力量的调查
对某一学科领域文献的年代、来源、作者和机构等进行统计,得出研究力量的时空分布及合作引证关系。统计某领域文献的发表年代,计算出该领域文献发表的高峰期、低谷期、走势、发文半衰期和引用半衰期,了解该领域的发展趋势和研究价值;调查某领域研究在国内外期刊、专著、报纸、专利、学位论文和会议论文等的分布情况,得出高被引、高质量文献作为推荐阅读资料,特别注重对核心期刊的分布情况、引证情况、栏目设置和发文特点的分析,通过较少的期刊获得较多较高水平的信息量,作为学术问题跟踪和投稿的参考;分析某领域发表论文作者的产量、共引和引用认同情况,通过普赖斯理论、加权平均法、H指数法、综合指数法等方法计算出核心作者群,了解核心作者的年龄职称、机构地域、研究侧重点、合作度等情况;分析某领域研究机构的类型特点、人员构成、地域分布、科研立项、研究方向、引证情况等,了解各机构的实力情况,遴选核心机构;通过核心作者和核心机构的分析,全局掌握该学科发展实力特点,便于关注追踪学术动态,有利于同行交流探讨,建立合作关联,也能更清晰地获知自身的水平和特色,作为发展方向的引导和研究选题的参考。
3.4 前沿热点的分析
对前沿热点的掌握,有益于跟进学科发展潮流、明晰研究目标、突破重点领域、获知薄弱和空白、开拓崭新方向及反思发展道路等,可以采用定性的学科动态编制和文献综述方法进行分析:在阅读某一主题的文献后,提炼重点内容进行浓缩形成学科动态,或经过文献知识整合理解,融会贯通地对该领域综合分析和评价。定性的动态和综述编制法对馆员的学科知识要求高且依赖个人经验和主观偏好。定量的文献知识处理方法较为客观、准确和系统,通常选取一定年代和范围的数据来源,从文献中选取关键词进行初步整理和归纳,规范原始的关键词形成概念准确的主题词,总结主题词出现的规律测定该领域的研究热点和发展动向,常用的方法有词频分析法和共词分析法。通过统计核心词汇在某一个领域某一时期出现的频次高低以及频次的变化情况,并对核心词汇在同一文献共现频率进行聚类、关联和词频的计算及突发词监测,归纳该学科结构与范式,总结同一客体的不同研究视角[10]。文摘综述和计量方法都是建立在一定量的文献基础之上,对于最新前沿的关注,更应该注重各级别的课题项目、核心机构的科研动态发布及核心作者的博客、微博、社交网空间等。
3.5 规律趋势的预测
对某一学科或行业的信息资源进行全面收集,在深入分析已知专业研究文献的基础上,利用通用的科学逻辑思维,如对比、分析、综合和推理等手段,或专门的情报发展规律,如计量学方法,或某一学科特有的学科发展规律,结合使用信息分析软件系统对未知或未来学科发展信息进行科学预测,总结其发展历程、发展现状、存在问题,预测其发展方向,揭示该学科的研究特点和发展规律,为后续的研究和工作提供科学的依据[11]。由于学科知识发展规律复杂且影响因素众多,通常要用多种手段构建不同的发展模型,以期达到对学科发展规律趋势的准确预测。预测方法通常有如下4种:根据大量积累的文献知识实际统计的数据,归纳学科文献分布规律,如布拉德福定律、洛特卡定律、齐普夫定律等;根据客观数据发展趋势,建立数学模型预测现实发展变化,如普赖斯的科学文献的指数增长规律;将其他领域的数学概念、定量模型移植到文献知识发展预测中,如生物学的“生长曲线”、经济学的“人口增长模型”、物理学的半衰期等;对于涉及多领域的课题,先“模糊搜索”网罗全部文献,导入并存储在计算机群中,运用统计分析算法对大规模数据比对分析,辅助科研人员挖掘出新的科学发现[12]。
嵌入式知识服务是图书馆业务新的增长点和服务重大升华,在人才、技术和制度等三个层面都面临着障碍,需要合理解决以保障服务的发展。
4.1 人才层面
嵌入式知识服务要求馆员具备图书情报分析、
学术参与、信息敏感、知识快速汲取、计算机技术、文字表达、合作协调、沟通交流和外语水平等多方面的综合能力,以及一定的学科知识。要求嵌入式馆员能在纷杂的用户数据中挖掘出有价值的信息,能感性地认知学科领域发展概况,能理性地计算描绘出发展脉络、前沿热点、未来趋势和重要机构作者等,掌握一定学术鉴别、评价、创作、交流和成果发表转化能力。嵌入式馆员与学科馆员一脉相承,人才队伍建设最理想的途径是将现有的学科馆员转化为嵌入式馆员。对于嵌入式馆员的培养,除了派遣馆员学习、邀请专家培训、加强同行交流、指定书目学习外,更为重要的是要创造实践条件,让馆员在开展知识分析的工作中边做边学,层层实践积累经验。
4.2 技术层面
嵌入式知识服务对技术有着高度的依赖性。用户需求的分析从搜集用户全部数据出发,运用各种统计分析和预测软件在大型存储运算设备中进行关联计算。在硬件设备方面,以智能计算和海量数据设备为基础,需要高性能的存储设备、计算能力和网络通讯,如单体容量可达数百TB高性价比的新型存储系统,指令周期达每秒千万亿次的运算器和GB级网络带宽。在软件方面需要实现用户数据和文献知识管理、计量统计和分析预测等功能,主要包括数据管理和科研辅助工具、知识图谱可视化工具、信息分析预测软件等[13]。在数据资源方面,引进知识发现系统和智能检索系统,打破各数据库资源各自分割的信息孤岛局面,构建高效精准的一站式学术资源搜索系统。
4.3 制度层面
嵌入式知识服务的时间和空间不固定,知识产品的价值估量困难,需要从工作量的考核、激励机制和监督机制三方面进行制度完善。采用柔性管理和弹性工作制,将定量与定性相结合考核工作量,注重用户的满意度和对用户的帮助性考量,如考核参与的课题数量、知识产品的质量、职责的履行程度、完成工作的效率和服务用户的态度等;在原有工资报酬的基础上,增加多劳多得的奖赏激励制度,根据工作考核情况给予适当的课题经费补贴,并推行精神奖励办法,鼓励科研工作者对服务进行评价,在科研成果中对满意的服务发表致谢,甚至加入署名;在强调馆员自律的前提下,他律机制不可偏废,施行学年服务工作数量、质量、效果和用户满意度的考查与监督,防止懈怠渎职,盘活用人机制。
[1]Big data:The next frontier for innovation,competition, and productivity[EB/OL].[2014-01-28].http://www.mckinsey.com/insights/business_technology/big_data_the _next_frontier_for_innovation.
[2]Beyer M A,Laney D.The Importance of Big Data:A Definition[EB/OL].[2014-01-28].http://www.gartner.com/ resId=2057415.
[3]周晓英.数据密集型科学研究范式的兴起与情报学的应对[J].情报资料工作,2012(2):5-11.
[4]韩翠峰.大数据时代图书馆的服务创新与发展[J].图书馆,2013(1):121-122.
[5]王子舟,王碧滢.知识的基本组分:文献单元和知识单元[J].中国图书馆学报,2003,29(1):5-11.
[6]文庭孝,刘晓英,梁秀娟,等.知识计量研究综述[J].图书情报知识,2010(1):95-101.
[7]张树良,冷伏海.Web环境下个性化信息的获取和个性化服务的实现[J].中国图书馆学报,2007,33(4):77-81.
[8]邓仲华,李立睿,陆颖隽.基于科研用户情景感知的嵌入式知识服务研究(上)[J].情报理论与实践,2014(9):16-19.
[9]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:2.
[10]朱玉奴,马景娣,缪家鼎.高校科技查新工作的创新发展路径研究[J].图书馆工作与研究,2013(8):60-64.
[11]钟伟金,李佳.共词分析法研究(一):共词分析的过程与方式[J].情报杂志,2008(5):70-72.
[12]查先进.信息分析与预测[M].武昌:武汉大学出版社,2009:2.
[13]樊丽萍.传统图书馆:拐点或终点[N].文汇报,2012-05-06(1).
[14]肖明,邱小花,黄界,等.知识图谱工具比较研究[J].图书馆杂志,2013(3):61-69.
陈廉芳福建医科大学图书馆馆员。福建福州,350122。
许春漫福建师范大学社会发展学院图书馆学系教授。福建福州,350122。
Embedded Know ledge Service of Academic Library in the Age of Big Data
Chen Lianfang,Xu Chunman
Embedded know ledge services are closely related to the scientific research and the know ledgemeasurement,but also distinguish from each others.It is necessary to carry out the services in academic library,for embedded knowledge service belong to library and information work skills,knowledge services need to embed user needs,and embedded services require to go deep into knowledge unit.The service programs mainly contain five aspects which are analysis of users’requirement,novelty retrieval of research programs,survey of research forces,analysis of trend and hot domain,and forecast of law and trend.Their developmentneeds three levels of protection which are talent,technology and institution.
Embedded service.Knowledge service.Big data.Academic library.
G258.6
2015-03-16编校:刘勇定)
*本文系教育部人文社会科学研究规划基金项目“当代学习理论视阈下高校图书馆泛在学习共享空间构建研究”(项目编号:12YJA870022)、福建省中青年教师教育科研项目A类社科研究课题(文献信息资源共享与服务研究专项)“大数据环境下的高校图书馆嵌入式服务”(项目编号:JAS14959)研究成果。