基于大数据分析的采访平台建设构想

2016-04-16 14:33闫兴周郑章琴合肥工业大学宣城校区图书馆安徽宣城242000
阜阳职业技术学院学报 2016年2期

闫兴周,郑章琴(合肥工业大学宣城校区 图书馆,安徽 宣城 242000)



基于大数据分析的采访平台建设构想

闫兴周,郑章琴
(合肥工业大学宣城校区 图书馆,安徽 宣城 242000)

摘要:运用大数据技术,建立文献采访平台,设采访管理、出版管理、书商管理、读者荐购、馆藏结构等系统。平台通过数据挖掘发现知识价值,促进文献出版质量的提高;方便采访员快速高效采购文献,建立科学的馆藏体系;建立单种文献竞价机制和标准的采访评价体系,优化采访工作质量。

关键词:文献采访;采访平台;文献竞价;采访评价;馆藏结构

1 引言

如何提高文献采访质量,及时获得有价值的文献是文献采访不断研究的课题。文献采访研究关注如何提高馆藏文献的质量和资金使用效率。如相关论证提出的“针对用户需求和学科发展进行个性化采访”、“文献采访是知识性、实用性和保存性的统一”、“学科建设需要一定数量和质量的文献保障”、“以读者荐购、专家征询、学科信息调研为依据的采访模式”等等。其目的在于提高采购资金利用率,保障采购文献的质量,达到读者需要的文献都有采购,读者不用的文献尽可能少采购的目的。对于图书馆文献采访效果的评价,除了依据文献采访原则的定性评价之外,更需要大量的文献使用统计数据的支持,特别是通过相当数量图书馆馆藏文献借阅

统计数据的横向比较,建立一个基于统计数据的评价系统,这样才能准确地评价文献采访的效果。随着大数据、云计算等信息技术的发展,多馆馆藏文献数据信息分析已可实现。如果引入大数据分析,建立图书馆文献采访平台,图书馆文献采访工作将产生显著的变革,可极大地提高采访的质量和效率。建立图书馆文献采访平台要通过分析各图书馆的读者和文献的运行和管理数据,建立系统的文献采访数据库,做到文献采访及时、准确、符合本馆资源建设规律。文献采访平台的基本架构依据采访涉及的诸因素可由采访管理系统、出版数据管理系统、书商管理系统、读者荐购系统、馆藏结构系统等子系统构成。

2 采访管理系统

2.1采访协作系统

现有的文献采访模式是每个馆有两名左右的采访员,大馆每年要采购图书万种以上,由于时间和精力的限制,个人知识结构的限制,采访员很难把握每种文献是否符合采购标准。在其知识范围内的文献可能得到很好把握,超出其知识范围的文献,采访把握就会有很大随意性,采购的许多文献有可能不适合馆藏,甚至有些是垃圾文献。如果能够将各个图书馆的采访能力集中起来,建立协作采访平台,将大大提高采访效率。

采访协作系统就是将各馆具有一定资质的采访人员联合起来,根据他们的专业知识背景,分别负责《中图法》分类中的不同类别文献的采访。所有图书馆采用统一的采访入口和采访模式,采访员分工协作,采访数据共享。

采访协作的主要内容是先评估每种出版文献的知识价值。同一个类别的文献可由多名采访人员共同负责,采访员根据每种文献的内容对该文献给出一个评价指数,代表这种文献的知识价值。根据每一位采访人员对某种文献的采访评价指数统计总的采访评价指数,各馆根据自己的需求,参照每一类文献的评价指数采购。并不是所有的图书馆采访人员都可以担任平台采访员,平台采访员实行资格准入制度和淘汰制度。对每个学科专业采访员的资格有相关专业和学历的要求,一般应具有本专业硕士毕业以上,即对本学科的知识比较精通并有一定的研究。对于高校图书馆来说,可以聘请各方面的专家做采访评估员。他们既可以对采访员采访的文献进行评估,也可以直接采访各种文献进采访数据库。采访员和采访评估员的资格实行动态管理,每年对其采访的文献数据进行大数据分析评估。分别对其评价的文献的采购率、借阅率、预约率、未借率等数据进行统计,根据设定的标准进行淘汰或进行末位淘汰制。比如某位采访员一年推荐 1000中文献,有700种文献被其他馆采购,他的采购评价指数就是 0.7。其前一年推荐的被采购文献的借阅率为50%,则其采购借阅评价指数为0.5,如此等等,最后将各评价指数加起来得到总的评价指数。评价指数处于整个采访员评价指数排行榜末位的若干名采访员将被淘汰。为了激励采访员做好文献评价工作,其采访评价指数可以作为年度考核和获得专业技术职称的重要依据之一。

为了鼓励图书馆组织动员专家力量评估文献,获得文献的知识价值,平台应该设置图书馆积分制度和规则,每个图书馆按照对采访平台的贡献获得积分,使用平台则消耗积分。即各图书馆评估的文献被别馆采购,该馆就获得相应积分,采购了平台评估指数的文献就扣除相应的积分。积分制能充分体现共建共享原则,提高各图书馆参与文献采访评价的积极性。

总之,采访协作系统的目的就是对每一种文献通过若干专业人士对其识别,评估其知识价值,得到该文献的可采购指数,作为图书馆采访文献的依据。采访协作系统建设可以减少重复劳动和采访随意性,提高采访的效率和准确度。

2.2采访评价系统

采访评价系统为采访人员的工作操作提供科学依据。采访协作系统将每一种文献的知识价值给了一个采访指数,文献采访可将给了采访指数的待采文献设置分类、主题、题名、作者、出版社、出版日期、畅销书等采访入口,形成待采文献集合,依据采访指数给每个集合中的文献排序,同时可设置多条件采访选项。采访人员根据自己的采访需求进入相应的入口,在某一个设置条件下,采购采访评价系统已评价的文献。各馆采访员一般不需要自己从选定的文献之外选择文献。因为采访平台选择的文献都是通过各馆大数据分析加上专业采访评估员的审定决定的,有充分的科学依据和数据支持。如果有采访员觉得某种文献不在采访评价系统可选范围内又需要采购,可提交平台经专业采访员评估审定即可。

采访平台为采访员设置各类采访参数供参考。在采访管理系统设采访人员考核评价指数,根据采访人员各方面的数据分析产生各项指数,算出采访员的综合指数。采访评价系统既是采访员的参谋和助手,又对采访员起监督和限制的作用。例如采访员要采购某一类文献,首先由系统提供按该类文献的专业采访评估指数排序的文献列表,同时辅助显示该类文献在本馆的借阅率、预约率、未借率、续借率等,采访员依据这些指标进行采购,避免采访员的随意操作。

3 出版数据管理系统

在文献采访平台上,出版社可将本社出版的文献按照标准的格式导入数据库。新出或预出版的图书有详细的内容简介、章节目录、试读的部分内容等。平台可根据馆藏文献和借阅数据统计各出版社所出版文献被收藏的排名和各出版社在图书馆中所藏文献的借阅率。也可以按分类统计所藏出版社文献的数据,得到每一学科知识文献最具权威的出版社和出版数据。通过各种途径的分析统计,得出基于图书馆馆藏和借阅数据的出版社排名。也可以根据高校的重点学科差异,分析出适合该馆采购文献的出版社排名。图书馆采购图书依据出版社的适合度和馆藏排名,可以保证图书的采购质量。同样,出版社也能通过各图书馆的大数据分析,得出本社出版的图书在图书馆中的利用情况,哪类图书是自己的优势资源,从而调整自己的出版策略。特别是将准备出版的图书先在采访平台发布,根据采访平台的评估数据和预采数量,调整出版和印刷计划。

4 文献采购竞价系统

4.1打包招标的弊端

现有的文献采购方式多数是采用打包招标方式,设定一个统一的价格折扣率,不论什么文献都以此折扣率计算价格。图书采购不同于一般的商品采购,有其特殊性,是依据其知识属性而不是依据其物理属性采购。在实际的文献采购实践中,优质文献和普通文献都是以图书定价的折扣价作为采购价格,以几家中标书商作为供货单位,完全没有考虑文献的知识属性。特别是以最低价中标模式招标的方式,导致供货商以低于成本价中标,供书质量难以保证。图书馆一批书单发出去后,供货商从利益最大化立场出发,对于图书馆急需的知识价值高的文献,因为出版社的折扣率高而不予供货。特别是在图书馆没有一个严格的采访评价标准来衡量采访质量时,很容易采到许多不适合馆藏的文献。

4.2竞价系统

文献采购平台对每一种文献都设一个竞价平台,出版社或书商根据自己对该文献知识价值和购买预估的判断确定该书的供货价格,并在平台上报价。图书馆根据馆藏需求情况设置或不设置采购价格。如果图书馆不设最高限价,则按照各馆订购的时间先后顺序从最低价依次采购。对于出版社和书商来说,逼迫他们要精确到了解每种文献的知识价值和潜在需求。精确计算每种文献的销售价格。如果是图书馆需求量大,很有知识价值的图书,价格报低了,就会减少利润。另一方面,如果价格报高了,则可能错过销售的机会。单本文献价格竞争机制对图书馆的采访工作也是一个促进。如果图书馆不能提高工作效率,尽快采书,则有可能会高价采购或采不到该种文献。采用单种文献竞价方式采购,可以使每种文献的采购都有据可依,图书馆和书商在合理的价格范围内交易,避免人为的不正当因素的发生,避免了图书馆以统一的招标价格采购高出文献的实际报价并且知识价值低的文献。这一机制同样会促使出版社出版更有知识价值的文献。竞价平台对书商和出版社采取准入制度、淘汰制度、资金担保制度。准入制度要求进驻平台的书商和出版社首先要签订统一的交易合同。资金担保制度要求书商和出版社、图书馆双方都交付一定数额的合同保证金。如有不发货、不按时发货和不收货、不按时收货的行为,以及文献质量问题等,按约定的规定自动从保证金扣除费用给对方。平台根据每一家单位的交易活动数据分析评估,给出守约和诚信指数,对低于一定分数的单位进行淘汰出局。平台对各家图书馆设采购价格指数,根据采购价格指数的数值确定各图书馆采访人员的采购价格水平。

5 读者荐购系统

传统的荐购系统因读者所填写的荐购信息不完整会导致荐购失败。而且读者荐购的图书还需要查重。采访平台要有一个读者荐购入口。读者填写荐购图书的书名、著者、出版社后,平台自动修正该书的信息,补充国际标准书号、版次、出版年份、定价等信息,显示该书的实物图片请读者确认。读者确认荐购文献信息后,系统会自动显示该种文献的相关信息:本馆有无收藏和订购,如有收藏,该文献的借阅数据,预约数据。该本书的所有收藏和订购信息,即有多少馆收藏,多少馆正在订购。荐购图书如果还未有图书馆收藏或订购,应进入采访评价系统由采访员进行评价。图书馆在采购荐购图书时,系统可自动查重去掉本馆已藏和在订图书。荐购系统应开发微荐购服务平台(手机 APP客户端),读者可随时随地方便地通过扫码等方式荐购图书。荐购系统还应包含自动荐购功能,系统将别的图书馆借阅率较高,本馆未订购收藏的图书自动推荐给采访员。自动推荐可按分类法分类设置,可选择或关闭自动推荐种类。自动荐购系统可发现本馆漏采的优质文献资源,及时补充采购,优化馆藏结构。

6 馆藏结构系统

馆藏结构系统是通过分析各个图书馆的馆藏数据建立图书馆结构类型。本系统可以从各种途径统计分析馆藏文献,并对各馆数据进行分析,形成馆藏文献结构的特点,按各馆文献结构的特点对图书馆进行分类。馆藏文献结构种类:按分类法进行馆藏文献种类统计,按照馆藏文献数量排序,可得到本馆某类文献收藏在图书馆中的排名,也可获得系统中全部图书馆在某类文献收藏的排名。这就是依据分类法形成的分类馆藏结构和分类馆藏排名。按出版社进行馆藏文献数量的排序,形成出版社馆藏结构和出版社馆藏排名。按年份购书量对文献排序,形成图书馆采购逐年曲线图,能动态反映馆藏文献的更新状况。按平均复本率和分类借阅率相关联统计馆藏文献结构和馆藏排名,得出复本量和借阅率的关系,并求得最佳复本率。按照馆藏文献结构数据相似度对图书馆分类聚集,形成功能相似的图书馆集合体,可研究同一类型的图书馆文献采访的共同特征和统一采购标准,促进图书馆之间交流的针对性。馆藏结构分析也可以从图书馆文献数量和利用数据上看出一所大学的专业学科的强弱分布。

参考文献:

[1] 钱薇.文献采访决策与读者需求关系探索[J].图书馆杂志,2013(1):35-37,111.

[2] 潘家武.高校文献采访的质量控制体系构建[J].图书情报工作,2010(13):79-82.

[3] 郭海明.高校图书馆全员文献采访模式构建探讨[J].图书馆理论与实践,2013(6):74-77.

[4] 陈宏东,陆为国.文献采访辅助决策系统的研发与应用[J].大学图书馆学报,2008(6):27-29.

[5] 胡永强.高校图书馆个性化文献采访研究[J].图书馆学研究, 2013(14):37-40.

[6] 秦亚欧,关锋.文献采访工作中的博弈问题分析[J].图书馆学研究, 2007(5):50-52.

[7] 张静.学科文献采访体系建构策略研究[J].图书馆学研究,2014(9):60-61,45.

[8] 钱薇.图书馆文献采访决策因素研究[J].图书馆,2013 (2):90-91.

Construction Strategy of Interview Platform Based on Big Data Analysis

Yan Xing-zhou, Zheng Zang-qin
(Xuancheng Campus Library, HeFei University of Technology Xuancheng, Anhui 242000)

Abstract:Using big data technology, we can establish document acquisition platform, design interview management, publishing management, booksellers management, reader recommendation, collection structure system. Through data mining, the platform is to improve the knowledge value, and promote the improvement of the quality of the literature, to facilitate the quick and efficient procurement of documents to establish a scientific collection system and to establish a single kind of literature auction mechanism and standard interview evaluation system to optimize the quality of the interview.

Key words:literature acquisition; acquisition platform; literature bidding; interview evaluation; library collection structure

分类号:G250.71

文献标识码:A

文章编号:1672-4437(2016)02-0053-05

收稿日期:2015-12-10

基金项目:安徽省高校图工委2014年度基金项目(TGW14B41)。

作者简介:闫兴周(1968-),男,安徽长丰人,合肥工业大学宣城校区图书馆副馆长,副研究馆员,硕士。主要研究方向:文献资源建设、信息资源服务。郑章琴 (1963-),女,安徽长丰人,合肥工业大学图书馆采编部主管,副研究馆员。主要研究方向:文献资源建设。