夏 勍 何晓萍
〔摘 要〕基于读者荐购的采访模式,构建了相应的决策模型,在图书馆自动化系统的基础上设计了采访决策支持系统。通过赋予权重和量化评分,运算得出图书文献采集的理想度相关性值,以辅助采访人员进行决策。
〔关键词〕高校图书馆;读者荐购;决策支持系统
〔中图分类号〕G253.1 〔文献标识码〕A 〔文章编号〕1008-0821(2009)08-0149-04
Design of Collection and Decision Support
System Based on Reader RecommendationXia Qing He Xiaoping
(Library,Nanchang University,Nanchang 330031,China)
〔Abstract〕With a book acquisition mode based on reader recommendation,a
corresponding decision model was constructed and a decision supportive system fo r acquisition was designed basing on library automation system.Weight coefficien t and some special value were assigned in the system and then the ideal values o f relevant books were worked out to support librarians decision.
〔Key words〕university library;reader recommendation;decision support system
文献采访,就是高校图书馆根据本校的性质和任务,结合馆藏实际,收集支撑教学科研的各种载体文献资源。以纸质书籍为例,一般流程是:采访人员先将收集到的各种书目信息加以整合,再依据馆藏原则和采访标准进行选订,并向图书供应商报送订单。在此过程中,对书籍的遴选工作主要是由采访人员自己完成。由于受专业、学科知识面和自身业务素质所限,采访人员对文献价值及其与教学科研的相关性把握不好,所购文献往往不能满足师生的需求,馆藏建设的质量受到影响。一些高校馆发动学科专家参与现采,但受成本、时间等因素制约,效果并不理想。本文在“读者网络荐购”的前提下,构建了相应的采访决策模型,并在图书馆自动化系统的基础上建立了采选决策子系统,将其应用于选书实践中,以提升采访绩效。
1 文献选取要素
本模型采用定性分析和定量评分相结合的方法进行计算,综合评分值较高的文献优先考虑购买。模型中,文献的选取要素是从文献内在价值、文献外部要素、相似文献馆藏情况三方面予以衡量。本文认为,文献的内在价值不是由采访人员,而是由推荐此文献的相关专业读者的层次水平来决定。
1.1 读者层次
读者层次包括学历、职称、所属学科、学术水平等因素。根据它们的级别和水平赋予不同分 值。前三项都是客观要素,学术水平的高低可针对读者在过去几年发表科研成果的数量、级 别来主观判定。
1.2 文献外部要素
文献外部要素包括价格水平、出版社、出版年代等。价格是文献选取必须考虑的因素之一,价格过高或过低的文献一般不利于选购。同时,国家级出版社及新近出版的图书往往更受青睐。
1.3 相近文献馆藏情况
相近文献的馆藏情况是指与所推荐的文献学科面相同或相近的文献(中图分类号近似)在本馆的流通率和馆藏量。通过了解相近文献的馆藏情况,来确定对应文献的选取分值,流通率较高的获得的评分就高,而馆藏量大的获得的评分就低——相关文献应减少采购。流通率和馆藏量可以通过本馆的书目数据库获取。
2 系统分析与设计
2.1 系统总体目标
系统的总体目标是:在图书馆现有管理信息系统基础上开发出一套能够依据专业读者对文献的推荐、文献外在形态、现有馆藏及其利用情况等信息,对采访工作进行决策支持的自动化系统。它能在图书馆经费有限的情况下辅助采访人员选购最需要的文献。
2.2 系统结构和功能设计
本系统包含采选和决策支持两个子系统,其工作流程是:读者以授权身份登录采选子系统,通过书名、作者、出版社、出版年代、ISBN号等方式查询各待选文献,并予推荐。采访人员在决策支持子系统中对推荐数据进行析取,系统根据数据库中的读者信息、图书信息、馆藏信息及相应的权值信息等,调用相关处理模型,进行荐购文献评分,输出经过排序的文献目录清单,辅助采访人员进行决策。总的处理流程如图1所示。
采选系统用来收集读者对图书的推荐信息。系统采用Browser/Server方式,数据库、应用程序置于服务器端, 读者和图书馆工作人员利用浏览器通过计算机网络,在经过身份认证后登录系统,进行相应权限内的操作[1]。系统功能分为5个模块:用户信息、书目中心、采选管理、推荐查询和数据库及维护,如图2所示。在一个完善的图书采选系统中,应区分不同用户角色——系统管理员、采访人员、读者,不同角色的账号具有不同的权限。
决策支持系统采用传统的Client/Server结构,Client端负责数据的输入、管理与输出,Server端负责数据的存储和访问等工作,全部数据存放在Server端,允许多用户同时使用。决策支持的第一步是提取读者推荐源数据;第二步从中析取出决策所需要的数据存入DSS(决策支持)订购库;第三步选择要运行模型的数据、定义模型,然后运行模型;第四步根据模型运行结果做出决策,输出决策结果供采访人员参考。各模块间的关系如图3所示。
2.3 文献荐购决策模型
在进行采访决策前,需收集待选图书信息——书名、价格、出版社、出版时间、中图分类号等,给读者(包括学科专家、一般教师、学生)[2]分配权限供其在线选书。其定量模型如下:
(1)读者层次中的学历、职称、所属学科、学术水平权重依次为0.2、0.3、0.3、0.2。学历的层次分为博士、硕士、学士,得分值依次为1、0.6、0.3;职称的层次分为教授、副教授、讲师/博士生、助教/硕士生,得分值依次为1、0.7、0.3、0.1;所属学科的层次分为国家级重点、省级重点、新增学科、其他学科,得分值依次为1、0.6、0.4、0.2;学术水平的层次分为高、较高、中等、低,得分值依次为1、0.8、0.5、0.2。如果某文献是由一位国家级重点学科的、学术水平较高的、具有博士学位的副教授所推荐,该项评分值为0.2×1+0.3×0.7+0.3×1+0.2×0.8=0.87。
(2)文献外部要素中包含的价格水平、出版社、出版年代权重依次为0.4、0.2、0.4。价格水平分为较高、中等、偏低、过高或过低,得分值依次为1、0.7、0.4、0.1;出版社级别分为核心、非核心重点、其他,得分值依次为1、0.6、0.2;出版年代分为当年出版、去年出版、前年出版、更早时间出版,得分值依次为1、0.8、0.5、0.3。如果上述文献价格水平中等、是去年由核心出版社出版,该项评分值为0.4×0.7+0.2×1+0.4×0.8=0.8。
(3)相近文献馆藏情况包含的流通率和馆藏量权重依次为0.6、0.4。流通率分为高、中等、低,得分值依次为1、0.7、0.4;馆藏量分为少、中等、多,得分值依次为1、0.8、0.6。如果与上述文献内容相近的馆藏文献流通率低、馆藏量中等,该项评分值为0.6×0.4+0.4×0.8=0.56。
(4)读者层次、文献外部要素、相近文献馆藏情况三者的权重依次为0.5、0.2、0.3。因此,上述文献最终评分值为0.5×0.87+0.2×0.8+0.3×0.56=0.763。该值表示此推荐文献相对于最理想文献(评分值为1)的隶属程度,亦即相关性。分值越大,表示该文献越接近理想文献,应该优先考虑购买。这里可以设定一个阈值水平λ,若大于λ则该文献应该购买。阈值可以事先给定,然后在实际工作中逐步调整[3]。
2.4 数据库设计
根据图1所描述的系统流程,在对系统功能作详细分析之后,从中抽象出系统的数据库模型〔E-R模型〕,如图4所示。
2.4.1 采选子系统数据库主要由图示8个基本表组成
数据库的设计完全按照BCNF范式设计,数据表中每个非主键字段都依赖于数据表的主键,所有不依赖于数据表的字段都将建立新的数据表,并以外键的形式(一对多关系)与中心事实表连接。这8个表分别为图书表〔Book〕——记录图书基本信息;图书类别表〔Category〕——记录图书中图分类号;出版社表〔Publisher〕——记录出版社相关信息;读者信息表〔Reader〕——记录读者相关信息;采访人员信息表〔Libmember〕——记录参与订购需求处理的采访人员的信息;读者推荐表〔Recommend Orderzrequire〕——记录读者推荐书目的相关信息;读者推荐明细表〔Recommend Detail〕——记录读者推荐书目的具体内容;订购需求表〔Orderzrequire〕——记录将进行订购决策的书目相关信息。
2.4.2 决策支持子系统主要由订购库、模型库和其他数据库组成
(1)订购库
存放订购决策所需要的书目信息,字段包括书名、ISBN号、作者、出版社、出版时间、分类号、价格、读者姓名、读者账号、推荐日期、学历、所属学科、学术水平、采访人员账号、处理时间、是否订购、相关性等,在本系统中与采选子系统数据库为同一库,主要由订购需求表及相关表组成。
(2)模型库
文献特征向量库——存放运行模型时所需的文献特征向量及其权值;
特征向量级别库——存放文献特征向量表中定义的文献特征向量的取值及其量化值;
文献外部要素信息库——存放文献外在的形态信息,包括价格水平级别定义表、出版社级别定义表、出版年代级别定义表等;
馆藏情况级别库——存放相近文献馆藏情况信息,包括流通率级别定义表、馆藏量级别定义表等。
(3)其他数据库
流通数据库——存放馆藏书目的流通信息,供采访人员查询分析馆藏分布情况、读者借阅情况及流通趋势等,作为确定流通率级别和馆藏量级别的参考。该库利用图书馆现有管理信息系统的数据;
系统参数库——存放系统参数,如最小阈值等。
3 结束语
系统采用基于读者荐购的采访决策模型,由读者在采选系统上先行推荐,再由采访人员通过决策支持系统进行优化选择,这样首先保证了所有订购均满足读者需求,同时也确保在经费有限情况下,采访人员可优先选取综合价值高的文献,使经费得到充分利用,提高了采访的科学性。
参考文献
[1]李武,傅英姿,赵海兰.基于〣/S模式的图书采购决策系统设计[J].中国教育信息化,2007,(2):39-41.
[2]赵海兰,李武,傅英姿.基于图书馆自动化系统的采访决策支持系统[J].现代情报,2007,(4):156-157.
[3]潘洁.高校图书馆文献采访决策系统研究与实现[D].北京工业大学,2003.
[4]陶波.高校图书馆选书决策模式研究[J].图书情报知识,1997,(2):55-56.
[5]吴鸿.网络环境下高校图书馆采访工作的发展研究[J].信息技术,2002,(7):81-82.
[6]张曾科.模糊数学在自动化技术中的应用[M].北京:清华大学出版社,1997.
[7]靖培栋,徐争荣,吴秋玲.图书馆书刊采购决策支持系统设计与实现[J].现代图书情报技术,2003,(2):29-33.