漆月 石璐
(1. 西南大学图书馆,重庆 400715;2. 上海诺基亚贝尔股份有限公司,北京 100020)
信息化时代逐渐改变着人们的学习和工作环境,为满足当代读者的数字阅读习惯,图书馆的服务重心也逐渐向电子化方向偏移。有研究表明,高校图书馆用于电子资源购置的经费投入正在逐年增多,并且已经超过纸质资源的经费配置[1]。但由于有限的预算以及电子资源的种类增多和价格上涨,图书馆不可能无限制地购买新资源,甚至需要在已订阅的电子资源中作出取舍。因此,图书馆馆员如何正确地决定购买、更换电子资源,已成为值得深入探讨的话题。图书馆需要一种科学客观的决策手段,在预算范围内建设满足本馆读者阅读需求、符合学校战略发展的电子馆藏资源。
预算限制和通货膨胀一直是大多数图书馆在电子资源采购中面临的主要问题[2],从20世纪90年代起,图书馆开始关注电子资源的开发和利用[3],并针对其建设政策、采购模式等进行了广泛讨论。2004年国际图书馆协会联合会在其报告中指出,在传统的馆藏建设政策以外,图书馆还应当为电子资源采购制定明确的策略和流程,从而保证资源建设质量[4]。
集团采购是目前被讨论最多的采购模式。1999年中国高等教育文献保障系统第一次组织联合购买集团采购了EIVillage数据库,之后2010年高校图书馆数字资源采购联盟正式成立,使集团采购得到进一步推广。尽管集团采购能够有效降低成本、减少风险,但不能为图书馆在采购过程中的预算分配提供决策支持。
目前,图书馆馆员采购电子资源的依据通常可以分为5个方面:①通过一个较长周期的试用结果评估产品的价值;②通过用户调查了解读者对产品的反馈;③根据所在机构制定的采购政策或标准;④依据以往的购买经验;⑤参考其他图书馆的选择[5-7]。可以看出多数情况下决策过程依赖于决策者的主观判断,并存在不确定性。馆藏建设应当基于有意义的数据,进行科学、合理的系统规划,而不是图书馆馆员的个人选择[8],因此也有一些学者提出了各种电子资源采购的模型化方案。如赵文嘉[9]提出了一种基于灰色理论的电子资源采购模型,利用灰色白化函数与灰色关联函数分别对定性指标与定量指标进行处理,从而得到电子数据资源采购综合评价值。曾永杰[10]构建了一种线性配置模型来优化图书馆的电子资源采购资金配置,从宏观和微观两个层面对数据库的采购和续订进行科学决策。张银玲[11]针对试用数据库采购提出了一种量化分析方法,通过不同类型的读者推荐权重对试用电子资源进行评价,并依据评分结果选择最符合读者需求的资源。这些方法虽然能够帮助图书馆从若干供应商中选择更好的一个,或合理地决策某一数据库是否被采购,但不能解决面对市场上多种多样的电子资源平台,图书馆如何利用有限的经费进行全局规划的问题。因此,本文提出了一种面向电子资源采购选择的决策支持系统,通过综合评价指标确保评价过程的客观性,并利用动态规划技术获得最优资源组合方案,从而提升采购工作的质量和效率,优化馆藏资源结构。
目前我国高校图书馆主要以数据库订阅的形式引进电子资源,即通过集成数据库对电子期刊、电子书等资源进行打包采购[12]。本文研究的电子资源也是指这类数据库,而非单个的电子书或电子期刊。
本文的总体思路是,首先根据特定图书馆的客观情况,制定一套面向电子资源的评价指标体系,从资源内容、资源质量、资源服务等方面对每一个资源数据库进行评分,然后利用动态规划技术根据资源的评分结果进行筛选,最终得到总分最高的资源配置方案,决策支持模型如图1所示。
图1 采购决策支持模型示意
动态规划作为运筹学的一个分支,是一种求解多阶段决策问题的优化方法,最早由美国数学家Bellman等创立[13],目前已经在资源分配、工业控制、人工智能等多个领域得到了广泛应用。动态规划是一种多阶段决策过程,它遵循“最优性原理”,即“在最优决策的任意阶段上,无论过去的状态和决策如何,对当前状态而言,余下的决策也必须为最优子策略”[14]。因此,可以把要处理的最优化问题转化为若干有序且相关的子问题,如果每个子问题的解对全局都是最优的,那么总的决策就是最优的。
图2是一个N级多阶段决策过程的示意图,每个方框表示一个阶段的子过程,s(k)表示在第k阶段子过程完成决策d(k-1)后得到的最优状态。由图可知,子过程k的状态s(k)取决于s(k-1)与d(k-1),也就是受前面k-1个阶段的决策d(0),d(1),…,d(k-1)所影响,而与k阶段以后的决策无关,这种特性被称为无后效性[15]。同时,根据最优性原理,无论阶段k之前的决策如何,其后的决策d(k)…d(N-1)对于一个初始状态为s(k)的过程来说也必定是一个最优决策。
图2 多阶段决策过程示意
动态规划的决策过程正是利用以上特性,从最后一个阶段开始进行最优决策,逐步倒推到最初阶段。在假设状态s(N-1)已知的情况下,计算出使阶段N达到最优状态s(N)的决策d(N-1)是相对容易的。在确定d(N-1)后,再假设s(N-2)已知去计算决策d(N-2),以此类推,最终计算出全部决策结果。这种倒序算法通过递推关系记录了前一个子过程的决策结果,避免了穷举法中的重复计算,因此有效降低了算法的时间和空间复杂度。
动态规划通常用于求解最优化问题,这类问题可以有很多可行解,并且每个解都有一个对应的状态值,而动态规划的方法能够找出使状态值达到最优的一个可行解,也称为该问题的一个最优解。在本文研究的电子资源采购决策问题中,要决策的问题是从若干数据库中选择一部分进行采购,每一种选择方案作为问题的一个解,其状态值就是被选数据库的评分之和,而决策目标是找到使所选数据库评分之和达到最高的选择方案。
本文设计的决策支持模型通过输入所有可选择采购的资源数据库,输出基于动态规划算法得出的最优选择方案。设总共有n个数据库,任一数据库Di的评价得分是vi,数据库购买价格为pi,图书馆的采购总预算为C,则计算目标可以看作寻找一个n元向量X(x1,x2,…,xn),见公式(1)。
当xi=1时,表示数据库Di被选择,反之xi=0表示不选择该库。决策支持模型需要在所有X的可能取值中,找到使被选数据库评分之和最高,同时总价格不超过预算的向量值。根据动态规划的无后效性原理,若已完成前k-1个数据库的最优决策后,剩余的预算为Cj,此时仅需对数据库Dk,Dk+1,…,Dn进行决策,而无须考虑前k-1个数据库的选择情况,则该决策过程应满足关系式(2)。
设(2)式的一个最优解为f(i,Cj),即f(i,Cj)为完成Dk到Dn的决策后得到的最高总评分。
对于任意数据库Di的决策结果都应有两种情况。①没有采购Di,则剩余预算仍为Cj,决策得到的数据库评价总分不变;②采购了Di,则剩余预算为Cj-pi,评价总分增加vi。
而是否采购Di,取决于剩余预算是否足够支付Di的价格,以及在Di以外是否有更好的选择。基于动态规划的最优性原理,由此可以建立计算f(i,Cj)的递推式(3)。
当i=n时为递推式的初始状态,此时需要决策的数据库为Dn,见公式(4)。
根据动态规划的特性,递推式得出的是向量X的其中一个最优解,但不是唯一解。在实际操作中,图书馆可以先将已经决定购买的一个或几个数据库作为系统的初始状态,再利用决策支持模型计算出向量X的剩余元素,从而得到使资源评分之和最高的数据库采购策略。
本文以西南大学图书馆2019年的数据库采购信息为实验对象,验证决策支持模型的有效性。该图书馆的数据库采购方式通常分为每年续订、隔数年续订和直接买断3种形式,在2019年需要考虑续订的数据库有86个,另外试用期到期数据库有11个,因此图书馆需要对97个数据库进行采购决策。本文的实验方法是,首先对数据库在2018年的使用情况进行评分,并作为决策支持模型的输入,基于动态规划技术得出2019年图书馆数据库的采购决策方案,并与图书馆在2019年实际的人工决策方案进行比较,以验证模型的可行性和优化效果。
合理的评价指标是决策有效性的前提,但任何评价指标都不可能完全适用于每一种场景,每个图书馆都应当根据自身情况制定具有一定个性化的电子资源评价方案,以确保馆藏的可用性。很多学者已经为电子资源开发了合适的评价模型[16-17],因此本文参考了目前较成熟的电子资源评价体系,并借鉴各专家学者常用的评价指标研究方法,利用德尔菲法筛选出适用于西南大学图书馆的评价指标及其权重。
本文采集了目前国际上已发布的一些图书馆评价体系,如《信息和文献 图书馆绩效指标标准》(ISO 11620:2014)、《规范电子资源使用统计报告数据处理5》、《欧盟数字图书馆服务绩效指标项目》、《高校图书馆标准》等,以及一些国内针对电子资源评价指标的研究成果,提取其中针对电子资源的评价标准进行深入研究比较,并根据本校图书馆的实际情况,形成电子资源采购评价指标的初稿。在初稿中,将评价体系划分为3个大类,总共20个评价指标,并对每一种指标的计算或评价方法进行说明。然后邀请相关领域专家及图书馆工作人员共10名成员组成德尔菲专家小组,通过3轮征询对初稿的评价指标进行审议。评审过程采取定量与定性相结合的方法,首先由专家小组采用李克特量表[18]对指标的重要性进行5级评分,同时允许每位成员对评价指标提出建议和修改意见。组织者删除了前两轮中重要性平均分低于3的3项指标,并修改了2项指标的描述。然后专家小组根据自己的经验判断为修订后的指标分配权重,再由组织者计算出每项指标的最终权重。完成评议后,最终得到3个分类下的16项评价指标(见表1)。
表1 数据库评价指标体系
评价体系采用百分制,评价内容划分为使用成本、资源质量和资源有效性三大类。其中资源有效性占比最大,超过了总分的一半,表明图书馆更加关注电子资源的使用绩效。而使用成本所占的比重相对更少,表明虽然不得不考虑经济因素,但图书馆仍然希望优先选择更符合读者和学校发展需求的资源。
本文的目标是构建一套自动化的采购决策支持系统,在评价指标体系建立后,仍需为每个指标设定一个评分规则,这样当用户导入评价指标所需数据后,系统能够自动计算出每个数据库的综合得分。本文采取的评分方法是,将所有待选数据库每一条指标得出的数据进行排序,再对排序号作归一化处理,某一数据库的排序号乘以该指标的权重,即为该数据库在该指标的得分,计算方法见公式(5)。
其中,Di表示第i个待选数据库,N为数据库总数,nij为该数据库第j条指标的数据排名,Cj为第j条指标的权重。这里的排名方式需要根据指标具体情况确定,例如第一条指标“单次下载成本”应当按照数据从大到小的顺序排名,即成本越小排名得数越高,而“人均下载量”则应按相反方式排序,即下载量越大排名得数越高。
在图书馆2019年的实际操作中,采用了传统的专家评审模式进行采购决策,由图书馆采购负责人员以及高职称馆员根据前一年的使用统计对数据库进行审议,决定下一年度的采购方案。在本年度的采购研讨会中,讨论决定停订数据库7个,新购数据库2个,即人工选择采购数据库为92个,根据评价指标所有数据库的总得分为6979.87分。
本文在apache+php环境下编码实现决策支持模式的原型系统,通过浏览器导入待选择的97个数据库相关信息,并输入图书馆的年度总预算。系统根据评分公式对每个数据库打分,再基于评分进行动态规划决策,最终推荐购买数据库93个,其评分之和为7284.33(评分保留2位小数),系统输出结果如图3所示。
图3 采购决策原型系统运行结果
出于对图书馆与数据库商的隐私保护,本文没有列出评分所用的具体数据和待选数据库名称,但从总得分情况可看出,决策支持系统提供的方案能够在相同预算下使图书馆的电子资源结构得到更高评分。
本文研究了一种基于动态规划技术的电子资源采购决策支持模型,以帮助图书馆馆员选择更合理的预算分配方案。首先设定一个评价指标体系为每一种数据库进行评分,再利用动态规划算法选择评分最高的组合方案。模型的输出结果能够为图书馆馆员的采购决策提供一定参考,使图书馆采购人员的决策过程更具客观性和科学性。需要注意的是,采用的评价指标体系将直接影响模型输出结果的有效性,由于不是本次研究的重点,本文仅根据常见策略实践了一种评价指标的建立方法,并没有详细论证该指标体系的准确性,在今后的研究中可以继续探讨评价体系的构建方案,进一步提升模型的输出质量。