孔云 黄洛锋 资芸 郑磊 田春燕
摘 要 论文针对高校数字资源配置问题,首先设计了研究所需的多目标协同体系;然后设计了数字资源优化配置的多智能体决策框架,将多智能体的主体决策行为与遗传进化算子相结合,构建了多种约束条件下的数字资源智能优化配置模型;最后精选了昆明理工大学图书馆2018年部分数字资源数据进行了模拟实证分析。结果表明:模型能够合理地对研究对象的资源种类占比和类内数据库的配置数量进行多目标协同优化,资源配置的结构和质量得到了较为明显的改善,能够协调不同主体对数字资源的需求,并明显提高了数字资源多目标评价之间的协同水平。
关键词 数字资源;多智能体;遗传算法;优化配置;多目标协同
分类号 G258.6
DOI 10.16810/j.cnki.1672-514X.2022.06.003
Research on Multi Objective Collaborative Intelligent Optimal Allocation Model of Digital Resources in University Library
Kong Yun, Huang Luofeng, Zi Yun, Zheng Lei, Tian Chunyan
Abstract Aiming at the problem of digital resource allocation in universities, this paper first designs the multi-objective cooperation system needed for the research. Then, a multi-agent decision-making framework for the optimal allocation of digital resources is designed. The multi-agent decision-making behavior is combined with genetic evolution operator to construct the intelligent optimal allocation model of digital resources under various constraints. Finally, some digital resource data of Kunming University of Technology Library in 2018 are selected for simulation and empirical analysis. The results show that the model can reasonably carry out multi-objective collaborative optimization on the proportion of resource types of the research object and the allocation quantity of database within the class, the structure and quality of resource allocation have been significantly improved, the needs of different subjects for digital resources can be coordinated, and the collaborative level of multi-objective evaluation of digital resources has been significantly improved.
Keywords Digital resources. Multi-Agent. Genetic algorithm. Optimized allocation. Multi-objective collaboration.
高校图书馆作为大学的文献资源保障中心,是师生全面开展教学科研活动的基础性阵地和进行科技创新活动的重要平台。数字资源作为高校图书馆文献资源的重要组成部分,每年的采购金额、数量和种类都在显著的变化增长[1]。据2020年中国高校图书馆基本统计数据报告显示,2020年电子资源购置费占馆均文献资源购置费的56.8%(2019年是54.6%),均值与比例自2006年以来基本上呈抬升趋势,仅在2019年发生下滑,2020年便恢复上升,表明电子资源的需求相当强劲[2]。如何科学合理地进行数字资源的评估和决策,從而配置满足学校教学科研活动所需的各类数字资源,是高校图书馆决策层面临的重要课题。
1 研究现状分析
目前,针对数字资源的优化配置问题,已有学者从配置原则、评价指标体系和评价方法建模等角度开展了较为广泛的探索。研究普遍赞同数字资源的配置应该遵循整体性、优先性、协调性、以读者为中心等原则。评价指标体系是构建数字资源优化配置的基础,肖珑[3]等率先从数字资源内容、检索系统及功能、使用情况、资源的价值与成本核算、数据库商服务和存档六个维度建立了数字资源的一级评价指标体系,为后续学者[4-5]开展研究提供了具有参考价值的基础性模型;向林芳则从数字资源的投入和产出的角度,构建了数字资源投入产出绩效评价指标体系[6]。也有一些学者开展了将信息评价理论和优化模型应用于数字资源评价体系的研究,较典型的有层次分析法[7]、网络分析法[8]、系统动力学模型[9]、信息生态理论[10]等方法。但是,综观目前的研究现状,主要集中在指标体系的选择和合理性探索,并基于一定的评价指标体系开展数字资源的相关统计学指标的研究方面。从构建数字资源的多目标优化体系,采用智能算法融合决策主体的选择偏好,同时考虑政策法规、高校学科特色等边界约束条件建立智能优化模型,并对模拟优化结果进行评价的相关研究并不多见。
事实上,数字资源的优化配置问题可以看作是一种带边界约束条件的多目标协同优化配置问题[11]。即:针对某高校的当前及中远期发展目标和学科特色,考虑教育部等有关部门的政策规定红线及相关的教学科研评估指标,结合图书馆实际的采购经费和预算,兼顾学科专家、具有一定影响力的学者的建议,以及本硕博学生的实际需求等多种约束条件,从数字资源的种类分布及数量、数据库的成本与价值评估等方面建立多目标协同评价指标体系,然后建立系统性的科学优化模型,最后根据数字资源的评价指标数据进行模拟计算,获得数字资源的优化配置方案,最终为决策提供科学合理的指导依据。
研究表明,采用智能算法建立模拟优化模型是当前解决多目标优化问题的主要方法[12]。智能优化模型(如多智能体系统)采用自下而上的策略,能够从局部上模拟多种数字资源利用主体的决策过程;而遗传算法则采用自上而下的策略,能够从优化目标的整体利益出发,获得一系列Pareto最优解[13]。为此,本文拟在遗传算法中引入多智能体决策主体,从而建立基于遗传算法和多智能体系统的图书馆数字资源多目标协同优化配置模型,并开展模拟实证研究工作。
2 基于多智能体遗传算法的数字资源优化配置模型
基于多智能体系统与遗传算法的数字资源优化配置模型框架如图1所示,多智能体系统用来模拟参与数字资源规划与采购的决策主体,遗传算法在多智能体的辅助下计算得到Pareto最优的数字资源配置方案。
算法采用二维编码来表征数字资源,染色体对应数字资源配置方案,基因表征一个个具体的数据库系统。遗传算法为多智能体系统的决策提供了计算结果,染色体表征的数据库系统通过多目标协同体系和多种约束条件获得综合分析评价结果,它们被数字资源规划多智能体分析与感知。多智能体系统中主体的意见及决策行为也影响着染色体,两者之间形成相互作用关系。多智能体通过数字资源规划来初始化染色体,其决策行为作用于遗传优化配置算子中,以优化数字资源配置方案;多智能体的目标与约束构成了模型的目标体系与约束体系,并转化为遗传算法的适应度函数,以指导算法生成最优的数字资源配置方案,实现数字资源在资源种类及数量、检索系统功能、数字资源成本与价值、数据库商服务质量、数字资源综合收益等多目标协同下的Pareto最优配置方案。
2.1 数字资源规划多智能体
根据数字资源规划及采购的基本流程,将数字资源规划决策的主体分为图书馆、数据库商、读者三种类型的Agent。
2.1.1 圖书馆Agent
图书馆Agent获取数据库商及读者Agent的请求与反馈,并采用公式(1)协调其冲突。
(1)
公式(1)中,Ct(i,j)表示单元(i,j)上t类电子数据库的竞争度,Ud(i,j,t)与Up(i,j,t)分别表示t类电子数据库对数据库商Agent和读者Agent的效用函数,表示读者参与度[0,1],读者参与度越高的数据库其竞争力越强。当数据库商Agent或读者Agent的效用函数值越大,则图书馆Agent采购t类数字资源中的数据库(i,j)的概率就会越大,以体现图书馆充分考虑数据库商和读者的意愿。模型通过对竞争度的调整来模拟该过程,以实现多智能体间的反馈作用。
(2)
公式(2)中,表示调整后的竞争度,是数据库商对数据库(i,j,t)的推销次数,是每次推销时增加的竞争度大小;是读者对数据库(i,j,t)的推荐次数,是每次推荐时增加的竞争度大小。
2.1.2 数据库商Agent
数据库商Agent代理或销售各种电子数据库,他们向图书馆Agent推销各种数字资源,在图书馆Agent的统一协调下,以各种方式向读者进行宣传,形成竞争性推销。研究采用随机动态模型及离散选择模型来模拟数据库商Agent之间的竞争行为,针对某类资源t选择数据库商Agent推销的电子数据库(i,j)的概率表述为公式(3)。
公式(3)中,Rneigh表示针对t类资源参加竞争的数据库的数量,Sijt表示t类资源中数字资源(i,j)的适宜度(竞争力)。
2.1.3 读者Agent
读者Agent包括专职教师、高校在读学生和其他读者,他们是数字资源的主要使用群体,根据自己的需要、喜好等向图书馆Agent推荐每种数字资源。读者Agent推荐每种数字资源的行为采用随机动态模型及离散选择模型进行模拟,t类资源中数字资源(i,j)被读者推荐的概率选择公式为:
公式(4)中,Qijt表示读者针对t类资源电子数据库(i,j)的接受程度。
2.2 数字资源优化配置多目标体系
模型在前期及前人的研究基础上设计了每个电子数据库或平台的5类目标评价函数。
(1)数字资源种类及数量评价。此目标函数主要提取资源收录总体情况、资源收录时限范围、资源收录地域范围、本校学科覆盖率、权威出版物收录情况、全文收录情况、资源更新频率等二级指标进行计算评价。
(2)资源检索系统功能评价。此目标函数主要提取系统检索方式、检索技术、检索效果、检索速度、系统稳定性、界面友好性、系统可扩展性、并发用户和后台统计功能等二级指标进行计算评价。
(3)资源的成本与价值评价。此目标函数主要提取数字资源价格、价格上涨幅度、认证成本、检索成本、全文下载成本、软硬件投入成本、系统更新成本等二级指标进行计算评价。
(4)数据库商服务质量评价。此目标函数主要提取资源传递方式、资源使用期限、访问权限、使用统计报告、宣传培训服务、故障排除速度、客户访问等二级指标进行计算评价。
(5)数字资源使用效果评价。此目标函数主要提取电子数据库产生的读者系统登录次数、资源检索次数、人均使用次数、人均全文下载量等二级指标进行计算评价。
由此产生数字资源综合评价的目标函数计算公式F为:
(5)
公式(5)中,表示数字资源种类及数量评价函数,依次到表示数字资源使用评价函数,
表示的权重系数,且。
2.3 数字资源优化配置约束体系
高校数字资源的采购、配置、优化受到多种条件的约束,主要包括教育部的宏观政策红线及学科评估指标、学校预算及实际采购经费控制、学校学科配置及重点学科分布、学校类型及办学特色等方面。数字资源的约束体系对资源的多目标评价函数既有宏观的指导作用,又形成微观上的控制效果。
2.4 模型优化配置操作
模型的优化配置操作步骤如图2所示。首先,数据库商Agent与读者Agent对当前数字资源配置现状及优化方案进行观察分析,根据随机效用模型与离散选择模型进行资源配置优化建议,并向图书馆Agent提出具体的建议。图书馆Agent根据规划,依据竞争度函数协调和更新电子数据库的竞争度。根据遗传算法的特点,模型设计了选择、交叉、变异3类智能体遗传优化配置算子,实现配置方案的优化。模型依据数字资源优化目标评价体系和约束体系对新一代的配置方案进行评价,重复以上过程进行迭代计算直到满足程序终止的条件,最后输出一系列数字资源配置的Pareto最优方案集。
其中,模型采用二级智能选择算子,一级选择算子在染色体种群完成交叉及变异后,利用轮盘赌准则筛选出适应度较高的染色体作为下一代交叉,二级选择算法则对比交叉或变异前后的染色体,只保留更优的染色体,用以提高算法的搜索效率。智能交叉算子主要用于调整数据库商Agent及读者Agent与当前数字资源配置方案之间的矛盾,避免出现电子数据库选择与当前图书馆数字资源规划之间的矛盾。智能变异算子主要解决同类资源下功能相似的电子数据库之间的冲突,采用竞争度函数构建电子数据库选择概率函数,使用轮盘赌方法解决竞争冲突,如公式(6)所示:
3 模型模拟实验设计
模拟实验以昆明理工大学学科发展现状和图书馆2018年的数字资源采购数据为基础,设计开展验证模型可行性和有用性所需的电子数据库数据、多目标计算指标和多种约束体系。
3.1 实证模拟研究对象概况及定义
随着国家一流大学建设和一流学科培育发展战略的提出,昆明理工大学在发展目标、发展层次、办学规模和学科优化等方面不断寻求创新和突破,客观上促使图书馆数字资源的采购经费不断攀升,数字资源种类不断丰富,采购体量不断扩大。学校发展目标的调整和学科优胜劣汰的动态更迭,使得图书馆进行数字资源配置的更新、优化等工作更为紧迫,同时具有更强烈的现实意义。
昆明理工大学图书馆目前共有各类电子数据库150多个,学科范围涵盖社会科学、人文艺术、自然科学、工程技术各个方面,形成了以理工为特色的多学科、多层次、多类型的专业文献资源体系。根据2018年的采购资料,将数字资源分为中文期刊全文数据库、外文期刊全文数据库、中外文电子图书数据库、检索工具数据库、中外文学位论文数据库、发现系统平台、多媒体资源数据库、其它中外文综合数据库等8类资源。由于数字资源的优化配置受采购经费、资源类别配置比例等多条件约束,为了统筹考虑多个评价指标的多目标协同优化问题,本研究在模拟实验中将上述每一类数字资源可采购的电子数据库个数定义为无穷大。
3.2 多目标计算指标设计
实验依据2.2设计的多目标协同体系,根据计算指标的代表性和可获得性原则,设计了26个计算指标以反映每个电子数据库的多目标协同综合价值。根据指标性质分类,由11个定性指标和15个定量指标构成。考虑到数字资源的多目标评价是一种人为的主观判断,主观赋权法具有其科学合理性,其实用性要强于客观赋权法[4,7],故本文采用AHP法确定准则层及各指标层的权重。计算过程采用层次分析法辅助软件YAAHP(v10.0),其计算结果见表1。
3.3 多目标约束体系设计
根据决策的实际情况,在进行数字资源采购时,会受到多种条件的约束,归纳起来可以分为定性和定量两种约束条件。典型的定量条件包括學校当年的采购经费预算,通常是设置采购经费的最大预算值,以及根据学校学科发展、学科评估、兼顾各类读者的不同需求和科学研究的需要,每一类数字资源的采购数量会设置一定的阈值,通常设置资源类型采购个数的最小阈值,如表2所示。典型的定性条件包括决策主体的选择偏好、教育部等有关部门规定的政策红线形成的白名单列表,白名单是指必须纳入当年的采购计划中的数据库或系统平台。
3.4 数据来源及标准化处理
实验精选昆明理工大学图书馆2018年数字资源部分相关数据。为了研究的需要,图书馆已采购的资源和使用数据,均来自当年的统计数据;图书馆没有购买的数据库,来自数据库商提供的国内同一水平三个高校图书馆的综合参考数据。为了规避可能的风险,在不影响研究效果的前提下,所有数据均做了一定的加工处理。
由于评价指标代表的内涵不一,对26个评价指标数据进行无量纲化处理,即将所有指标都转化为区间为[0,1]中的某个数值。研究涉及的定量指标由统计数据获得,定性指标采用Bipolar区间尺度的10点标度法赋值[8]。本文采用极差化方法实现各评价指标数据的无量纲化处理。其中,效益型指标和成本型指标的计算方法分别为公式(7)和公式(8):
公式(7)和公式(8)中,为某个数据库第i项指标的无量纲化值,为某数据库第i项指标的原始数据值,和分别为所有候选电子数据库中第i项指标的原始数据的最大和最小值。效益型指标采用式(7),指标值越大表明评价结果越好,成本型指标采用式(8),指标值越小表明评价结果越好。
4 模拟优化结果与分析
4.1 实验方法及参数设置
利用第2节设计的模拟数据集、多目标计算指标、多目标约束体系,对各种指标数据进行标准化处理后,用第1节设计的智能优化模型和算法对数字资源配置进行多目标协同优化配置模拟试验。智能算法采用安徽大学生物智能与知识发现研究所开发的进化多目标优化平台PlatEMO-3.1中的NSGA-III算法[14],其中,算法的种群大小为100,迭代次数为60,变异率为0.03,交叉率为0.1。根据情况,为不同主体设置不同的优势度:图书馆Agent为1,数据库商Agent为0.7,读者Agent为0.8。竞争度增加值由专家法进行确定(数据库商Agent 0.2,读者Agent 0.2)。算法根据表1中各电子数据库的评价指标和多目标评价计算公式(5)得到每个参与竞争的数据库的综合评价值,设定评分结果集合T={差,中,良,优}={[0,0.6),[0.6,0.7),[0.7,0.85),[0.85,1.0]}为评价依据,并淘汰综合评价结果为差的电子数据库。多目标优化配置结果采用Pareto非支配解的概念来比较不同优化结果的差异,随着算法迭代次数的增加,非支配解的各目标值逐渐提升并收敛。实验选取1个具有代表性的Pareto非支配解进行优化配置前和优化后的结果比较与分析。
4.2 优化结果分析
4.2.1 总体情况分析
根据优化配置统计结果,优化后各类数字资源的数量和金额统计变化如表3所示:从数字资源数量配比来看,学位论文数据库、发现系统平台、多媒体资源数据库的数量保持不变,中文期刊全文数据库和电子图书数据库各减少1个,外文期刊全文数据库减少4个,其它综合类数据库减少5个,而检索工具类数据库增加了3个;从采购经费变化来看,数字资源采购总金额从优化前的10 272 674元降为优化后的9 935 273元,一共减少337 401元。
4.2.2 数据库质量变化分析
深入分析数据库的具体变化情况发现,数据库保留与出局取决于数据库本身的多目标评价情况,多目标评价结果为优和良的优质数据库基本都能得到保留,如CNKI期刊全文数据库、CNKI博硕学位论文库、Elsevier SD、Springer Link期刊、中华数字书苑电子书、国研网数据库、SCI(科学引文索引)、Ei(工程索引)、超星发现系统、爱迪科森就业库等数据库;评价结果为中的数据库则成为优化配置的主要对象,保留或替换取决于主体偏好、经费、政策等一些边界条件,如读览天下、西班牙建筑库、万方学位论文数据库、E线图情,其中受政策影响最为显著的是检索工具类数据库ESI和InCites,为了适应教育部学科评估和双一流学科建设的需要,为了便于掌握学校的学科发展和挖掘具有发展潜力的学科,需要配置服务于双一流发展所需的检索工具;为了学校培育、发展、巩固一流学科而必须购买的一些资源则被加入白名单中,如生物医学会数据库SinoMed、Springer Material、ACS美国化学学会数据库;而多目标评价结果为差的数据库基本会在优化配置过程中遭到淘汰,如Cambridge Journals、OSA美国光学知识数据库、ASTM期刊及标准库、PQDT学位论文库。
4.2.3 资源结构变化分析
从构成数字资源配置的8类资源整体结构来看,外文期刊全文数据库不论是资源配置采购数量,还是采购经费数额,均牢牢占据第一的位置,如表3所示,数量分别是优化前的24个和优化后的20个,占所有资源总数的30%多,采购经费则占数字资源整体经费的60%左右;资源数量和采购经费占比最小的是发现系统类平台,优化前后都是2个平台,占所有资源总数的3%左右,采购经费只占整体经费的2%;最为稳定的是中文期刊全文数据库和多媒体资源类数据库,不论是采购数量和采购经费,甚至是类内数据库构成,基本保持不变;变化最为显著的是检索工具类数据库,受政策和学校发展规划的影响,检索类数据库资源增加了3个,采购经费增加了295 587元。从优化效果来看,所有类型的资源都有不同程度的优化,其中较为明显的是外文期刊全文数据库和其它综合类数据库,从表3可以看出,优化后,外文期刊库减少了4个,其它综合类数据库减少了5个,采购经费则分别节约了345 028元和150 533元,分析每个数据库的多目标评价结果发现,这些数据库存在读者使用量小、学科发展贡献小等问题,导致在多目标评价时等级为差,最终被淘汰出局。
5 结论
研究建立了基于多智能体系统和遗传算法的数字资源优化配置模型,并选取昆明理工大学图书馆的部分数字资源设计和开展优化过程的模拟。实验结果表明,本文设计的模型能够合理地兼顾数字资源的种类结构和电子数据库质量之间的平衡,优化后的数字资源配置方案具有明显的合理性和科学性。尽管如此,模型在设计问题的多目标体系、指标选取等方面仍有广泛的探索空间,各高校图书馆应该根据本校资源规划特点,设计具有特色的指标体系和评价权重;同时,研究在获取评价指标数据的完整性、全面性等方面具有一定的难度。
參考文献:
戴建陆,冯晓丽,张岚.高校图书馆数字资源绩效评价指标选择[J].四川图书馆学报,2018(6):24-27.
吴汉华,王波.2020年中国高校图书馆基本统计数据报告[J].大学图书馆学报,2021,39(4):5-11.
肖珑,张宇红.电子资源评价指标体系的建立初探[J].大学图书馆学报,2002(3):35-42,91.
张晓静,郭伟.图书馆电子资源的评价:指标及方法[J].长春大学学报,2007(11):155-158.
刘爽.高校图书馆电子资源评价指标体系构建[J].图书馆理论与实践,2014(10):60-63.
向林芳.高校图书馆电子资源投入产出绩效评价体系构建[J].图书馆建设,2010(10):94-97.
贺梅萍.图书馆数字资源评价指标权重赋值方法概述[J].现代情报,2016,36(10):68-73.
蒲筱哥,乔亚铭,胡亚敏.基于网络分析法的高校图书馆电子资源服务绩效评价模型及实证研究[J].大学图书馆学报,2014,32(4):41-49.
楼雯,房小可.基于系统动力学的高校图书馆信息资源配置研究[J].图书馆论坛,2014,34(7):21-27,38.
吴绮云.信息生态理论视域下数字图书馆馆藏资源优化配置研究[J].农业图书情报学刊,2018,30(9):38-41.
公茂果,焦李成,杨咚咚,等.进化多目标优化算法研究[J].软件学报,2009,20(2):271-289.
刘建昌,李飞,王洪海,等.进化高维多目标优化算法研究综述[J].控制与决策,2018,33(5):879-887.
袁满,刘耀林.基于多智能体遗传算法的土地利用优化配置[J].农业工程学报,2014(1):191-199.
安徽大学生物智能与知识发现(BIMK)研究所.platEMO进化多目标优化平台(V-3.1)[EB/OL].[2021-03-20].https://github.com/BIMK/PlatEMO.
孔 云 昆明理工大学图书馆副研究馆员。 云南昆明,650500。
黄洛锋 昆明理工大学档案馆馆员,云南大学历史与档案学院2015级博士研究生。 云南昆明,650500。
资 芸 昆明理工大学图书馆资源与技术服务部主任,副研究馆员。 云南昆明,650500。
郑 磊 昆明理工大学图书馆馆员。 云南昆明,650500。
田春燕 昆明理工大学图书馆馆员。 云南昆明,650500。
(收稿日期:2021-06-23 编校:谢艳秋,曹晓文)