大数据赋能高校智慧图书馆建设的探索与实践
——以电子文献数据库科学采购和高质量服务为例

2022-06-15 10:03蒋国明
教育现代化 2022年7期
关键词:文献数据库效能数据库

蒋国明

(浙江理工大学 信息技术中心,浙江 杭州)

一 引言

教育部2021年3月印发的《教育部关于加强新时代教育管理信息化工作的通知》中指出:新时代教育管理信息化工作的总体要求是以习近平新时代中国特色社会主义思想为指导,深入贯彻党的十九大和十九届二中、三中、四中、五中全会精神,全面贯彻落实全国教育大会精神,深化教育领域“放管服”改革,以数据为驱动力,利用新一代信息技术提升教育管理数字化、网络化、智能化水平,推动教育决策由经验驱动向数据驱动转变、教育管理由单向管理向协同治理转变、教育服务由被动响应向主动服务转变,以信息化支撑教育治理体系和治理能力现代化[1]。《浙江省教育领域数字化改革工作方案》中提到:浙江省作为社会主义教育现代化先行省、示范区,将会综合运用数字化技术,对教育治理的体制机制等进行全方位系统性重塑,高效构建教育治理新模式,高水平推进教育治理现代化,同时要求在建设路径上提升主动服务、科学决策、高效协同等6项关键能力,加快推动决策从“经验”到“模型”的转变,在主要任务上也提出了构建数智驱动的教育治理新格局[2]。浙江理工大学对照国家教育部和省委省政府数字化改革总体要求,在学校“十四五”发展规划中,全面部署落实数字化改革工作,在智慧校园建设中聚焦智慧图书馆建设的探索与实践,本文开展的研究工作主要围绕智慧图书馆场景的建设展开。

二 智慧图书馆建设存在的问题及解决方案

在数字化改革推进过程中,学校图书馆和信息技术中心两部门协同工作,利用大数据赋能,着力优化电子文献数据库的科学采购决策和提升用户的使用体验,着重解决以下两个痛点和难点问题:

1.大数据赋能问题。缺少用户图书馆使用大数据,无法量化采购的电子文献数据库的资金绩效,无法用数据指导下一年度的采购决策。即使目前部分数据库服务商能提供用户的访问数据,也存在着数据提供不及时、不充分问题,或者只能提供对方规定的通用统计数据,无法灵活科学定制学校想要的数据,存在一定的“卡脖子”问题。

2.数据库使用体验问题。目前电子文献数据库服务商基本都是基于IP访问控制,存在着数据库服务厂商单IP连接限制、下载限速和访问黑名单等策略。校内师生容易出现恶意下载等问题,从而导致学校互联网出口IP被数据库服务商封锁、拉入黑名单,国外期刊访问网络速率不稳定等问题。

在此背景下,在图信融合视角下,图书馆和信息技术部门高效协同,探索与实践大数据赋能高校电子文献数据库科学采购和高质量服务。充分利用新一代信息技术,本文构建一种以“大数据赋能”和“高质量服务”为核心的高校智慧图书馆建设场景,精准对接用户需求,提升服务成效。并将研究成果在学校数字化改革过程中进行了探索与实践,实践证明该模式在提升管理效率、提高资金使用效能和提升用户使用体验等方面成效显著。

三 完善体制机制建设

在项目实践过程中,也遇到过部门之间的工作职责不清、配合不是很默契等情况,不过最终在反复沟通下,都很好地解决了问题。深刻体会到要把数字化改革向纵深推进,首先要完善体制机制建设,做好组织保障,有时候高效的沟通和协同可能比技术更重要。

(一) 组建工作专班

成立跨部门业务流程再造的常态化工作机制,抽调人员组建工作专班,由信息技术中心牵头系统方案的实施、电子文献数据库使用数据采集和大数据分析模型的构建。图书馆负责采购基础数据的汇集、资金使用效能数据的分析和下一年度电子文献数据库采购方案的决策。

(二) 完善工作机制

按照两部门协同工作的整体要求,定期召开例会,收集新需求,开展交流研讨,组织专家论证,开专题会解决问题等。联合组建全校图书信息工作服务QQ群、微信群用于平时发布通知公告和推送图书信息知识文案,提供师生服务的答疑和需求调研等。

(三) 加强业务协同

加强与省教育厅等上级主管部门的沟通,了解最新技术赋能数字化改革情况,加强与校外付费数据库服务商和互联网带宽通信运营商等沟通。广泛听取学校各部门、师生的意见与建议,不断提高服务质量。

四 技术支撑路径

(一) 大数据赋能科学采购

一般高校采购的电子文献数据库的访问和文献下载量数据主要依靠各数据库服务商以年度为单位的统计数据,数据具有不透明性和滞后性,而且是单个数据库的比较,难以提供整体的横向比较,数据信息往往是“碎片化”和“孤岛化”,不易于进行大数据分析和辅助决策。同时绝大部分高校每年采购文献数据库的预算资金都是有限制的,且市面上中国知网、Web of Science等优秀的数据库服务商又很多,往往面临着想买的数据库很多但是预算又不够的情况,也就是需要学校做好符合校情的科学采购决策。学校可在符合《中华人民共和国数据安全法》的规定下,促进数据依法合理有效利用,实施大数据战略,利用数据提升公共服务的智能化水平[3]。实施此部分的数据分析,需要对学校互联网出口网络流量的信息资源进行采集与保存,对内网用户文献数据库访问及下载行为进行数据建模分析。该项关键技术国家图书馆已实现突破[4],且国内厂商已有与之适配的成熟案例与配套系统[5],信息技术中心已部署了符合要求的合适设备系统,本文开展研究的配套基础设施条件已完全具备,具体实施路径如下:

1.在互联网出口部署“上网日志审计分析系统”,通过路由器将上网流量镜像给该系统,对出口网络全流量日志信息进行采集与保存,并在“图书资源”日志中自定义购买的电子文献数据库的URL匹配组。

2.对内网用户文献数据库(URL匹配组)的访问及下载行为日志进行数据建模分析,自主研究构建基于资金使用效能的电子文献数据库采购决策分析Optimal_Decision模型(资金使用效能可根据各付费数据库付费周期内的“访问次数÷采购的资金使用成本”等数值定义)。

3.学校在决策下一年度数据库采购方案时,可以通过分析模型不停地迭代分析历史数据,利用大数据赋能科学决策,提高资金使用效能,把资金真正用到实处。

(二) 决策分析模型仿真

出于数据安全考虑,取学校采购的其中30个数据库的某14天访问数据作为本次研究样本进行模型仿真(以下表格中的资金使用成本为非学校实际采购价格数据,是一组总成本赋值到1000个单位后的相对权重赋值处理后的数据)。仿真数据按照资金使用效能为关键字按降序排列的前10名数据库情况如表1所示,后10名数据库情况如表2所示。

表1 资金使用效能为关键字按降序排列的前10名数据库情况表

表2 资金使用效能为关键字按降序排列的后10名数据库情况表

通过对表1、表2的数据分析,可得出如下主要结论:

1.表1中,中国知网(CNKI)受众广泛、性价比最高,Web of Science数据库、ScienceDirect数据库师生使用较频繁,建议对表中前3名数据库重点保障;RSC数据库、读秀学术搜索、大为专利检索分析平台,资金使用效能较高、而成本较低,建议对表中4~6名数据库优先保障。

2.表2中,SciFinder数据库、MathSciNet数据库,资金使用效能较低、而成本较高,知领·全球科研项目库几乎很少使用,建议对表中28~30名数据库下一年度采购决策时重点论证等。

(三) 智能校园网出口优化

在校园网出口处基于应用层的网络流量清洗和快速响应的负载均衡策略,更好地优化基于域名的文件数据库的访问和突发网络拥塞问题,该网络架构如图1所示。

图1 智能校园网出口网络架构图

主要工作机制描述如下:

1.在校园网出口处部署基于应用层的“出口流量调度网关”,实现基于应用层的负载均衡,可对网站URL等进行精准匹配,可将电子文献数据库等重要域名引流到质量较好的互联网出口链路上。

2.将电子文献数据库域名做成一个动态检测网络性能的负载均衡组,然后根据ICMP、HTTP GET响应等检测反馈结果引导动态智能路由,提高访问速度。定期收集师生用户反馈的某些电子文献数据库访问体验不佳等信息,调整反馈域名的互联网出口选路,根据不同出口的响应时间选择合适的出口路由。

3.在出口流量控制系统上,设置单IP对数据库资源的持续访问最大连接数/下载数据量等的控制策略,有效规避因用户恶意下载等行为导致出口IP被数据库供应商拉入黑名单的风险。

五 改革突破与实践成效

(一) 改革突破

学校深入贯彻新发展理念,进一步深化构建“图书和信息不分家”的“图信融合”新发展格局。在图信融合视角下,信息技术中心与图书馆跨部门高效协同、紧密合作,在智慧校园建设过程中更注重集约高效的数字教育新基建建设,避免同质化的智慧图书馆建设模式,共同开展了大数据赋能智慧图书馆建设的探索与实践,实现了跨部门之间的制度重塑和协同工作,并以此推动建立健全图书馆电子文献数据库资源采购的制度体系。

(二) 实践成效

通过大数据赋能高校电子文献数据库科学采购,优化了电子文献数据库的采购决策,能更有效解决有限的经费预算与无限的采购需求之间的矛盾,提高资金使用效能,把资金真正用到实处。

利用信息技术中心的技术优势,优化了校园网的出口网络架构,提高了电子文献数据库的互联网访问速度,提升了用户使用体验,用户服务质量不断提高。自互联网出口优化后,校内师生对互联网电子文献数据库的访问体验提升反响强烈,对服务的满意度不断提升。

六 结语

高校电子文献数据库的购买是一项刚需、常规的工作,但是由于学校类型和强势学科的差异,校内师生对文献数据库的使用侧重点和需求差异性还是蛮大,不能照搬别的学校的采购目录,或者按照“经验”来决策采购的数据库清单。因此只要以某个高校为例,把相关的数据分析逻辑理清楚,构建一个通用的大数据分析模型,用数据赋能科学决策,就可推广到各个高校使用,案例具备推广的必要性。各个高校的互联网出口架构都大同小异,只需购置部分设备系统就可开展工作,本实践案例应用所需配套的基础设施条件已基本具备,案例具备推广的可行性。同时本案例成功实施后具有较好的经济效益和社会影响,案例具备推广的价值性。

数字化改革可选择“有突出成效”的案例试点突破,以标志性成果实现学校“数字化改革”进程中“以点带面”的示范引领效应,助力智慧校园建设,推动学校教育事业高质量发展。

猜你喜欢
文献数据库效能数据库
《感染、炎症、修复》杂志检索数据库
迁移探究 发挥效能
《感染、炎症、修复》杂志检索数据库
充分激发“以工代赈”的最大效能
论我国学术文献数据库的质量调控
数据库
数据库
中文文献数据库中撤销论文的分布规律研究
数据库
数据库