基于业务数据的高校图书馆决策支持系统设计

2012-08-17 06:32龚德昱
中国现代教育装备 2012年23期
关键词:决策支持系统数据仓库馆藏

陈 骁 连 锲 黄 煜 龚德昱

上海财经大学图书馆 上海 200433

在开放的信息社会中,图书馆面对的内外部环境越来越复杂,图书馆管理者需要为决策耗费大量的时间和精力。一方面图书馆需要与更多的组织和机构发生关系(如数据库厂商、书商、外包业务承包商等第三方机构),图书馆管理者所面临的决策的数量和复杂性都是前所未有的。另一方面,由于管理信息系统的广泛应用,图书馆每天都会产生大量的数据,而这些数据往往缺少整理和分析,不仅不能给决策提供帮助,反而会给图书馆管理者带来困扰。因此,有必要设计一个系统,能对相关数据和信息进行加工、处理和分析,能随时向管理者提供决策所需的有用信息,节省管理者的时间和精力,提高决策效率。

决策支持系统(Decision Support System,简称DSS)是辅助决策者通过数据、模型和知识,以人机交互方式进行半结构化或非结构化决策的计算机应用系统。它为决策者提供分析问题、建立模型、模拟决策过程和方案的环境,调用各种信息资源和分析工具,帮助决策者提高决策水平和质量。现在决策支持系统应用比较广泛,如在组织运营管理、工业处理、证券投资组合、军队管理和医疗诊断等方面都有大量应用[1]。决策支持系统在图书馆中也开始有所应用,国外主要集中在文献采访[2]、经费预算[3]等方面,我国图书情报界研究较少,主要集中在图书馆管理[4]、图书采访[5]和科技情报[6]等方面。

1 图书馆决策支持系统的功能设计

在日常决策中引入决策支持系统,能够辅助管理者快速、准确地做出决策。基于业务数据的高校图书馆决策支持系统应该包括如下功能:

1.1 收集和管理组织内部信息

图书馆决策支持系统需要收集、管理并随时提供与决策问题有关的图书馆内部信息,以便管理者能够快速、准确地知道图书馆目前的状况。图书馆内部信息主要包括:馆藏信息、资源利用信息、服务信息和业务信息等。

1.2 收集和管理组织外部信息

图书馆决策支持系统需要收集、管理并提供与决策问题有关的外部信息包括:国家、教育部的政策法规,本校相关规定,本校重点学科和专业设置,出版市场行情,同行动态等。

1.3 收集和管理反馈信息

图书馆决策支持系统需要收集、管理并提供各项决策方案执行情况的反馈信息,为决策的及时调整或以后的决策提供参考经验,如订单或合同执行进程、学科服务的反馈情况、图书馆新服务的反馈情况等。

1.4 分析和预测

图书馆决策支持系统应能设置和管理与决策问题有关的各种模型,使系统中的数据、模型与方法能够很容易地被修改和添加,能灵活运用模型与方法对数据进行加工、汇总、分析、预测,得出所需的综合信息与预测信息。

1.5 具备良好的人机会话和输出功能

图书馆决策支持系统必须具有良好的人机会话功能,方便用户输入数据和随机查询,同时也需要有强大的图表输出功能,方便决策者阅读和利用。此外,决策支持系统应能提供良好的数据通信功能,以保证及时收集所需数据,并将结果传送给用户。

2 系统总体设计

2.1 系统的体系结构

图书馆决策支持系统包含数据源、数据存储与管理、联机分析处理(OLAP)服务、决策支持应用4个部分。数据源是整个业务系统的数据基础;数据存储与管理是在现有数据源的基础上,对数据进行抽取(Extract)、转换和清洗(Transform)、装载(Load),并有效集成操作(即ETL处理),按照主题进行重新组织,构建数据仓库[7];OLAP是按照多维数据模型进行再次重组,以支持用户多角度、多层次的分析;决策支持应用是BI系统,实现报表、分析、图表、数据集成、数据挖掘等。总体结构如图1所示。

图1 决策支持系统的体系结构

数据集市是按图书馆统计的主题,在数据仓库中对数据进行抽取组合,囊括了某个主题所有统计指标涉及元数据。数据统计的规则构成了OLAP,是对数据集市内数据进行统计分析的方法库。

2.2 系统的功能框架

2.2.1 数据模型构建子系统

数据模型构建子系统包含模型构建、语法检查、模型转换等功能模块。其中模型构建模块就是根据客户的需要构建对应的多维数据概念模型。语法检查模块就是根据所描述的建模规则对所构建的多维数据概念进行检查,若语法不正确,则给出相应的提示信息,告知用户进行调整。模型转换模块主要是便于模型的匹配与映射以及元数据的生成,将图形化的多维数据概念模型转换为对应的XML文档描述形式[8]。

2.2.2 元数据管理子系统

元数据管理子系统向下提供对各数据源的元数据抽取功能,向上为模型匹配与映射、录入等提供元数据访问接口,对内提供元数据的标准化、存储功能。

(1)元数据录入功能

对各数据源进行分类,对来源清楚、数据格式固定的元数据实施定期自动收割入库。对不能自动收割数据,系统设计入口,供各业务人员定期将数据录入。录入功能的运行模式可采用C/S模式,其依据是业务人员工作地点固定,采用C/S模式可降低系统的开发难度,提高信息安全性。

(2)异构元数据标准化功能

需要规定统一的元数据格式,对不符合要求的数据进行转换,如将图书馆中自动化管理系统与其他信息系统进行整合、分类、标准化。由于元数据整合工作十分复杂,可以分层实现,在完成核心公共模块的前提下,先从核心元数据整合开始,然后向元数据集扩展。

(3)元数据存储功能

高校图书馆要考虑数据的长期保存问题,需要对元数据库进行日常维护和更新,保证数字资源的完整性、一致性、安全性。

2.2.3 综合指标管理子系统

将相关指标组织在一起构成指标体系。在这个分类体系中,同位类类目之间为并列关系,下位类与上位类之间为隶属关系,同位类类目不重复、不交叉。

综合指标管理包含指标分类的管理和指标的管理两部分,它具有双重作用:一是对数据仓库中支持的分析焦点进行统一分类管理,二是对经过映射生成的多维数据集进行数据综合与录入时提供指导。指标管理模块是以图形化界面为用户提供交互式指标描述手段,根据各个高校图书馆统计的主题和口径,用户预先定义一些系统方法库规则,完成整个指标体系的定义与管理。用户通过它可以具体定义综合指标的层次、类型、展现方式、指标计算公式、计算触发机制以及它与数据项的关联等信息,并将定义好的指标存放在指标库中,还能进行指标的日常管理与维护工作。

2.2.4 OLAP分析子系统

OLAP分析子系统的设计重点在于如何组织数据仓库中的综合性数据,如何满足前端用户的多维数据分析需要。基于上面两点考虑,选用基于多维数据组织的OLAP 实现。数据访问和生成方式上利用旋转、切片或切块、向上归纳、向下钻取等操作剖析数据。

2.2.5 资源发布子系统

根据系统使用者分散化、动态化的特点,对经OLAP分析好的多维数据视图运用BI工具图表化展示,并进行B/S式信息的发布和服务。

2.3 系统的实施步骤

2.3.1 建立图书馆业务数据仓库

对图书馆内部各信息系统和外部数据源抽取所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。本系统选用Microsoft SQL Server作为数据仓库数据库。

2.3.2 按主题分离出数据集市

数据集建立在具有统一数据存储模型的数据仓库下,各级业务人员按照各部门特定的需求把数据进行复制、处理、加工,并最终统一展现为有部门特点的数据集合。各高校图书馆可根据自己统计主题的需要从数据仓库底库中抽取数据,建立自己的数据集市。

2.3.3 数据分析

通过深入分析内部的馆藏结构数据、流通数据、电子资源使用数据、市面图书出版数据,甚至是来自外部的各种参照信息,从而分析得到本馆馆藏建设情况,并为图书馆管理人员提供采购决策支持。本系统选用Microsoft 的Analysis service作为OLAP工具。

2.3.4 结果图表化

对分析的结果按不同维度抽取数据并图表化呈现给管理者,使得管理者能对业务的发展状况有直观的认识。本系统使用报表工具Pentaho进行图表化展示。Pentaho允许开发人员创建报表、仪表盘、分析模型、商业规则和 BI 流程,并且能方便地集成至第三方系统中。如将业务报表嵌入高校公共数据平台:采用SSO(单点登录)技术,将报表嵌入学校的公共数据平台,并且设置权限审核机制,使得图书馆业务数据能够被学校主管领导查看。

3 构建数据集市应用举例

我们可以根据主题来设计数据集市逻辑模型,在此使用星型模型来构建图书馆的数据集市。为加快分析速度,可以将分析频繁的层次预先进行聚集操作,即将信息按照属性粒度层次来进行聚集,当需要进一步分析时再到原有的基本信息中进行搜索。纸本馆藏质量分析主题需从下面的纸本馆藏结构和图书借阅情况模型来分析,数据模型如图2和图3所示。

图2 纸本馆藏结构分析的星形模型

图3 图书借阅情况分析的星形模型

馆藏结构分析主要包括资金使用情况分析、馆藏分布情况分析、图书使用价值分析和馆藏文献比例分析等。通过剔除旧书、补充新书等方法不断调整,提高图书的使用价值,最终形成适用于本馆的最佳藏书结构。考虑到统计大多以年度为单位进行,对模型事实表中的数据可按年份进行聚集。如纸本馆藏模型中事实表的图书数量、图书金额字段存储着按中图法一级分类的年度图书数量、图书金额信息。借阅情况模型事实表中的借阅量也是如此。如需月度或二级分类维度的统计,需对维表基本数据进行重新计算汇总。

由纸本馆藏模型得出图书馆中各类纸本馆藏分布比例情况。借阅情况模型反映读者需求情况,由模型可以得出读者对各类纸本馆藏的借阅情况。两者的比值即为图书的符合程度。符合程度在图书馆分析中主要用于评价馆藏是否合理,能否满足读者的需求,也可用于采购分析。符合程度的理想值为1,即某类文献的流通量与其在馆藏中所占份额相当。如果这一比例远大于或远小于1时,就需要对馆藏做一些调整。

4 结论

本文对图书馆决策支持系统的目标和实现功能进行了阐述,提出并设计了基于应用数据仓库与OLAP技术的图书馆业务决策支持方案,构建了一个数据仓库模型,并规划了系统的设计与分析的路径。之后,我们将在此基础上进行实践,根据现实操作的具体情况再进行修正和完善。

[1]Marek J Druzdzel,Roger R Flynn.Decision Sopput Systems[EB/OL].[2012-05-12].http://www.pitt.edu/~druzdzel/psfiles/dss.pdf.

[2]F.M.E.Uzoka,O.A.Ijatuyi.Decision support system for library acquisitions:a framework[J].The Electronic Library, 2005,23(4):453-462.

[3]S C Kao, H C Chang, C H Lin.Decision support for the academic library acquisition budget allocation via circulation database mining[J].Information Processing & Management,2003,39(1):133-147.

[4]房宜锋.基于数据挖掘图书馆管理决策研究[D].内蒙古:内蒙古大学,2010.

[5]夏勍,白似雪.基于Web荐购的图书采访决策支持系统设计[J].图书馆学研究,2012(1):21-25.

[6]张晓,邓凡.科技情报机构辅助政府决策支持系统建设的思考[J].软件导刊,2011(1):3-4.

[7]黄志成.基于数据挖掘的校园一卡通决策支持系统设计与开发[J].现代计算机, 2010(12):175-177.

[8]邓苏.决策支持系统[M].北京:电子工业出版社,2009.

猜你喜欢
决策支持系统数据仓库馆藏
护理临床决策支持系统的理论基础
馆藏几件残损《佚目》书画琐记
基于数据仓库的数据倾斜解决方案研究
面向知识转化的临床决策支持系统关键技术研究
博物馆的生存之道:馆藏能否变卖?
基于数据仓库的住房城乡建设信息系统整合研究
知还印馆藏印选——古印篇
电务维修决策支持系统研究
探析电力系统调度中数据仓库技术的应用
决策支持系统在事业单位中的应用