肖海龙
(辽宁师范大图书馆,辽宁 大连 116029)
数字图书馆是新兴的,涉及互联网、多媒体、数据仓库、数据挖掘、版权保护等诸多技术应用领域的建设。一个理想的数字图书馆系统,从内部看,要很好地实现内部管理人员对信息加工、处理、存储、提供检索等一系列功能;从外部看,要最好地满足外部终端用户对信息获取的需求。综合国内外数字图书馆建设的要求,笔者所设想的数字图书馆系统包括5个基本子系统:数字化内容采编创建系统、数字化内容存储与管理系统、数字化内容发布与检索系统、数字图书馆用户管理系统、数字版权保护与电子商务系统,这些系统分别满足了信息资源的数字化采编整序与元数据提取标引、数字化信息的存储与管理、信息发布检索与增值服务、数字图书馆的用户管理、数字版权保护和系统安全分发这5个层次的需求。
该多层次数字图书馆系统设计开发过程中应遵循如下几个原则:
2.1 先进性。系统在体系结构、功能、性能等方面要具有业界先进水平,反映相关技术领域的当前发展水平,同时要具有前瞻性,为后续开发打下良好基础。
2.2 开放性。在知识资源描述、存储管理、资源调度、资源服务等方面尽可能采用相关的国际标准,系统设计应具有较优的开放能力与良好的互操作能力。
2.3 敏捷性。系统可以方便地裁剪与扩展,满足系统长期持续发展的要求。
2.4 安全性。系统应充分重视数据安全性要求。
2.5 自主知识产权。立足自主,形成自由知识产权系统,但不排除采用国际先进技术。
3.1 数字化内容采编创建系统
数字图书馆内容的创建和获取是资源的采集和数字化,是数字图书馆资源建设的一项最基础的工作。数字化内容采编创建系统的功能需求:要实现对文本、图像、音频和视频等信息及知识的数字化采编、加工、处理。实现对各种信息资源的一次加工、多次使用,适应应用系统今后的扩展需要。
数字化内容采编创建系统应根据图书馆业务运作的实际需要,提供一整套灵活多样的资源数字化手段,主要包括:数据录入与接收,即用计算机输入文字的方法采集和接收各种新闻报道、办公文书、会议录、报纸印刷、书刊出版等电子排版信息,经剪裁、加工、整合后形成电子文献资源库。图像扫描采用光学扫描仪、数码相机等,将现有的纸质文献进行扫描后存储,对已取得版权许可的馆藏文献进行数字化时,即采取此种方法建库。光学字符识别,即利用计算机设备和软件技术把扫描文本转换成字符型文件进行存储。视、音频捕捉,即通过声卡、帧捕获器或影视影像数字卡将模拟的音频、视频材料转换成数字方式存储,形成电子文档。网上下载,根据需要拟定文献收集范围,从网上下载没有版权争议的数据资源,再按专题进行整理、分类、归档、数据转换和装库。建立门户网站,跟踪和搜集相关网站内容,加以分门别类,予以链接,并建立网上搜索引擎。
数字化内容采编创建系统过程中还要考虑到异构资源库的整合。在数字图书馆建设前期,各文献拥有单位已经建设一批高质量的数据库,把这些数据库整合到数字图书馆系统中,将极大地丰富数字图书馆的内容。数字图书馆异构资源的整合模式可以分为基于数据源的整合和基于系统的整合,具体可以采用XML封装技术对现有数据库统一进行封装,将其与数字图书馆系统连接,使这些数据库作为数字图书馆的资源得到有效利用。
3.2 数字化内容存储与管理系统
一个完整的数字图书馆系统应包括通讯体系、应用体系和多媒体数据库体系等,数字图书馆要求系统支持并行机制,以加速系统运行,支持可扩展的海量数据资源存储,支持海量资源快速搜索和调度。在支撑整个体系的硬件平台中,存储系统是最为核心的部分,它必须能够满足不断增长的海量存储空间的需求,提供高速的数据传输能力和对于复杂的异构数据存储环境的管理、备份等能力。
数字化内容存储系统功能需要:①海量存储。海量的电子图书资源和多媒体资源是数字图书馆存储的主要内容。而这些数据每年都在增长,所以必须拥有一套或多套大容量的存储系统来满足海量存储的要求。这不仅要求存储系统具有超大容量,而且要求硬件具有可靠性。②传输速度快。数字图书馆为读者提供了丰富的电子信息资源服务,但由于读者访问量多,相对数据流量大,所以对整个系统的网络传输性能有着较高的要求。③数据备份功能。数字图书馆数据量巨大,且有些数据如书目数据十分重要,因而数据备份功能是保证系统安全运行的前提。
数字化内容存储与管理系统设计的要求:①安全性。存储管理系统必须保证数据的安全,防止任何情况下的数据丢失。对数字图书馆而言,数据的丢失等于是传统图书馆书籍的丢失,代价非常大。所以,数字图书馆的存储系统必须具有快速备份及恢复能力。存储系统不只是磁盘阵列,而是完整的高可用性存储架构。②扩充性。数字图书馆电子信息资源每年都在增长,这就要求系统必须具有良好的扩充性,在需要时可方便地增加存储设备。③稳定性。图书馆数据稳定性是非常重要的,因而存储系统应具备冗余配置,减少单点故障,从而能够支持图书馆所有应用服务器全天候服务。④实用性。能使用可靠、便捷、功能强大的管理软件,实现自动化数据存储,减少对人工干预的依赖。
目前图书馆普遍采用DAS(直接连接存储)和NAS(网络附加存储)存储结构,但无论是DAS还是NAS的存储结构,由于其维护、扩充费用高,可靠性低,存取速度慢,系统备份、恢复难,给数字图书馆的发展带来了越来越多的烦恼。SAN存储区域网络)可以为我们提供可靠性更高、存取速度更快、扩展更加方便的数字化图书馆存储系统解决方案。
3.3 数字化内容发布与检索系统
数字化内容发布与检索系统是基于网络平台,为用户提供图书、报刊、资料等各种信息的阅读、检索、下载及付费功能。数字化内容发布管理应包括如下几个部分:通过站点设计生成系统,完成数字图书馆整个站点主页、频道栏目、信息资源分类及动态页面的自动生成,并提供预定义模块实现对数据显示和维护界面、样式的自定制能力;采用数据库和模板技术,允许各种数据来源及使用多种方式完成信息发布,所有资源自动上传生成网页,不需要人工干预,实现网站内容的动态发布和自动及时更新;基于内容采编发布工作流程,支持多级审核功能,确保只有通过审核后的信息资源才能对外发表,实现信息资源发布的审批管理;内外网可同时发布,支持内容的多重定向,可为不同定位的用户提供及时、精确、个性化的动态内容。
数字图书馆检索系统设计要求:检索点全面、检索方式多样。检索系统应该既支持字段限定检索、布尔逻辑检索、前方一致检索、相邻检索等多种检索方式,又支持全文检索;提供简单检索、高级检索、专家检索和浏览4种信息获取界面;整合不同数字图书馆的检索结果,针对检索结果进行后续处理,如过滤、排序。检索结果不仅可联机打印、下载,也可以发送;检索结果提供详细书目信息和馆藏信息。书目信息中的出版者、责任者、丛书名、主题词等自动设为检索热点,方便读者进行连续追踪查找。
3.4 数字图书馆用户管理系统
为了确保系统运行安全,确保各类知识资源为各种层次人员高速取用,数字图书馆需要做好用户管理。数字图书馆用户管理系统应该包括:①安全认证管理。提供系统级、数据库级、记录级、字段级4级安全控制,可对系统所有的事件和任务进行有效监控,提供运行日志、WEB访问等分析功能;同时可对允许访问和拒绝访问的INTERNET IP地址进行设置,保证系统信息的合法访问和免受非法攻击;门禁系统。②统计进出图书馆人员的计数系统。此外还具有用户身份识别、工作人员考勤、控制非法使用图书馆等作用。③权限管理。根据用户角色,设置不同权限,定义不同的工作流程,确保只有授权用户才能访问相关资源。④计费管理系统。提供基于管理策略的计费管理机制,按会员制或者按流量、按检索查询资源数量等方式计费,并能根据付费方式对用户进行控制。
3.5 版权保护与电子商务系统
保证数字图书馆能够持续有效地发展,需对部分资源使用进行有偿服务,在技术体系中,需要对数字图书馆分布式资源跨单位跨库服务模式下的版权保护与电子商务系统给予支持。
数字版权保护系统的设计要求:一般的数字版权保护系统,包括数字内容拥有者、数字内容授权中心、数字内容分发服务器和授权用户4部分。在服务器端,首先对数字内容用对称密钥加密算法加密,然后将内容密钥放入用XML描述的内容许可证中,在获取用户的公钥后,使用用户公钥加密内容许可证,最后将加密的数字内容和内容许可证传送给用户。在用户端,授权用户在获得加密的数字内容和用自己的公钥加密的内容许可证后,用自己的私钥对内容许可证进行解密,从而获得内容密钥。有了内容密钥,用户就可以使用它对数字内容进行解密观看。版权保护的核心是数字内容授权中心,它采用密码学技术,经过加密、授权和认证3个阶段来获得对数字内容版权的保护。
数字内容版权保护的主要措施:软件和数据加密技术、水印加载技术、数字签名技术、数据保密和数据完整性、CA认证技术、入侵检测技术等。
数字图书馆电子商务模式可以分为B2B和B2C两种模式。B2B电子商务模式主要体现在:①印刷型图书采购。在电子商务采购平台的支持下,采购人员可以直接在网上浏览书商发布的各种征订目录,并且可以将标准格式的采购数据如MARC格式下载到本地采购数据库中,然后根据本馆情况和需要进行筛选,通过WEB页填写订单,上传给书商。②在线销售,这里的在线销售既指数字图书馆通过网络向出版商、书店及发行机构出售本馆印刷型或电子出版物的出版权或发行权,也指数字图书馆通过网络向其他数字图书馆和信息机构出售或出租本馆电子出版物、自建数据库的镜像权、使用权和复制权等,当然也包括向个别用户提供的书籍、音像制品、电子杂志、联机出版物的在线销售和订阅。③在线订购,与在线销售相对应,在线订购指数字图书馆通过网络向出版商和发行机构购买的电子出版物、电子报刊,向其他数字图书馆和信息机构购买或租用的电子出版物、光盘数据库及数字化馆藏的镜像权和使用权。B2C电子商务模式具体体现在办理借阅卡、付费浏览和提供信息服务方面。
网络技术日新月异的发展给数字图书馆带来机遇的同时,也带来严峻挑战。笔者所构建的数字图书馆系统从内外两方面出发,充分考虑其先进性、开放性、敏捷性、安全性以及自主知识产权,从而能更好地迎接这种新形势下的挑战。
[1]夏立新.数字图书馆导论.武汉:湖北人民出版社,2004.
[2]李培.数字图书馆原理及应用.北京:高等教育出版社,2004.
[3]黄如花.数字图书馆原理与技术.武汉:武汉大学出版社,2005.
[4]李爽.数字图书馆的体系结构的设计原则与系统构成.图书情报知识,2004(2).
[5]雷涛.利用SAN技术构建数字图书馆存储系统.丽水学院学报,2008(2).
[6]蔡伟鸿,彭思喜,胡斯捷.基于版权保护的数字内容安全交易系统的设计与实现.计算机工程与设计,2005(9).
[7]何雄.数字图书馆实现电子商务模式研究.图书馆学研究,2004(8).