杜 亮 王 芳
(1.沈阳航空工业学院,辽宁 沈阳 110136;2.沈阳体育学院图书馆,辽宁 沈阳 110102)
杜 亮 男,1978年生。硕士,毕业于东北师范大学传媒学院图书馆学专业。馆员,期刊部主任。发表论文5篇,完成校级课题1项。
王 芳 女,1979年生。硕士,毕业于东北师范大学传媒学院图书馆学专业。馆员,发表论文8篇。
随着图书馆数字化的日益发展,特色数据库已经成为各高校图书馆数字化建设的重要组成部分。每所高校都有自己的办学特点和重点学科,高校图书馆也会在相应的学科方向上形成较为丰富的文献馆藏。针对这类重点学科进行特色数据库建设,既可以促进图书馆对信息资源进行深加工,提高服务质量,增强该学科对教学、科研的重点扶持力度;又可以使图书馆更开放地面向社会,提高馆藏资源利用率,增强该学科在国内及行业中的影响力。2009年沈阳航空工业学院图书馆开始应用TPI系统,建立本校的航空特色数据库,在实际工作中取得了一定的成绩。
TPI系统是专业的文档管理系统,提供全文检索、电子书制作、文档统一转换、元数据标引、文档分类管理、内容动态发布等功能,实现对文本、图像、音频、视频等各种类型资源的管理,可广泛应用于数字图书馆特色库建设、数字档案馆建设和各种类型的文档管理系统。TPI系统是基于非结构化文档管理而开发的大型智能内容管理系统。该系统以FTS(即全文检索服务器)为核心,采用流行的B/S浏览器的检索方式和先进的C/S架构,能够同时管理文字、图片、多媒体等信息,并提供全文检索服务,支持网页的动态发布。该系统是一套基于网络平台用于知识仓库创建、生产、管理、维护和发布的工具软件系统[1]。
TPI系统为图书馆的特色数据库建设提供了一套全面的解决方案,它包括全文检索服务器程序、电子图书制作、元数据加工、内容发布、数据转换、远程教育等子系统。TPI系统的核心是KBASE检索服务器,它实现了信息的组织、存储与检索;电子图书制作、元数据加工实现了原始文献资料的数字化和组织;内容发布、检索网关和TPI检索服务器共同实现了资源发布。
TPI系统的主要性能和突出特点是完全兼容现阶段普遍使用的MARC标准,支持Z39.50服务,完全兼容最新的Dublin Core标准,支持XML文件格式,支持最新的OAI协议,支持最新的METS协议,支持11种CALIS元数据模板,支持统一认证和单点登录。先进的安全机制、电子图书的制作、检索手段的丰富、支持动态实时信息的处理,实现了流水线控制;可以利用COM组件实现二次开发。由此可见,该系统的性能可以满足自建特色数据库的要求,依托该平台进行航空特色数据库的建设是可行的。
选题是特色数据库建设的关键,也是资源建设方向定位的重要环节。根据本校作为东北地区唯一一所航空院校的实际情况,确定选择此专题作为数据库建设的目标。建设航空特色数据库的总体规划是:一方面对本馆及东北地区的航空文献纸本资源进行搜集、开发与整合;另一方面对有关航空方面各种格式的网络文献资源进行挖掘与整合,最终将这些文献资源进行数字化加工处理,划分成若干个子库,统一在同一检索平台,在WEB服务器上发布。实现目录检索、分类检索、主题检索和全文检索,实现读者网上轻松阅读和下载。达到和CALIS成员馆一样,统一标准、分散建设、共建共享的预期目标。首先确定建库信息源的种类,包括图书、期刊、图片、会议论文和网络资源等载体类型;然后对收集到的文献进行筛选、整理和组织,以确保数据库中文献的含金量。筛选、整理和组织文献的过程是知识管理的过程,这一过程关系到整个数据库的质量,需要在学科专家的建议和指导下,由专业人员和图书馆建库人员共同来完成。
航空科学是一门专业性极强的科学,它包含航空基础理论及试验、飞机构造与设计、航空发动机、航空仪表、航空设备、飞行控制与导航、航空材料、航空制造工艺、各类型航空器、航空燃料及润滑剂、航空飞行技术、航空港、机场及其技术管理、航空系统工程等内容[2]。数据库建设就是按照以上学科体系来收集、筛选、整理、组织相关有学术价值和利用价值文献信息资源,再将这些文献信息按其知识体系划分为不同的知识块(即数据库子库),最终组成知识仓库。划分不同知识块的过程也为以后建立数据库的信息导航与检索分类奠定了基础。航空特色数据库由以下5个子库组成:航空书目信息子库、航空期刊信息子库、航空图片信息子库、航空会议论文信息子库、航空网络资源信息子库。
具体步骤:第1步,安装TPI系统后,启动CPS管理工具,在工具栏上选择新建数据库。第2步,选择数据库模板,系统会提供各种不同定义的模板类型,根据创建航空数据库的需要,选择书目、期刊、图像、会议论文和网络资源模板。第3步,给数据库命名,输入数据库信息。第4步,定义字段信息,选择不同的数据库模板类型,会有不同的字段信息,用户可以直接使用该模板的字段,也可以根据自己的需要添加或修改字段信息。第5步,设置数据库的发布选项和数字对象的命名方式。
3.3.1 纸质文献的数字化
沈阳航空工业学院图书馆积累了丰富的有关航空方面的图书、期刊、会议论文、图片、画册,利用E-BOOK电子图书制作专用工具,通过书页扫描、扫描图像处理、OCR识别处理、书页压缩打包等工序,快速生产电子图书,对转化过来的电子图书,还可以利用该系统软件对图像的灰度、倾斜度、比例、显示等进行加工、处理,生成PDF文件,并以PDF文件格式导出。
3.3.2 网上信息资源搜集
TCP/IP与检索服务器连接,通过有效设置可以自动采集网上航空方面的信息资源,可以实现信息的分布式加工,采取可视化操作。TPI系统的信息采集系统RIC,是对Internet进行信息监视、挖掘、抽取的一个系统,通过智能网页分析器,根据馆员的预定,自动定时对相关网站或网页实时分析,将返回的结果放入全文检索库FTS中。馆员只要预先设置所要采集的网站或网页参数,设置所要采集的媒体类型,设定采集任务的自动启动时间、信息更新周期,还可以选择采集策略:深度优先,还是广度优先,RIC系统就可以自动采集网上信息。
入库的记录要经过数据加工,才能最终发布到网上。数据加工包括数据标引、分类和检查3方面内容。
3.4.1 数据标引
在特色数据库建设中,标引和分类的工作量通常很大,有些数据库的数据量达到十几万条,可将这些标引工作分配给不同的用户,以方便快速地进行多人并行工作。首先,由“管理员”启用“元数据加工工具”中的“分配任务”功能,将入库的原始数据分配给各“标引员”,该工具支持Word文档、HTML文件、TXT文件以及PDF格式文件的标引。标引员可直接从原文中拖选需要的内容,操作简单、直观。如果元数据信息在入库时已经十分完整,就不再需要手工标引程序。
3.4.2 数据分类
TPI利用可视化的操作界面实现数据分类的全过程。该模块在预制了标准的中图法分类体系同时,也允许用户自定义分类体系。用户可根据自身需要创建相应的导航树结构,将库中的记录进行分类,以方便数据的管理和访问。TPI系统数据库制作工具DMT可以对数据自动分类,同时根据用户选定的分类体系自动生成相应的导航树,在导航树的基础上用户只需将记录拖到相应的结点,系统就可以记录相应的分类号。考虑到每个读者会有不同的检索习惯,为了方便读者使用,可考虑多种分类标准,如中图法分类和学科分类等。
3.4.3 数据检查
对入库数据的真实性和准确性要进行质量控制。“检查员”在得到了任务之后,逐条对数据的字段信息和数字对象进行审核。若标引信息准确无误,则把该条记录标记为“记录正确”;若信息不符合要求,则标记该条记录为“标引错误”,并且在弹出的“错误信息”窗口中输入错误原因,以便继续修改。数据检查是数据库管理中重要的一环,对建立数据库起到了质量保障作用。
数据处理完毕,使用TPI系统中“内容发布工具”的“Web发布向导”功能进行数据库网上发布的相关配置。通过该向导可以实现以下功能:①设置数据库的版权信息,这些内容将被显示在网页上。②选择数据库发布模板。根据数据库内容的不同,TPI系统预制了与之相对应的不同形式和不同特点的发布模板:CNKI期刊风格、Google风格、EI风格、OCLC风格、图片风格等。支持用户基于数据库字段的个性化发布定制。③确立检索点,指定字段属性。在这一环节中,哪些字段可以作为检索点,概览页面显示的字段,细览页面显示的字段都将被逐个确定清楚。④配置个性化的初级和高级检索界面。每页显示记录条数,文字的字体、字号、字形和颜色、背景图片、检索命中文字的属性等都可以进行个性化的配置。
TPI系统具有用户权限管理、数据库维护、统计等功能,可实现数据库的引入、删除、清空数据库、数据更新、索引数据库、数据库备份等功能。用户管理模块包括“用户”、“角色”两个模块。在用户管理模块里可以对检索者进行IP限制、账号限制、时间限制和访问数据库权限限制。未经授权的用户无法进行相应的操作,而角色管理模块则确定了系统管理员、数据库管理员、普通用户等,该功能非常适合对不同读者的管理,既确保了系统的安全又方便了数据库管理。另外,TPI系统提供了数据库备份功能,系统管理员可以根据数据库服务特点,选择定时自动备份和随机手动备份方式,及时地把数据备份到另一台网络服务器中,以防不测。
利用TPI系统建设高校特色数据库已经成为当代图书馆数字化建设的重要内容,运用TPI系统自建数据库,使整个建库工作更加灵活、简便、系统化、智能化。只要我们认真了解和学习掌握TPI系统功能,结合本馆资源的具体状况,突出特色,所建成的数据库就会受到师生的欢迎。
[1]清华同方.清华同方信息资源建设与管理系统技术白皮书,2008.
[2]中国图书馆分类法编辑委员会.中国图书馆分类法[M].北京:北京图书馆出版社,1999.