工程技术数字图书馆网

2014-09-29 03:44刘燕权美国南康涅狄格州立大学康州纽黑文市06515
数字图书馆论坛 2014年1期
关键词:工程技术资源库检索

□ 刘燕权/美国南康涅狄格州立大学 康州纽黑文市 06515

郦佳伟/中国建设银行股份有限公司诸暨支行 诸暨 311800

工程技术数字图书馆网

□ 刘燕权/美国南康涅狄格州立大学 康州纽黑文市 06515

郦佳伟/中国建设银行股份有限公司诸暨支行 诸暨 311800

工程技术数字图书馆网(Digital Library Network for Engineering and Technology,DLNET)是美国国家科学数字图书馆倡议下的国家科学基金会资助的项目。该馆作为一个支持工程与技术方面教育和学习的平台,具有资源检索、资源评估、基础研究等功能。文章从资源组织、技术特征、界面设计、服务特点、评价和建议等方面对工程技术数字图书馆网作了概要的评述。

工程技术,数字图书馆,美国国家科学基金会(NSF),美国国家科学数字图书馆(NSDL)

1 项目概述

工程技术数字图书馆网(DLNET)是由美国国家科学基金会(NSF)资助的,为国家科学数字图书馆(NSDL)计划的组成部分之一,该项目开始于2000年9月,结束于2003年2月。美国国家科学基金(NSF)成立于1950年,是美国国会成立的具有独立意义的政府机构,重点资助科学、技术、工程和数学领域的研究和教育,支持“人、思想和工具”的创新,促进国家进步、健康和繁荣。DLNET作为一个收集管理关于工程与技术方面资源的数字图书馆项目,其目的就是促进科学、技术、工程和数学领域的发展,帮助实践工程师和技术专业人员以及大学各阶段的学生对工程技术的继续教育和终身学习。其明确的目标包括以下几个方面:(1)创建一个通用平台使用户能够在线提交或存取相关学习资源和材料;(2)开发用于评价、注释以及验证提交材料的工具和服务;(3)为大学和专业协会在各个工程学科领域出版发表的用于教学与研究的资料建立一个门户网络平台。

DLNET是由美国工程师教育协会(ASEE)、电气和电子工程师协会(IEEE)、美国爱荷华州立大学(IASTATE)以及弗吉尼亚理工大学(VATECH)四家机构努力合作建设的。弗吉尼亚理工大学的亚历山大研究机构负责管理该项目并提供必要的支持,网址为http://www.dlnet.vt.edu/。图1所示为该数字图书馆的登录界面,用户使用需要事先注册。

2 数字资源及其组织

2.1 资源收集

图1 DLNET主页

DLNET收集的资源包括工程和技术领域,如航天航空、生物化学、机电、环境、工业系统、信息与通信技术、材料科学与工程、医药、矿业、计算方法、工程教育以及职业发展等。

资源投稿者提交或连到DLNET时将被要求提供最起码的元数据。DLNET使用IMS的元数据规范,以其1.2.1版作为它的元数据标准。该数字图书馆被指定的核心元数据元素在存档并发现内容上分为四大类。(1)信息投稿:作者姓名、邮件地址、部门、组织;(2)基本法:标题、语言、描述、关键词、成立日期;(3) 教育/教学信息:交互型、学习资源类型、交互级别、用户意图、语境下的使用、学习期限;(4)其他信息:格式、权利、分类。图2显示的为DLNET存档的内容的元数据信息。

DLNET收集的馆藏内容收藏标准如下:

• 所有涉及科学、技术、工程和数学(STEM)教育的资料。

• 满足基本入藏要求的资料,即其内容不应该有事实错误,也没有试图传播政治、宗教或商业信息。此外,在显示数字资源的时候,亦不应该表现出明显的技术故障。

• 符合科学、数学和技术事实的资料:其内容必须基于可靠的科学、数学或技术的原则,而不是伪科学的理论和假说。

• 满足教育/教学评估的资料:其内容必须满足既定的教育/教学目标服务的目的。此外,内容的设计必须有可能被教员和课程设计者重新使用。

• 内容清晰准确的资料:载体必须有一个明确、连贯和系统的表达方式。这就要求正确使用语言(语法、标点、拼写),以及视觉元素在界面上使用一致(标签、按钮、菜单和图标)以方便导航。

• 便于轻松查看和利用的资料:内容不需要特殊软件或插件和加载项运行。必须适应现有平台和浏览器。同样,内容不能有硬件要求限制(如内存、视频、处理器速度等)。

2.2 资源类型

DLNET接受多种类型的资料,其主要形式包括:

(1)基本形式:文本、文摘,图表、数据、图表,音频和视频数据流,表、指标。

(2)复杂形式:教程,课程套餐,论文,幻灯片和介绍(标准、多媒体),交互模拟,算法、子程序、软件,数据集、数据库等,以及自我评估(考试、运动的问题、研究指南、问卷),指导手册、自己动手指南。

(3)工具形式: 计算、转换,数据处理和可视化,仿真建模,课程模块建设,网络教学,网站内容的发展,注释,公式编辑器,搜索引擎。

2.3 资源载体

DLNET接受资源载体的种类也非常广泛,具体接受的各种材料的格式如下:

(1)文档(Plain, Rich-text, Comma-separated, Tab-separated, etc.)

(2)标记语言(HTML, SGML, XML)

(3)视频(mpeg, quicktime, avi, etc.)

(4)音频(wav, ra, au, snd, etc.)

(5)图像(jpeg, gif, tiff, bmp, etc.)

(6)脚本、模拟和程序(java, perl, matlab, etc.)

(7)应用(ms-word, ms-excel, ms-powerpoint, adobe pdf, zip, etc.)

(8)Toolbook-type course modules

图2 存档内容显示举例

2.4 资源分类

为了能使用户更直观地浏览和搜索馆藏内容,DLNET将工程和技术领域的内容进行自定义分类,并据此进行存档。其分类体系更密切关注文摘的内容形式,如课本、书籍、杂志论文等。DLNET分类法力求适应多种社区搜索要求和用户资源分类学习的需要,同时根据各方的建议和补充对此分类体系不断发展改善。

最后版本的DLNET分类法是一个三级水平分类法,图3所示为DLNET的三级分类实施过程。该分类方法从工程的基本类型到特定主题领域,并对学习对象进行了描述。每一级分类都会定位一个唯一的8位字符的ID用于整个DLNET。三级分类使用的是XML格式,因此它可以在DLNET中各种需要分类的模块中顺畅使用。以学习资源的配电变压器为例,其在DLNET的分类为(图4所示):一级分类电气工程,二级分类能源和电力系统,三级分类变电站、开关和变电器。

图3 DLNET三级分类计划

3 技术特征

3.1 软硬件要求

DLNET的技术体系可分为如下几类:(1)学习资源的包装工具使用Custom Java-based(J2SE、xml);(2)元数据采用IEEE/IMS标准,使用XML语言格式;(3)搜索引擎则在Custom Java-based和XML的基础上使用SOL;(4)网站采用JSP and Java Servlets on Apache Tomcat and IIS;(5)硬件使用DELL 2450 servers;(6)操作系统使用Win2k Advanced Server 。

图5 DLNET管理结构

3.2 核心管理结构

工程数字图书馆网站的核心管理结构由系统管理者与应用服务器组成。系统服务由网页界面和资源库之间系统操作中的各种模块与引擎组成。全部过程被系统管理者控制,疏导服务对象使用的信息流便捷通过系统。应用服务器的关键组成包括以下几部分:(1)信息提交模块;(2)信息评价模块;(3)信息存档模块;(4)信息检索、预览引擎;(5)资源库管理;(6)信息结合界面。图5展示工程技术数字图书馆体系结构的主要组成模块成分。

图4 变电器在DLNET中的分类体系

工程技术数字图书馆通过内部的五个资源库完成其资源信息服务。这五个资源库组成内容关联资源库,它们分别是:临时资源库、元数据资源库、数据压缩资源库、内容预览资源库,以及组成用户关联资源库的用户个人信息资源库。资源库的业务管理涉及JAVA、SOL、XML等语言技术。图6展示管理过程和信息流在工程技术数字图书馆网站中的传递路径。

图6 DLNET体系结构中的管理过程和详细流

3.3 元数据标准

DLNET的元数据标准采用IEEE/IMS标准。IMS(Instruction Management Systems教育管理系统)是于1996年由EDUCOM(美国大学校际交流委员会)设立的一个研究项目。1997年,IMS项目组开始致力于研究联机学习的标准,其中包括适于教育资源的元数据规范。后来,IMS与欧洲的ARIADNE(欧洲远程教学著作和分布式网络联盟)合作,共同致力于教育资源元数据规范的内涵。IMS项目工作组后来发展成为非赢利性的IMS全球学习联合组织(IMS Global Learning Consortium),专门从事教学系统技术标准制定和推广工作。目前,IMS已经推出了用于教育资源内容描述、发现、交换、跟踪及系统互操作等方面的十几种技术规范。

IMS实际也可以看作是一个课程管理系统、教育服务器、CBT或集成学习系统的集合。IMS教育规范是IMS全球学习联合组织倡导的一种开放的、面向市场的在线学习标准,是专为教育服务、教学内容和分布学习环境方面的研究而制定的。IMS系列教育规范是IEEE一系列规范中第一个基于Internet教育体系的定义内容。

IMS元数据规范的定义基于元数据的基本概念,既描述资源类型的属性,对资源进行定位与管理,使其成为有助于数据检索的数据。通过计算机可读的开放语言来标记元数据,旨在实现系统间发现、交换、转递和理解相应的数字对象,支持系统间的互操作。

描述文献资源的元数据既描述有关文献特征与内容,也描述包括文献的管理、结构等信息。描述性元数据用于描述一个文献资源本身的特征、内容、与其他资源的关系,其主要作用是发掘和辨识。管理性元数据包括有关数字实体的显示、注解、使用、长期管理等方面的内容,例如所有权权限的管理、产生/制作的时间和方式、文件类型、相关技术、使用或获取方面的权限管理等。结构性元数据用于定义复杂的数字实体的物理结构,以利于导航、信息检索和显示。

IMS教学资源元数据规范提供了一个元素定义的结构,它可以根据元素的使用和表现要求来对教习资源进行描述和分类,使得寻找和使用这类资源的过程更有效。

DLNET中的元数据应用可归纳为以下几点:

(1)用户可以在不操作资源的情况下通过元数据信息来了解资源的一些重要属性,从而可以便捷地获取和更好地利用学习资源。

(2)通过元数据所提供的信息,对学习资源进行有效的分类管理和查找。

(3)用户可以从元数据信息中获取学习资源的评价信息,也可以把自己的评价加入到元数据中,以便和他人共享。

3.4 标记语言XML

DLNET中元数据使用的编码语言是可扩展标记语言XML,同时采用OAI协议。OAI全称为Open Archives Initiative Protocol for Metadata Harvesting,是一种独立于应用的、能够提高Web上资源共享范围和能力的互操作协议标准。

应用XML相对HTML有许多优点。HTML文档本身的结构性不强,扩展能力差,描述内容的能力也较弱;而作为一种定义语言,XML使用者可以定义无穷无尽的标记来描述文件中的任何数据元素,突破HTML固定标记集合的约束,使文档内容更丰富、复杂,并组成一个完整的信息体系。DLNET认定XML,以其良好的数据存储格式、可扩展性、高度结构化创建了基于该定义语言的元数据系统。图7为DLNET中的一个XML Schema实例。

3.5 学习对象软件包装工具

DLNET有一个自建的学习对象软件包装工具,这是一个独立的基于JAVA的软件工具,用于帮助馆藏内容提供者把学习资源准备和包装成学习对象并上传到DLNET。该工具是根据IMS/IEEE对于元数据和内容包装的规范说明以及一些被广泛应用于网站和数字图书馆结构说明内容所创建的一种文档传递、交换和分类的标准。该工具有三个主要功能:(1)采集资源和贡献者的元数据;(2)验证组成资源文件的来源;(3)根据IMS/IEEE对于内容包装的规范说明将资源转换成交换文件。

学习对象包装工具可以在WINDOWS(9X ME NT 2000 XP)操作系统下安装,同时系统需要安装JRE1.3.X版本或最近版本。JRE安装软件可以在SUN公司网站上下载,推荐使用的最小硬盘空间为10MB。

利用XML技术良好的标签语义使重复利用内容素材资源成为可能。通过将基本内容素材以及元数据信息描述文件绑定在一起,包装成可以独立使用的有意义的文档单元。其中元数据描述文件是一个标准XML数据文件,包含了该资源的各种重要信息。下载资源时即可同时下载元数据文件,真正达到资源使用上的共享重用。

为了使用已描述的资源,用户需要了解用于描述资源的标签的含义,因此,需要统一制订一些相关的规范,来规定这些标签的具体含义,以赋予内容素材真正的的语义。参照IMS提供的学习资源元数据规范,DLNET实现了对内容素材的包装。图8为学习对象软件包装工具的图示说明。

图7 XML Schema实例

图8 学习对象软件包装工具说明

4 服务特点

4.1 目标用户

DLNET为广大范围的用户提供具有针对性的服务,用户总体上分为三类:

(1)专业工程师、技师:满足专业人士对于工程技术领域的信息需求,涉及该领域的精深知识。

(2)学生:提供大学各阶段学生对于工程技术的学习资源。

(3)教育人士:将工程技术方面的资源引入教育领域、促进科学教育的普及与发展。

4.2 界面设计

DLNET的界面设计具有以下特点:

(1)美感度。该网站界面的背景简洁大方,色彩偏冷,符合工程技术领域的风格,字体适中,版面布局一目了然。

(2)友好程度。该网站有着简明直观的主页,有着足够的关于链接的介绍信息,提供关于文档类型和使用方面的提示和帮助。

(3)导航功能。导航功能是作为网络信息资源节点的数字图书馆必不可少的。该网站根据贡献者、评价者、普通用户三种身份进行有针对导航。另外还提供常见问题回答。

4.3 资源检索

(1)一般检索

一般检索作为最基本的搜索方式位于主页中间,用户可在如图9所示的空白文本框中输入需要检索的词组或者短语,搜索与元数据列表中的元素相一致的内容,例如作者的姓名、关键字、题目、组织等。

(2)高级检索

高级检索为用户提供更多的搜索选择项,可以结合作者姓名、题目、关键字一起搜索。用户可以选择检索的内容是符合这三项中的一项或者多项。另外,用户还可以根据学习对象的格式、类型、自身类别进行搜索。

(3)浏览检索

用户可根据所检索内容的工程领域、主题域以及子主题浏览检索或搜索工程技术数字图书馆馆藏存档的文件。

4.4 资源评审

DLNET为了保证文献收藏的质量建立了一个双层内容审查制度,即同行的审查和公众的审查。同行审查是一次性在内容提交后进行立即审查的过程,而公众审查是一个持续的根据公众已经使用内容的反馈意见的审查过程。

图9 一般检索

图10 高级检索

图11 浏览检索

(1)同行审查是基于评估新提交的内容的质量、易用性、可读性和教育意义。提供者需要填写一个预定的审查表以用于协助同行审查员评估提交的内容。 审查的回馈将用于确定内容是否符合在工程技术数字图书馆上出版发表的要求。图12为一份同行审查表。

(2)公众审查是根据使用的学习对象的公众的反馈意见。审查的结果也被用来排序并确定内容的注释。图13为一份用户反馈表。

审稿人采取自愿制。一方面DLNET通过这种方法实现用户参与,有效地保障标准,控制收藏质量,实施对内容和学习对象的排名,从而有助于使馆藏资源达到为NSDL项目倡导的为科学、技术、工程和数学(STEM)教育服务的根本目的。另一方面,这种制度也可使审稿人从中受益得到作为特定主题领域专家的社会认同。该数字图书馆通过实施这种内容审查机制建立一个有效的内容审查程序系统,保证了馆藏资源的质量、完整性和存放教学内容的价值。

图12 同行审查表

5 评价与建议

由于数字图书馆总是处于不断的发展变化中,人们对数字图书馆发展变化的特征与规律的认识具有相对性。DLNET作为NSDL项目的一个部分,其建设具有以下一些亮点。

(1)个性化的服务。每一个DLNET注册用户都会拥有有一个私人的DLNET页面,登录后即可自由选择,享受检索、下载、提交、预览的功能,同时可以跟踪自己的交换记录、维护个人信息。

(2)资源的丰富与高质量。DLNET鼓励用户向数据库提交文章或相关站点,但是否能够得到收藏发表要取决于特定主题领域专家作出的评估。提交的文章有可能被接受、拒绝或者建议修改。其双层内容审查制度包括对外公开邀请特定主题领域的学者作为评估志愿者,也欢迎吸收所有志愿的用户提出反馈意见。

图13 用户反馈表

(3)完善的功能设置。DLNET为用户提供了一个集搜索、下载、提交和评价学习对象为一体的服务界面。该数字图书馆用于管理图书馆功能的核心单元,其功能包括登录、验证、内容接受、评价、存档,然后检索与发掘,并提供对于其他相关数字图书馆的链接。

(4)良好的技术设计。在数字图书馆元数据方案中,选择XML作为编码语言,能够为信息的交换提供独具特色的解决方案,以实现元数据的最佳共享、互换。

当然,DLNET在建设中也存在不足。DLNET不具备多语言支持能力,这势必会影响受众面。馆藏建设后期资金人力不足,使预定的一些计划未能实施,例如DLNET曾计划向类似于SCORM(Sharable Content Object Reference Model)方向发展以建立更加完善的学习管理系统。颇为遗憾的是该项目没有继续发展,读者目前无法享受该馆服务。但是该馆在其技术和服务等方面的尝试与实践无疑给其他数字图书馆的建设提供了许多有益的借鉴和经验。

Digital Library Network for Engineering and Technology (DLNET)

Yan Quan Liu/Southern Connecticut State University, New Haven, CT, USA, 06515
Li Jiawei/Zhuji Branch of China Construction Bank, 311800

Funded by the National Science Foundation, the DLNET project intended to develop a specialized collection of engineering and technology-related "learning objects" targeted at the practicing engineers and technologists so as to facilitate lifelong learning.To effectively manage online resources it provided mechanisms for submitting, reviewing, ranking, updating and validating of new and existing contents.This paper drew a summary of its development from the perspectives of resource organization, technical features, interface design, and service characteristics.Suggestions and recommendations were also given.

Digital Libraries, NSDL, NSF, STEM

2013-12-16)

10.3772/j.issn.1673—2286.2014.01.012

刘燕权,男,博士,毕业于美国麦迪逊大学信息图书馆学院,现任南康涅狄格州立大学教授。他近年的出版物主要集中在数字图书馆、数据挖掘、多媒体技术、软件管理、国家信息基础结构、信息存储、图书馆统计及管理等。E-mail: liuscsu@gmail.com

郦佳伟,毕业于中央财经大学信息学院,现就职于中国建设银行股份有限公司诸暨支行。

猜你喜欢
工程技术资源库检索
工程技术矩阵
工程技术研究院简介
健身气功开放课程资源库建设研究
贵州●石斛种质资源库
基于共享资源库的混合式教学考核模式研究
高中历史信息化教育资源库应用探索
专利检索中“语义”的表现
对磁浮工程技术的一些思考
逆向工程技术及应用
国际标准检索