数字教育资源的长期可用性研究

2013-04-29 00:44秦磊华操惊雷
现代教育技术 2013年6期
关键词:元数据

秦磊华 操惊雷

【摘要】现代教育技术的发展推动了教育资源的数字化进程。我国的数字教育资源建设已经进入快速发展期,有必要对其可用性进行综合分析与评价,以更有效地发挥数字教育资源的作用。根据数字教育资源的信息化特征,结合信息生命周期理论,对数字教育资源的长期可用性内涵进行了探索,分析了影响数字教育资源长期可用性的因素,并从多角度对提高数字教育资源长期可用性的方法进行了研究。

【关键词】数字教育资源,长期可用性,元数据

【中图分类号】G40-057 【文献标识码】A 【论文编号】1009—8097(2013)06—0024—05

建设数字教育资源、推进教育信息化进程,己成为教育改革、教育质量提升的重要基础和不可缺少的要素。经过长期的建设,国内己建设了大量数字教育资源,包括精品课程、学术会议资料、数字图书资源、数字化学术期刊、视听资源等。仅以精品课程为例,2003-2010年期间,已经建成各类国家级精品课程3693门,此外还有数量众多的省级、市级、校级精品课程。“十二五”期间,教育部还将继续建设1000门国家级精品视频公开课和5000门国家级精品资源共享课。保持数字教育资源长期可使用,对促进优质教育资源共享,传承优秀教师的教学思想、理念、经验、方法和手段具有重要的意义,本文将对数字教育资源的长期可用性进行研究。

一 数字教育资源的长期可用性内涵

关于可用性的描述非常多,国际化标准组织在ISO9241-11中给出的可用性描述被广为接受并被认为是较为通用的可用性定义,即指产品在特定使用环境下为特定用户用于特定用途时所具有的有效性(effectiveness)、效率(efficiency)和用户主观满意度(satisfaction)。其中,有效性指用户完成特定任务和达到特定目标所具有的正确和完整程度:效率指用户完成任务的正确和完整程度与所使用资源(如时间)之比;满意度指用户在使用产品过程中所感受到的主观满意和接受程度。文献在上述可用性定义的基础上,分别对移动型学习资源的可用性、网络课程的可用性、精品课程网络资源的可用性、网络信息资源的可用性和网络教学平台的可用性进行了专题研究,将可用性的一般定义与网络环境下数字教育资源的基本特性和使用特性相结合,重点分析了影响数字教育资源有效性、使用效率和用户主观满意度的因素,并从不同角度提出了增强数字教育资源可用性的方法。但这些方法均未明确考虑时间因素对数字教育资源可用性的影响。

摩尔定律揭示了计算机硬件发展的“18个月”周期规律,即每18个月,硬件处理能力(如CPU处理能力、总线带宽等)就会翻一番。软/硬件互动发展的历史也揭示了计算机技术发展的下列规律:硬件技术的发展推动软件技术的发展,而软件技术的发展,又反过来产生硬件技术发展的推动力。软/硬件技术的互动发展不断推动着文件格式、软件环境(如括系统软件、应用软件和软件开发工具等)、硬件环境(如CPU、存储系统)等信息环境的变化。随着时间的推移,当信息环境的变化积累到一定程度时,就会出现使用数字资源的信息环境与资源创建时的信息环境不兼容的情况,由此对数字资源的可用性产生影响。以微软公司的操作系统为例,从DOS1.0到Win 8的几十年间先后经历了十几个不同的版本,显然在DOS1.0环境下建立的数字资源已基本不可能在Windows 8环境下直接使用。

信息生命周期理论与实践揭示了信息从产生到被使用、维护、存档(或被删除)的全过程,不同信息因其价值不同或法规遵从的要求不同而具有不同长短的生命周期,短的可能只有几个月,而部分具有一定价值的信息,其生命周期可持续数年至数百年,极具价值的信息可能还需永久保存和使用。信息生命周期理论揭示出应站在信息生命全周期考虑数字资源的可用性。数字教育资源是特定信息环境下产生的,在其信息生命周期内,信息环境将持续发生变化,对于部分生命周期较长的数字资源,将面临资源后续使用信息环境与资源产生时信息环境的不兼容,由此,影响原有教育资源在新信息环境下的可用性。因此,必须考虑数字教育资源在其信息生命周期内的可用性,即长期可用性。本文提出的数字教育资源的长期可用性,就是在ISO9241—11可用性定义的基础上,去掉“特定使用环境”这个约束条件,增加信息生命周期这个时间因素后得到的,即指数字教育资源在其信息生命周期内所具有的有效性、效率和用户主观满意度。二长期可用性定量评价指标

为便于分析信息环境变化对数字教育资源长期可用性的影响,引入基于平均无故障时间MTTF(Mean Time To Failure)和平均修复时间MTTR(Mean Time to Repair)的长期可用性量化评价方法。其中,MTTF指对象自投入使用以来到首次出故障之间时间间隔的期望值,MTTR指故障修复时间的期望值。基于MTTF和MTTR的长期可用性A可表示为:

A即为长期可用性的量化指标,A取值越大(最大值为1),表示对象的长期可用性越高;反之,A的取值越小(最小值为O),则表示对象的长期可用性越低。从公式(1)可以看出,增加MTTF或降低MTIR均可提高对象的可用性。

迁移是数字档案领域广泛采取的应对信息环境变化对档案可用性影响的方法,通过迁移将数据从旧的格式转换成能兼容新信息环境的新格式。数字教育资源与数字档案具有相同的数字资源属性,因此,迁移同样适用于数字教育资源的信息环境适应性保护。对数字教育资源而言,MTTF指资源对信息环境适应时间,即数字教育资源产生至其需要进行迁移的时间间隔;而MTTR则表示对数字教育资源进行格式迁移所消耗的时间。

极端情况下,若某数字教育资源不能被迁移到新的信息环境,即表示原有的数字教育资源在新的信息环境下完全不能被使用,则对应于该数字资源的MTTR=∞,代入公式(11可计算得出A→0。根据数字资源的长期可用性定义,可用性A→0表明该数字教育资源在新的信息环境下无效、效率为0(因为实现格式迁移需要无限长的时间)、用户满意度为0(因为用户完全无法使用该教育资源)。

正常情况下,如果能对数字教育资源进行及时、有效的迁移,则仍可保持其具有比较高的长期可用性。假定某数字教育资源的MTTF=35040小时(表示该资源能与信息环境兼容四年),则对应于MTTR为24小时和720小时(分别表示迁移时间为1天和30天)的数字资源长期可用性分别为99.9%和97.9%。为进一步说明长期可用性与用户主观满意度之间的关系,表1给出了可用性与一年内不能使用资源的平均时间对应关系。

从表1不难判断,可用性为99.999%的数字教育资源比可用性仅为97%的数字资源具有更好的用户主观满意度。

三 提高数字教育资源长期可用性的方法

对数字教育资源而言,延长其与信息环境的适应性,可以延长其有效使用时间,减少数据迁移的次数,从而有效延长数字教育资源的平均无故障时间MTTF而完善数字教育资源的元数据信息、采用更为先进的元数据收集和管理方法,可以提高数据迁移的效率、大大缩短迁移时间,从而有效降低数字教育资源的MTTR。

1 选择适合长久保存的文件格式

为增加数字教育资源与不断变化的信息环境的适应时间,减少由于信息环境变化带来的环境适应性迁移,在选择数字教育资源文件格式时应选择对软、硬件系统依赖程度低的文件格式;选择通用、标准化和被业界广泛支持的文件格式;选择具有良好开放性和扩展性的文件格式。ISO-23ISO/TR 18492:2005《基于电子文件信息的长久保存》、ISO-06ISO/NP 26102《信息与文件一电子文件长期保存需求》、ISO19005-1:2005《文件管理一电子文件长久保存文档格式一第1部分(PDF/A-1)》、GB/T18894-2002等标准对适合长期保存的文件格式进行了研究。表2列出了数字档案中常见资源类型、目前常用的文件格式类型及推荐的格式类型。

选择适合长期保存的文件格式,可以减少由于信息环境变化引起的数据迁移次数以及由于迁移不及时或迁移不成功而导致的数据丢失或不可用风险。数字教育资源建设过程中,在根据标准和规范选择各类数字资源的文件格式时,还需注意以下几方面的问题:

(1)文件格式的通用与标准是相对的,都具有一定的时效性和局限性。按照目前的规范或标准建设的各类数字资源,当规范或标准发生变化时,应及时根据新的规范或标准进行数据迁移,防止在新的信息环境下资源不可用:

(2)不同规范或标准之间可能存在不一致。不同标准组织制定的关于文件格式的标准种类较多,即便是ISO与IEC联合制定的信息领域标准也存在一些不一致甚至相互冲突的地方。因此,在建设数字教育资源的过程中,教育行政主管部门应组织数字教育资源规范或标准的讨论,避免由于标准选择的差异而影响数字教育资源的长期可用性;

(3)在建设数字教育资源的过程中,新资源应采用标准推荐的格式,原有的使用非推荐格式建设的资源需按推荐格式及时进行迁移,以保持数字教育资源的整体可用性。

2完善长期保存元数据,规范数字教育资源信息环境的描述

数据迁移过程中,需要文件产生与使用的环境信息、存储文件的载体信息以及文件属性等元数据,包括操作系统、应用程序、存储类型、处理器型号以及文件大小、文件类型等信息,上述信息对迁移的准备、实施和完成都将起到至关重要的作用。完善数字教育资源的元数据信息,尤其是信息环境描述元数据,对提高迁移决策的准确性、有效性和即时性具有重要意义。

目前,国内、外许多组织致力于数字资源长期保存元数据标准的研究,并制定和发布了相关的元数据标准,如ISO 14721:2003《OAIS》(Open Archival InformationSystem)、中国国家挡案局DA/T46-2009:《文书电子文件元数据方案》以及DA/T47-2009;《版式电子文件长期保存格式需求》、教育部基础教育课程教材发展中心发布的CELTS-42-2001:《基础教育教育资源元数据应用规范》等。另外,数字资源的其他元数据标准,如DC(都柏林核心元素集Dublin Core Element Set)、EAD(编码档案描述EncodedArchival Description)、IS023081-1信息与文献一文件管理流程一文件元数据一总则、ISO11179《信息技术——元数据元素的规范与标准化》也涉及部分关于数字资源长期保存的元数据。上述标准中关于数字资源长期保存的元数据模型尚未统一,不同标准对同一对象的元数据定义及表述方式上还存在诸多不一致,另外,大多数标准对数字资源信息环境描述的元数据还很不完善。以DA/T46-2009:《文书电子文件元数据方案》为例,尽管该元数据方案是国家档案局于2010年才实施的档案行业元数据新标准,但其关于信息环境描述的元数据依然很简单,只有编号为M5l的元数据项涉及“信息系统描述”和“软件信息环境相关”两项与信息环境相关的元数据。再看《基础教育教育资源元数据应用规范》,该规范共定义了23项用于描述基础教育资源的元数据(11项为必选,12项为可选),除只有一项包含文件格式的元数据外,再没有任何其他关于“软件信息环境”和“硬件信息环境”的元数据。

显然,仅依靠上述不完备、不具体的元数据方案,既不能对数字教育资源的迁移提供准确的判断,也难以支持完整、高效的数字教育资源迁移。从保持长期可用性的角度看,有必要对现有数字教育资源的元数据方案进行扩展、完善信息环境描述元数据,建立数字教育资源长期保存的元数据标准。

3 开发基于OAIS模型的数字教育资源存储管理系统

数字资源的长期保存已引起国际档案学术界和工业界的广泛关注,经过研究人员经过长期、大量的研究工作,己提出多种数字资源长期保存的框架模型,如OAIS、InternetArchive等。其中,OAIS是目前国际档案界首推的数字资源长期保存参考模型和基本概念框架,已成为当今数字档案系统设计与开发普遍遵从的基础标准。OAIS主要由六大功能模块组成,其中四个功能模块与数资源长期保存密切相关,详细功能如表3所示。

鉴于数字教育资源与数字档案资源在资源类型、信息环境依赖、长期可用性要求等方面的相似性,可以借鉴在数字档案领域已经取得的成功经验,基于OAIS框架开发数字教育资源管理系统。同时,积极引入内容感知技术和智能存储技术,提高基于OAIS模型数字教育资源管理系统的智能化和效率。

(1)全面引入内容感知技术,实现元数据收集的智能化

OAIS模型中,需要获取有关数字资源的参考信息、环境信息(包括硬件环境信息和软件环境信息)等用于数字资源长期保存和迁移的保存描述信息。研究表明,数字资源迁移的精确度和迁移的性能要求越高,对元数据的完备性、准确性和粒度的要求也随之升高。目前,主要的数字资源元数据标准对元数据著录方式没有统一的规定,有的元数据项为手工录入,有的元数据项虽然标注为自动产生,但未指明自动产生的方式。一方面,手工方式录入元数据不可避免地存在错误或遗漏;另一方面,部分元数据可能与操作系统内核或应用系统内部工作状态关联(如操作系统内核信息和进程信息等),而这些元数据信息对一般用户透明,他们无法获取这些信息。因此,基于手工录入元数据的方式,既难以满足迁移对元数据准确性、完备性方面的要求,又难以满足元数据收集粒度的要求。

内容感知技术为解决上述问题提供了一条有效的途径。通过在OAIS模型的信息摄入层采用内容感知技术,可对数字教育资源的文件属性、产生和处理数字教育资源的软/硬件环境、语言使用环境等保存描述元数据,进行自动、高效、全面、准确、规范的感知并获取。通过在OAIS模型的资源存储层嵌入内容感知技术,一方面感知并获取存储系统的软/硬件环境元数据;另一方面,还能自动处理存储介质退化与更新及其产生的存储系统软/硬件环境元数据的更新。

(2)注重发挥存储新技术在数字教育资源长期保存中的作用

随着网络存储系统性能与智能化程度的不断提升,越来越多过去在应用层完成的功能开始下移到存储系统中实现,如数据校验、数据备份、数据恢复、数据整合等功能可直接在存储系统中完成。近几年来,国外数字保存领域的研究人员、数字档案及存储业界己开始注重发挥存储系统和存储新技术在数字保存领域中的应用研究。如美国加州大学圣克鲁兹分校存储系统研究中心长期致力于归档存储的研究,哈佛大学主持研究了保存感知的存储系统PASS和来源感知的存储系统PAS;在IT界,IBM公司也参与到数字资源长期保存的研究中,开发了数字保存原型系统CASPAR。

文献采用XAM(eXtensible Access Method)规范,实现了基于OAIS的保存感知存储系统原型,将数字资源长期保存中计算密集的数字保存以及与存储相关的功能,如不变性计算、数据迁移等功能从应用系统下移到存储系统,从而减少数据传输量并简化应用系统,提升了数字保存系统的稳定性和性能。文献在文献的基础上,基于OAIS模型开发了支持内容感知的数字资源长期保存原型系统,不仅实现了信息摄入层和资源存储层的元数据自动收集与获取,还实现了在资源存储层的元数据融合。

四 结束语

教育资源数字化是现代教育发展的必然趋势,为最大限度地发挥优质教育资源的作用,在规划与建设数字教育资源时,有必要树立长期可用性意识,注重长期可用指标体系的建立与完善,并充分借鉴在数字档案领域和计算机领域取得的新技术、新成果、新方法,构建提高数字教育资源长期可用性的技术体系。当然,论文提出的一些方法要最终实现还有很多实际工作要做,这也是我们目前和下一步研究工作努力的方向。

猜你喜欢
元数据
元数据国际交换共享的客家古民居数字记忆工程建设
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
利用VB读取中国知网过刊数据提取元数据的研究
财会信息资源元数据标准的研究
基于隐语义模型和用户信任的个性化推荐模型
基于关联数据的语义数字档案馆框架设计研究
基于角色控制的异构数据展示在企业门户中的应用
基于元数据映射机制的异构数据操作