殷福兴
(贵州省图书馆贵州·贵阳550003)
DC元数据及其在数字图书馆建设中的实践
殷福兴
(贵州省图书馆贵州·贵阳550003)
元数据主要是描述数据属性的信息,是信息资源共享与交换技术发展中的重要问题,是数字图书馆建设的基础工作。元数据是一种电子式目录,为了达到编制目录的目的,必须在描述并收藏数据的内容或特色,进而达成协助数据检索的目的。包括图像、文本信息及其他网络环境下的电子资源都是元数据描述的对象,它适用于任何网络数据和资源,在数字图书馆建设中的作用举足轻重。
数字图书馆;DC元数据;图书馆建设
随着互联网的发展,元数据这个词最早出现在美国国家航空与航天局手册中。就图书馆领域而言,元数据的应用更为重要,卡片目录和MARC数据都是元数据的形式。图书馆领域定义的元数据主要从强化结构化数据以及突出元数据功能两个角度进行。
(一)DC元数据的产生
目前,人们查找所需要的信息一般通过搜索引擎来实现,通过网络机器人自动抓取网页信息,并自动拆字词做索引的方式建立数据库。随着网络资源迅速增长,网络信息资源不仅数量庞大,不稳定,而且质量参差不齐,不规范,如何更为有效地组织信息资源,用户快速、准确地找到所需要的资源已经显得尤为重要。DC元数据的出现,提供了规范、准确的网络信息资源描述格式,大大提高了信息搜索的效率。
(二)DC元数据的优点
DC元数据规范最基本的内容是包含十五个元素的元数据元素集合,用以描述资源对象的语义信息。DC元数据具有内在性、可重复性、可选择性、可修改性、可扩展性以及独立句法结构等特点。在实践应用中,其主要优点体现在通用性、简易性、可扩展性以及兼容性等几个方面。首先,通用性。因为元素可以重复、自由使用,其所描述资源是否嵌入不会影响元素含义。与MARC主要对印刷文献等静态信息进行描述相比较,DC元数据支持任何内容的资源描述,因此,夸学科的语义描述才有了互操作的可能。其次,简易性。与MARC相比DC元数据元素不仅语义较为普遍理解,且只有15个,图书馆建设中非专业人员也可以进行著录,操作简易优势明显。再则,可扩展性。DC元数据的扩展描述可根据实际需要通过使用限定词实现。
(三)数字图书馆的元数据需求
完备的数字图书馆是多种信息资源的集聚中心,重要信息的生产基地,是信息发现、搜索好的导航站点,它应该为用户提供高水平的服务,成为读者、专家以及图书馆之间形成交互枢纽。建立一个为用户所接受的,简单的标准化元数据集,不仅可以有效解决数字图书馆建设中网络资源的查找问题,更是为了适应网络飞速发展的迫切需要。再则,为读者提供信息服务以及信息资源的收藏,是数字图书馆的两大主要职能。为资源建立元数据描述,即为了方便资源的储存和提取对信息资源进行描述和抽取,是数字图书馆两大主要职能履行的保障。DC元数据简易、灵活,便于理解,易于扩展及其与其他元数据的桥接的可行性等,使得它成为通用网络资源描述的元数据依据,在数字图书馆建设中举足轻重。
(一)DC元数据在数字图书馆中的应用领域
1.组织数字图书馆中信息资源
DC元数据在数字资源组织方面具有描述、定位、搜索、评估以及选择等主要功能,在数字图书馆建设中起到传统目录的“著录”作用。DC元数据对数字资源的组织,以便于使用者和维护者对馆内资源的了解和辨别,促进使用者对资源的利用效率,维护者对资源的管理效率,进而实现数字图书馆的内容管理。
2.用户使用数字图书馆的导航
用户通过图书馆网站了解馆藏资源,数字资源的基本属性通过DC元数据进行资源描述,进而在图书馆网站公布,用户对馆藏资源的基本了解无须浏览信息对象本身,网站窗口的导航使得检索更为科学,便捷。
3.解决数字图书馆系统互操作问题
所谓元数据的互操作性问题是指多个元数据格式描述的数字化信息资源体系之间的透明检索以及多个不同的元数据格式的解读、转换。由于多种元数据格式在不同乃至相同领域,资源描述、检索和利用时,不同元数据格式描述的资源体系就出现了元数据互操作的问题。DC元数据是一种结构化的元数据,不依赖具体编码方法,任一元素的是独立描述,与任何传输结构之间无必然联系,充当一种交换格式,解决数字图书馆系统互操作问题。
4.数字图书馆数据库的设计与维护
数字图书馆数据库的设计,需要元数据的搜集,该过程中设计人员需要对数据来源系统的逻辑模型、物理结构以及业务规则等进行详细查看。元数据搜集的相关信息,在数字图书馆数据库的设计和维护工作中,不仅便于设计人员随时查阅,更有利于数据库的管理人员对数据库全貌的掌握及数据变更情况的了解,为数据库数据的准确性和完整性提高保障。
5.管理数字图书馆用户
用户资源信息是不仅包含了用户的身份、年龄、性别、兴趣,更是用户对图书馆利用情况的直观体现。通过元数据对用户信息资源进行描述,建立数据模型,管理数字图书馆用户,对用户服务,图书馆信息采集都起到一定指导作用。
(二)DC元数据在数字图书馆应用中存在的问题
随着DC元数据模式在国内外图书馆界的应用研究的不断开展和深入研究,DC元数据在数字图书馆建设中取得一定成绩的同时也迎来了新的挑战。其中,中文元数据标准化以及元数据实施的架构是主要问题,详细介绍如下:
1.中文元数据标准化的问题
我国数字化图书馆建设中,大多采用的元数据体系是国际上应用广泛且技术成熟的元数据体系。我国实际应用要求与国际上常用扩展的巨大区别,出现了中文标准化问题。标准化工作在本地化应用方面作用尤为突出,标准化工作的好坏直接影响到元数据在不同领域的推广和使用。
2.元数据实施的架构问题
由于应用系统本身对不同元数据格式尤其是MARC复杂元数据格式的支持不足,在元数据装载入系统时,全部转化为DC元数据。因不同元数据定义的非对称性,所有元数据转化为DC元数据过程中容易造成语义概念上的不恰当伸缩,信息丢失,歧义等,同时使得为用户提供的检索服务功能受到一定限制。故而,所有元数据都装入应用系统是最为理想的状态,进行多库检索的转换被放置到系统之外,满足了用户检索界面与服务的统一的同时,使得用户的选择更为多样化,数据挖掘服务的提供也更加到位。
我国数字图书馆建设过程中DC元数据的规范要从加强DC元数据的宣传和普及,培养研究人员,加强国际合作,提高研发能力,加大数字图书馆标准和规范研究的力度,推进中国数字图书馆标准规范建设等几个方面进行。
(一)加强DC元数据的宣传和普及,培养专业研究人员
数字图书馆是DC元数据的主要应用领域,真正熟悉和了解DC元数据的专业人员十分有限,远远无法满足数字图书馆的发展需求。专业人员不足,势必会对数字图书馆的建设的质量带来不利影响。加强DC元数据的宣传和普及,培养专业研究人员是提高我国数字图书馆建设质量水平的前提。
(二)加强国际合作,提高研发能力
积极参加相关国际会议及研讨会,通过参与数字图书馆研究项目的国际合作广泛培养、锻炼人才。每一个国际会议的研讨主题都是国内同行学习提高的机会,每一次国际合作都是培养和锻炼人才的途径。参与者对各国数字图书馆建设的成果取长补短,研究出最适合的成果并应用到数字图书馆建设中,进而促进我国数字图书馆的建设。另一方面,为了培养更多元数据研究人才,定期进行专家讲座及培训班。
(三)加大数字图书馆标准和规范研究的力度
我国数字图书馆标准规范的研究应该引入国际数字图书馆标准规范建设的成果,集中国内DC元数据研究专家的优势,将之本地化并应用到我国数字图书馆建设的实践中。经过数十年的应用研究,我国也培养了一批满足本地化实践的DC元数据研究专家,充分发挥专家优势,紧跟国际数字图书馆建设发展的前沿,实现我国数字图书馆标准规范建设的全球化和国际化。另一方面,相关研究人员依据DCMI元数据术语的最新版本,将之应用到我国数字图书馆标准规范体系中,在数字图书馆建设中充分发挥指导作用。
(四)推进我国数字图书馆标准规范建设
推进我国数字图书馆标准规范建设要扩展参加人员的范围。目前,我国数字图书馆标准规范建设方面中国高等教育文献保障系统、中国国家图书馆以及中国科学院图书馆等机构已经制定了长期合作,并取得了一定的成果,但是,DC元数据的标准研究不能固守图书馆领域,广泛吸纳社会各界专家的建议才能真正意义上推进我国数字图书馆规范建设。
[1].徐长林,杨玲,李艳菊.高校图书馆与大学校园文化建设探析[J].图书馆理论与实践,2010,(3):79-81.
[2].龚永红.DC元数据及其在数字图书馆建设中的应用[J].科技情报开发与经济,2010,20(31):78-79.
[3].高惠荣,孙晓玫.元数据及其在数字图书馆发展中的作用[J].图书情报工作,2012(1):170-172.
责任编校:于吉瑞
G250.76
A
1009-8534(2017)01-0104-02
殷福兴,贵州省图书馆馆员,硕士。研究方向:图书信息技术及数据库研究。