数字化信息资源的质量管理

2014-02-12 08:09
图书馆学刊 2014年1期
关键词:文献数字化资源

景 婷

(辽宁师范大学管理学院,辽宁 大连 116029)

1 引言

数字化信息资源的质量管理与控制从宏观角度来说,是国家和政府制定一系列方针、政策,保护和制约信息资源数字化建设的过程;从微观角度来说,是工作人员在信息资源数字化生产过程中为了达到数字化信息资源的质量要求而采取的一系列技术、方法和活动。数字化信息资源的质量管理与控制是信息资源建设中最重要的环节,它的质量问题是伴随数字化建设的生产流程而产生的,通过对数字化建设过程中可能产生的所有质量要素进行分析,对各种要素进行合理的规划,针对不同阶段、不同质量要素采用与其相应的技术及管理手段加以控制和管理,最大限度地减少错误,可以保证数字化信息资源的质量。所以把质量控制与管理机制引入信息资源数字化建设过程中,对数字化资源生产能起到积极的作用,具有一定的现实意义。

2 数字化信息资源质量管理的必要性

2.1 时空虚拟化、对象不确定

传统质量控制是在时间、空间和约束边界相对确定的系统中进行有秩序的管理控制,确定系统质量控制的范围是哪些、控制程序从何时、何处进行等。对信息质量可以通过追溯发生问题的时间、地点等要素来追踪信息质量问题根源并采取有效措施加以解决[1]。数字化信息资源可以使不同的用户在不同的时间、不同的地点共同利用信息资源,但这种时空的虚拟化和对象的不确定性,使得传统文献资源质量管理方法不适用于数字化信息资源的管理。

2.2 时效性强、扩散快

数字化信息资源通过网络环境具有很强的影响范围,传播速度快,动态性强,更新快,如果不能迅速对这些信息进行修复补救可能会造成很大的损失,这样使得数字化信息资源的质量管理和控制难度加大。

2.3 角色重合

传统的信息资源质量管理和控制是根据信息提供者和信息使用者的角色不同、职责不同而各究其责,而在网络的虚拟环境下,信息提供者也可以同时是信息使用者,造成角色重合,很难区分,在进行质量维护时,责任难以明确。

2.4 质量标准不统一

传统的信息资源质量管理体系中,对象具有相对稳定性,管理标准一致,而数字化信息资源没有统一的质量标准,每个细节都由每个机构自己完成和把关,所以数字化的质量参差不齐。

总之,传统的信息质量管理方法在网络信息共享环境下已不适用,这就需要我们认真把握数字化信息资源的质量要求,才能为采取有效的质量管理措施提供新的思路。

3 数字化信息资源质量的要求

信息资源的4个要素是信息内容、信息表达形式、信息资源系统、信息资源效用。从这个角度来讲,数字化的信息资源质量要求在内容、表达形式、资源系统、效用等方面进行管理和控制,满足这4个方面的质量要求,就可以实现对数字化信息资源的长期保存,满足用户的信息需求,实现信息的良好利用和共享。

3.1 信息内容方面的质量要求

内容方面的质量要求是基础,它强调数字化信息资源的完整性、正确性、真实性、相关性、新颖性、健康性。完整性是指电子文件的内容、背景信息等无缺损;正确性是指反映事物或者系统属性的客观程度;真实性是指电子文件的内容、结构和背景信息进行鉴定后,确认其与形成时的原始状况一致[2];相关性是指数字化信息资源与用户需求间的匹配程度;新颖性是指数字化信息资源是否具有独创性,更新是否及时[3];健康性是指信息内容积极向上,不涉及违法、不道德的内容。

3.2 信息表达形式方面的质量要求

信息资源是需要通过表达进行传递和共享的,信息资源表达形式要求准确性、易用性、精简性、标准化程度。准确性是指被保存文献所表达的信息与文献最初所含信息在质和量上完全吻合;易用性是指信息符号是否简单、是否方便使用;精简性是指信息符号是否简单明了;标准化程度是指信息表达技术、表达符号的形式和意义的统一程度。

3.3 信息资源系统方面的质量要求

信息资源系统方面的质量要求是指对内容质量的保证,它包括存储系统的可靠性、载体的完好性、载体的兼容性。可靠性包括系统的稳定性和安全性,即系统可用的有效状态和防御风险的能力,不因偶然的或恶意的原因而遭到破坏、更改、泄露等;完好性是存储信息的载体本身的结构、功能良好;兼容性是指载体可以在不同的软件或硬件上相互匹配,并能稳定工作。

3.4 信息资源效用方面的质量要求

信息资源效用是对信息资源的利用评估,对其质量要求包括可用性、适量性、利用率、价值增值率;可用性是指用户获取信息资源的难度、效率和方便性;适量性是指信息资源数量是否适当;利用率是指统计分析信息资源利用的数量指标;价值增值率是指经济效益和社会效益的总和。

4 影响数字化信息资源质量的因素

4.1 人为原因

人为使文献信息在数字化过程中出现错误是经常发生的,这种错误是可避免的,但是由于人的能力和精力有限,在作业时会出现一些失误,而自己没有发觉或者意识到。还有一种人为错误的可能性是工作人员工作态度不认真,缺乏责任心,没有按照规定的要求或者标准工作而造成数字化过程中的错误,这种错误是不能容忍的。由于原文献也是人工著作,由人工检验发表的,所以在数字化过程中,很可能把原文献中的错误直接带入数字化的信息资源中,这种错误需要专业人员识别并改正。

由于人为原因而导致的数字化信息质量问题,在数据大规模形成后不易识别,查找起来费时费力,这样有时会导致数字化后的信息没有使用价值,甚至会付出比较昂贵的代价。

4.2 机器原因

机器在信息数字化过程中产生的错误是不可避免的,有一定的错误率。这是由于在使用过程中不清楚软硬件的限制因素,或使用了不合适的设备。比如在对文献信息进行扫描时,不同的扫描软件或扫描设备其结果很可能不同。又如会出现标题缺失、信息乱码、信息串行、信息模糊不清等问题,因而导致数字化信息质量不符合标准。再如存储设备在出现故障时,存储的信息大量丢失,这样也造成了严重的后果。

4.3 技术原因

文献信息在进行数字化时,需要多媒体技术、信息录入技术、压缩技术、存储技术、互联网技术等技术的支持,而这些技术的因素也会导致数字化信息的质量问题。比如,压缩技术有无损压缩和有损压缩两种,而大部分使用的是有损压缩,有损压缩会导致部分信息丢失,解压后数字化信息不同于原始的信息。对于非常重要的信息使用有损压缩存在一定的风险。即使是无损压缩也会出现信息不真实的可能性。再如,存储技术需要将所有有用的数字化信息进行保存,而新旧技术更替过程中,信息需要转移,这时会出现不可兼容的问题,而导致信息丢失。在信息传输过程中,需要网络的支持,而网络有时也是不稳定的,容易出现信号不好,或者病毒,甚至有人会截取、窃听信息,这样接受者所接收的信息则不是完整的、准确的、真实的信息。

5 数字化信息资源的质量管理和控制

5.1 微观角度的管理和控制

以上问题都是在信息数字化过程中出现的而导致信息质量下降,通过对信息数字化整个过程进行控制和管理,尽量减少数字化过程中出现的错误和失误,才能保证数字化信息资源的质量,更好地为用户服务。

优化数字化生产流程能最大限度地利用信息资源,提高生产效率,降低文献数字化的单位成本,优化生产流程是在一定时间和成本支出内获得最大产出的一种方法[5]。这是数字化信息质量的最有效保障。

5.1.1 采集过程的管理和控制

对信息源进行选择和采集是一项很浩大的工程,但是这项工程的意义很重大,选择积极向上的、健康的、有意义的、有价值的信息进行数字化,既可以避免浪费人力、物力、财力,又可以满足用户需求。

在对无限的信息源进行选择和采集时,首先要考虑大众用户的信息需求,选择高价值的文献,即长期具有使用价值的文献信息,主要从内容上评价是否具有科学性、现实性和参考性[6];其次要考虑其文化价值,选择有学术价值、艺术价值的信息进行数字化,能够发挥社会教育、传递科学知识、开发智力资源的文献信息;再次要考虑新颖性,通过网络向大众传递最新的新闻动态、知识进展、科学发展等知识;最后还要考虑历史价值和保存价值,将原有的古籍资源进行数字化,既可以保护古籍不再受损害,也可以使古籍资源得到充分利用和共享。

信息采集过程可以采用问卷调查、实地调查等方法,在选择和采集完成后反馈用户的满意度,这样在不断的反复过程中确定最后要进行数字化的文献信息。

5.1.2 处理过程的管理和控制

信息处理即对文献信息进行数字化的过程,在此过程中,需要软、硬件的支持,硬件包括扫描仪、数码照相机、摄像机等有关设备,以及连接这些设备和仪器的计算机网络基础设施。各种设备的型号不同,功能和用途也不同,其结果也不同,而且当时的气候、光照、温度等自然条件也影响着设备的工作效率,所以在选择硬件时,要选择合适的设备,尽量避免错误的发生。软件包括图像生成软件、质量控制软件等。同样的功能不同的软件完成的效果也不同,有些免费的软件则不能保证质量,因此在选择软件时也要慎重。

工作人员在利用软、硬件进行数字化时,可以运用纠错仪器或者纠错软件对其进行自动检验。一般自动检验通过检查是否连续、有无断点来检测出有无信息缺失、信息乱码等现象,对于错别字、信息重复、信息串行则不容易检测出来。这种自动化的质量控制给人们带来了不少便利,但是仍有很多问题、错误是电脑检测不出来的,还需要人工把关。工作人员的人工检查可作为自动检查的补充,查找自动检测不到的错误,避免重复。

5.1.3 储存过程的管理和控制

对数字化信息资源质量的严格要求是数字化信息资源持久保存的保证,对数字化信息资源的全面质量管理的关键就是确保那些存档的数字化信息资源是可访问的,其内容没有受损,存储的载体和计算机的软硬件环境可使用性等[7]。数字化信息资源虽然存储所占的空间小,但是对其存储系统的维护则相对复杂。由于计算机的相关软件和硬件处在网络环境下,网络是个不稳定的虚拟空间,容易受到攻击、破坏,同样被保存在计算机中的信息也会受到损坏。所以这些信息需要备份,以避免人为破坏而导致信息丢失。维护人员还需要经常对系统进行检查,以便及时对破坏行为进行制止。

对存储在计算机或者其他设备中的信息资源,还要避免重复问题,这就需要查重软件来帮助剔除重复的信息资源,以使信息资源更有效地保存。

5.1.4 传递过程的管理和控制

数字化的信息资源是通过网络向用户传递的,为了可以让不同的用户通过统一的接口安全访问信息资源,实现系统的无缝链接和优质服务,需先进行用户认证。通过安全认证软件对用户的辨别,用户获得利用数字化信息资源的权限。

传递过程还需要对网络环境进行安全检测,这样既保证了用户安全地利用信息资源,也保护了信息资源的完整性。

5.1.5 反馈过程的管理和控制

反馈管理和控制是在信息资源数字化生产过程的各个环节进行人工检验和自动检验,自动检验为主,人工检验为辅,将转换后的数字化信息与原文献进行比较,发现错误和偏差所在并找出原因,予以纠正。这一过程将不断提升数字化信息资源的质量,保证信息资源的使用和共享效果,有效提高产品服务质量。

5.2 宏观角度的管理和控制

微观上,要对信息资源数字化的各个环节进行把关,保证数字化信息资源的质量。但是只从微观角度对数字化信息资源的质量进行管理和控制是远远不够的,还需要从宏观角度对信息资源的质量进行规定。

①制定相关的法律、政策来保护数字化信息资源,避免信息资源遭到恶意的破坏和攻击。

②像传统文献信息资源一样,制定一系列有关数字化信息资源质量的标准、要求、原则,使工作人员有据可依。

③明确规定质量工作人员的权利和义务,调动他们的工作积极性,对管理工作认真负责。

④制定大众监督和反馈政策,用户质量监督从一定角度来讲是对服务质量的监督,也是对数字化信息资源质量反馈的过程,通过用户的监督与评价,提高数字化信息资源的质量,提高用户的满意度。

⑤制定人才引进计划,把引进的人才配置到合理的岗位,同时对人员加强培训,不断提高专业人员和管理人员的素质和水平。

⑥不同的机构相互协作共建,这样既可以避免对文献信息重复数字化,也可以提高数字化信息资源的质量。

⑦建立专门的质量检测机构,最终的数字化结果都由此机构进行检验,可采用抽检的方式进行把关。

⑧鼓励新技术的创新,并将其应用到数字化领域,使机器运行得更加准确。

6 结语

数字化信息作为一种资源,在信息社会是一种重要的资产和财富,网络环境下的数字化信息资源质量管理,要通过宏观层面的整体规划和控制,通过政策调控,法规保障,应用先进的信息技术等方法来改善数字化信息资源的质量,实现数字化信息资源的价值。

[1] 肖琬荣.信息资源数字化建设质量控制研究[J].图书与情报,2010(5):81-84.

[2] 宋立荣.基于网络信息共享的信息质量管理的认识[J].科技管理研究,2011(9):176-179.

[3] 张美芳.长期存储的数字信息质量控制的研究[J].档案学通讯,2011(1):81-84.

[4] 查先进,陈明红.信息资源质量评估研究[J].中国图书馆学报,2010(36):46-55.

[5] 李伟超,朱学芳.信息资源数字化生产质量控制研究[J].情报理论与实践,2009(4):63-65.

[6] 葛敏.关于数字图书馆信息资源建设的几点思考[J].河南图书馆学刊,2001(21):20-23.

[7] 陈定权.电子文献及电子文献全面质量管理[J].图书馆论坛,2006(26):111-113.

猜你喜欢
文献数字化资源
基础教育资源展示
Hostile takeovers in China and Japan
家纺业亟待数字化赋能
一样的资源,不一样的收获
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
资源回收
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
资源再生 欢迎订阅