胡伶霞
(湖北工业大学工程技术学院图书馆 湖北 武汉 430068)
E-Science环境下高校图书馆对科研数据的质量控制研究
胡伶霞
(湖北工业大学工程技术学院图书馆 湖北 武汉 430068)
研究了E-Science环境下高校图书馆对科研数据的质量控制。通过分析发现 E-Science环境对于数据信息处理的规范性和功能性有着很大的作用,结合高校图书馆对科研数据质量控制的缺失提出了E-Science环境下高校图书馆对科研数据的质量控制要素,最后提出了E-Science环境下高校图书馆对科研数据的质量控制策略。
E-Science环境;科研数据;质量控制;高校图书馆
科研信息化(E-Science)概念的提出在数据分析、整合、处理上为人们提供了不同层面的理解,其有效的为数据信息的处理提供了标准化、规范化和效率化的支撑,为技术层面的变革构建了发展环境[1]。习近平总书记在中国科学院考察工作时强调了科技兴则民族兴,科技强则国家强,要结合实际坚持运用我国科技事业发展经验,积极回应经济社会发展对科技发展提出的新要求,深化科技体制改革,增强科技创新活力,集中力量推进科技创新,真正把创新驱动发展战略落到实处。而高校图书馆也需要领会总书记精神,加强科研数据质量控制,充分利用好E-Science环境下的数据信息作业可以使信息传播更为便捷[2]。因此,有必要就E-Science的功能内涵做出分析,从而推动高校图书馆更好地对科研数据的质量进行控制。
E-Science颠覆了传统信息数据的管理模式,为信息数据的管理提供了更直接和具体的管理环境,根据不同的需求可以进行交互式的匹配,在数据整合交互过程中能够实现精准的检索、归类和辨别。因此,一经推出便在各领域中得到了推广应用。
1.1 E-Science的起源与发展
2000年,E-Science的概念在英国被首次提出,其针对于各领域科研数据复杂化来建立良好的工作环境,并将新一代网络技术结合现实需求重新架构和部署,通过广域分布式高性能计算环境来为科学研究提供支撑,短短十几年的探索,就被世界各科研领域广泛应用。随着不断的发展,E-Science环境部署也越发的成熟,针对六大学科的科学研究和各领域的应用已经十分的深入,不但将多学科科研数据进行了关联性的操作,而且在“科学数据管理服务”中对于质量控制的要求也呈现一种精准化的发展趋势,在高校图书馆也得以发挥其效能[3]。
1.2 E-Science带来的变革
E-Science改变了传统的数据共享模式,将数据的联动性、系统性从其假设的工作环境中引出,为数据的使用提供了分区和分类的具体功能,在科研领域中的应用发展十分迅速,支持科学家改变传统的固化工作方式,将不同学科的科研数据有效的整合,可以说不同领域的科研信息可以在同一个环境中进行匹配,这样能够保证科研项目在原有工作的基础上得到延伸,从而为跨领域的科学研究提供了更多的可能,如计算机学科与其他学科的联动、生物学和生态环境之间的联动等,这类交叉学科问题能够在E-Science中展开,对于科研数据的关联性也会随之提供,从而为科学研究的推进提供了有效的支撑。
1.3 E-Science的实践方向
E-Science的应用实践主要存在于科研领域之中,能够有效的建立一种数据的联动和使用环境,在E-Science中对于数据的处理应用效果得到了人们的认证,其中对于科研数据的整合、交互和综合管理都能够满足现实需求。目前涉及到的领域主要包含六大基础学科门类,如光学、理学、地学、环境和生态等领域中的应用已逐渐得到证实。现阶段,高校图书馆的科研数据管理同样在E-Science环境中得到了应用,为各学科研究提供了数据交互、整合及联动,有效地为各领域的科研提供了数据匹配。
高校图书馆对科研数据的质量控制在现阶段多采用传统的计算机存储和数据分析方式,造成了很多无用、无分类的科研信息在其中,在检索和使用过程中效率十分低下,尽管大多数科研机构都建有科研基础数据资源管理平台,但是和高校图书馆进行数据匹配和交互过程中难以实现高契合度,很多时候需要人工来进行辨别,难以满足现实需求[4]。
2.1 科研数据实用性不足难以满足现实需求
现阶段,高校图书馆的科研数据实用性不足,很多高校的图书馆在常规的科研数据管理模式下,忽视了数据的质量控制,往往都是沿用收集——发布这样直接的模式,缺乏对于科研数据的分析、整理过程,很多科学数据在共享过程中需要进行重复的筛选和进行人工记录,不能够采用更为便捷的方式来提高科研数据的实用性。邢文明(2013)等人在世界排名前50高校调查显示,国内如北京大学、清华大学这样的高校在科研数据的管理上体量足够,但是科研数据的实用性不足,一些无用的科研数据需要通过人工筛选来进行识别,降低了科研数据的使用效率,这种质量层面的缺失难以为科研提供有力支撑[5]。
2.2 科研数据规范性不足导致使用效度下降
高校图书馆的科研数据规范性不足以为科学研究提供高质、高效的相关服务,在数据归集、整理、分析、分类的过程中不能够匹配科学数据的使用,往往在不同类别中的关联度设置不清晰,有时甚至是不同类别的科研数据中包含同一类别的相关信息,导致了质量控制十分的被动,很多时候都是通过用户的体验来反馈到数据中心进行纠错,这种规范性的不足降低了科研数据的整体使用效度。刘杰(2016)通过问卷调查的方式,在170份问卷统计分析后发现,高校图书馆的工作人员仅仅是将科研数据收集和共享,并不考虑数据的规范性,很多科研数据的归集和整理可谓是“杂乱无章”,用户在使用上十分的不方便,致使数据的后续交互使用不足以满足快捷、高效的使用需求[6]。
2.3 科研数据共享性不足引发资源体量不够
高校图书馆的科研数据是根据时间、空间和关联属性来决定体量,单一学校的馆藏文献、研究基础数据和相关科研更新毕竟不能够满足不断发展的学术需求,这就需要在科研数据的共享性上进行分析。研究发现(2015大学图书馆环境扫描报告)多数高校图书馆从技术层面和管理层面上对之不能够有效的实施,在科研数据的共享上拓展的领域和范围不够,很多学校仅限于在其所属地域、机构范围内的数据进行整合,这在很大程度上制约了科研数据的体量发展,导致了很多学校的科研数据都存在着“闭门造车”的现象,难以实现科研数据资源的整合,更不能够保证数据的准确性和及时性,这种数据共享机制的缺失是高校图书馆科研数据质量控制所面临的难题之一,亟待解决。
E-Science环境下的高校图书馆科研数据质量控制需要精准的定位、功能实现和模式确定,只有契合到综合管理体系中的质量控制才能够有效的为科研提供良好的数据支撑。在科研数据的质量控制过程中,如下图(图1)所示,需要就需求主体的动态变化匹配到质量管理体系之中,只有营造良好的科研数据环境才能够保证上述功能的实现。因此,E-Science环境部署来实现质量控制的增强上不但要从功能和模式上进行革新,同样在质量控制的定位上也要结合图书馆自身的能力来具体实现。
3.1质量控制的模式确定
在E-Science环境下,高校图书馆科研数据的质量控制提供了强大的科学数据处理能力,针对科研数据的类别可以进行归集、检索和关联性分析并实现完善的质量控制体系,将科研数据的生命周期和内容进行全方面的综合管控,保证科研数据是在动态灵活更新下能够匹配到使用需求。具体的模式是检索-归集-分析-处理-分类-匹配-复核-归档-应用,整体的质量控制遵循上述的流程模式势必能够保证数据处理能力得到质的提升,统一、规范的管理能够有效针对数据信息做出客观判定,而数据处理的方式也会随着模式的不断优化而更加专业,这也是E-Science环境所提供的软件支撑能够为高校图书馆提高科研数据的准确性和有效性的具体表现。
图1 E-Science环境下高校图书馆科研数据的质量控制要素
3.2 质量控制的功能确立
在质量控制的过程中,并不是一味的去校对数据的准确性和及时性,在E-Science环境中在数据归集和整理阶段便能够动态的将数据进行筛选,这也是从功能性上分析能够保证实现的。高校图书馆往往过度追求科研数据最终使用阶段的效度,而忽略了E-Science环境下的功能确立,长此以往会造成科研数据出现断点和缺失。因此,在科研数据质量控制过程中要保证模块功能匹配到最终的科研数据使用效度之上,从最初的科研数据更新到最终的归档使用上,每一个环节独立出来数据整合算法,在数据入口上保证标准化、规范化的数据整合模式,而数据出口上设置复核自检的模块,这样能够从整体上为科研数据的质量管理提供了可持续性发展的空间,最终保证质量管理能够更契合目标。
3.3 质量控制的定位精准
在质量控制的定位上要结合高校图书馆的实际,如是否能够实现良好的E-Science环境架构和技术功能的具体实现,例如模糊检索、表单生成、动态更新和多媒体存储等,只有良好的自身定位才能够避免在架构阶段过于追求高性能的质量管理而缺乏“落地”的能力。另一方面,针对于不同领域的科研数据,需要采用差异化的质量控制体系,以内部开放式的环境来令科学信息共享成为现实。E-Science环境在新时期为高校的科研数据管理提供了发展的空间和环境,但是还需要进一步匹配现实需求来完善自身的体系模式,切忌因噎废食和“假大空”,只有结合自身实际来进行精准的定位才能够实现后续的发展。
E-Science环境能够为高校图书馆的科研数据管理提供强大的运营支持,针对于质量控制能够做到数据服务形式上的全面革新,如图2所示,不但做到了高质、高效的数据更新、分类、共享和交互,也能够有效的在大数据层面将科研数据的协同领域进行拓宽。但是目前E-Science环境的技术需求较高,高校图书馆在质量控制过程中一定要结合自身的实际情况来进行构建,确保科学数据的完整性、安全性和稳定性实现。
图2 E-Science环境下高校图书馆科研数据的质量控制策略
4.1 科研数据阶段性更新、内容层次清晰明了
E-Science环境为高校图书馆科研数据的质量控制提供了更为全面的功能实现环境,同时匹配了最为先进和多元化的科研数据分析和处理能力,高校图书馆能够有效的实现扩越式的数据整合及更新,这种更新体现在通过计算机功能和现有开发环境来设置功能时间节点,如天、周、月等时间的设置能够引入内、外部的科研数据来匹配现实数据进行分析和共享,通过这种阶段性的更新能够保证科研数据的时效性、准确性和功能性的不断增强。在E-Science环境中,高校图书馆的数据整合、分析和处理能力会根据现实情况进行优化和提高,增加了科研数据质量管理的整体效度,同时结合高校图书馆的现实需求可以灵活调整,例如对于某一学术领域科研数据可以重点进行管理,通过E-Science环境的开源设计能够有效地设置更为细化的功能性模块,从而提高该领域的科研数据分析能力和质量控制效度,这是未来科研数据精准化使用的发展趋势。
4.2 科研数据共享性实现、归集使用简单便捷
E-Science环境下的科研数据能够快速地实现不同终端之间的共享,整体的响应速度和匹配度都超过了传统共享模式,因此,得到了人们的一致认可。现阶段,我国高校图书馆对于科研数据质量控制的要求在不断增加,但是E-Science环境的部署能力和应用能力还不能够满足现实需求,很多高校的软、硬件能力无法匹配到共享空间之中,这就造成了数据共享的全面性不足,影响到数据的整体质量控制。在高校图书馆科研数据质量控制不断深入的情况下,E-Science环境的部署势必会逐渐地替代传统的技术环境,引入标准化、规范化、统一化的数据库和功能模块组来保证数据共享的准确性和使用效度,在数据关联程度逐渐深化的前提下,采用数据共享、交换、校对、替换和查新等多元化的质量控制,从而保证在规范性的前提下为数据库提供源源不断的信息支撑。
4.3 科研数据交互性提高、信息体量迅速增加
科研数据的质量控制过程中,需要信息的交互与整合更新才能够保证信息体量的迅速增加,在现有的计算机科学技术下,能够有效地通过数据媒体流的工作引擎来实现科研数据的快速归集。在E-Science环境下,数据库存在开源接口和可开发的数据共享模块,从而大幅度提高了科研信息归集的效率和动能,往往新建数据库在短短的几天内就能够实现科研数据的归集及整合,而通过质量控制体系的匹配后,能够进一步保证科研数据的准确和完整。例如,加拿大西安大略大学、芬兰阿尔托大学等的大学图书馆通过E-Science环境来设置了科研数据交互的接口,只要有相应地更新和变化就能够直接进行动态的质量控制和自主选择数据共享对象来进行科研数据的交替,这一模式也逐渐在我国高校图书馆尝试,而未来的发展趋势是能够实现全球化的科研数据整合及共享,同时通过大数据技术来实现数据的纠错及查新。
4.4 科研数据准确性保证、数据信息复核自检
众所周知,科研数据是否准确直接影响到科研的进度和成果。因此,高校图书馆势必要加强科研数据准确性来确保数据使用的整体效度。具体在实施阶段,科研数据的质量控制中需要纳入复核、复审的具体环节,根据高校图书馆软硬件条件来具体设置不同环节的质量控制节点,可以是数据归集阶段的质量控制,也可以是数据使用前的复核,这需要在E-Science环境下技能型相应的配置,从而确保科研数据能够有效地联通信息资源的复核自检功能。目前,中国科学技术大学、华中科技大学等重点高校对于科研数据的质量控制均实现了多功能节点的数据信息复核自检,通过专人管理数据中心的整合管理模式有效地保证了数据信息的准确度和实用性,在科研数据的归集、分析、提取、汇总过程中,均能够实现数据信息的复核自检及动态更新,确保了科研数据的真实有效。
综合分析来看,E-Science环境下高校图书馆科研数据的质量控制在现阶段的推行是必要且可行的。从E-Science环境中提取科研数据质量控制所需要的核心要素,针对科研数据实用性、规范性和共享性来建立综合管理的发展模式,从而提高科研数据的使用效度,进而令其在高质量的信息供给下能够满足多方面的现实需求,帮助高校图书馆在科研数据的整合、细分、使用与核验上来提高总体工作的顺滑度,从而实现科研数据的全面质量控制。尽管目前高校图书馆的E-Science环境构建并不完善,但是可以结合各院校的实际情况进行有针对性的布设和使用,将其模块化和系统化,匹配现有质量控制流程当中的环节节点来架设完善的质量服务体系并加以控制,这样才能够提高其功能的使用效度,为用户提供更为精准和完善的科研数据,最终实现全面的质量控制。
[1]毛玉容, 许春漫. E-science环境下高校图书馆科学数据馆员制度建设研究[J].图书馆学研究, 2016,(16):85-95.
[2]张颖. 基于大数据的数字图书馆信息服务模式研究[J].电脑与电信, 2016,(4):34-36.
[3]赵媛. Science2.0环境下高校图书馆虚拟科研社区的构建研究[J].河北科技图苑, 2016, 29(5):23-26.
[4]蔚海燕. 搜索、导航、数据、社区:高校图书馆学科服务的深化之路[J]. 图书情报知识, 2017,(1):56-66.
[5]孙咏洁. 高校图书馆科研成果数据库构建路径与对策[J]. 文教资料, 2016,(24):51-53.
[6]阿嘎尔,郭冬梅.数字科研环境下高校图书馆科学数据服务研究[J].农业图书情报学刊, 2016, 28(12):193-196.
Research on the Quality Control of Scientific Research Data of University Libraries under E“Science Environment
Hu ling-xia
The paper mainly studies the quality control of scientific research data of university libraries under the environment of e-Science. Through the analysis the author found that e-Science plays a significant role for the standardization and the functionality of data processing. Combining with the lack of quality control of scientific research data in university libraries, the author puts forward the factors and strategies of quality control of scientific research data in university libraries under e-Science environment.
E-Science Environment; Scientific Research Data; Quality Control; University Libraries
G251
A
10.13897/j.cnki.hbkjty.2017.0059
胡伶霞(1979-)女,硕士,武汉大学图书馆馆员,研究方向:图书馆管理、文献信息资源建设。
2017-03-23 责任编辑:张静茹)