李慧芳
摘要:开放科学数据已经成为大数据时代重要的信息资源类型,高校图书馆应当为用户开展开放科学数据服务。本文论述了科学数据及其开放获取,我国的开放科学数据资源,以及高校图书馆开放科学数据服务的优势,并对高校图书馆开放科学数据服务的8种类型,即高校图书馆开放科学数据的检索服务、发现服务、申请服务、获取服务、管理服务、关联服务、传递服务和存储服务等进行探析。
关键词:开放科学数据:大数据;高校图书馆:知识服务:开放获取
1 科学数据及其开放获取
1.1 科学数据解读
随着互联网上各类数据的数量、类型、价值、速度以及人们对于数据价值挖掘的加速,大数据时代正在快步向我们走来。科学数据是人类社会在从事与科学和技术相关的各类活动,包括科学研究活动、教育教学活动、生产活动、管理活动、人类健康活动、生活活动等过程中所产生的基本数据、实验数据、试验数据、观测数据、探测数据、调查数据、资料数据等各类数值型、事实型和文字型的原始基本数据,以及按照不同的科研需求经过系统加工而生成的科学数据产品和相关的科学数据信息的总和。科学数据资源属于信息资源的范畴,与科研论文和其他各种类型的学术科研成果一样,它也是一种重要的科研成果产出。同时,它又是科学研究不可或缺的重要组成部分。近年来,科学数据的数量正在呈现指数级的增长态势。由于科学数据具有明显的现实价值、潜在价值和可再度开发利用价值,并在应用过程中使得科学数据信息资源得到增值,因此,它已经成为现代信息社会和大数据时代最基本、最活跃、影响范围越来越广泛的一种科技信息资源类型。
1.2 科学数据的开放获取
近10余年来,国际和国内以通过互联网免费全文获取各类信息资源为基本特征的开放获取运动取得了快速发展,开放获取发挥的重要作用激发了科研人员对除学术期刊和学术论文以外其他类型信息资源也要开放获取的需求。因为科研人员希望真正的开放获取不仅是对文献信息资源全文或原文的开放获取,还应该包括对相关科学数据的开放获取,而这也恰好吻合了大数据时代到来的步伐。而来自于国家政府、科研机构、研究基金组织、各专业学会和协会,以及期刊出版联盟组织在内的政策推进,则成为推动科学数据进入开放共享行列的动力。正是上述机构陆续出台的开放科学数据的管理政策、开放政策、资源共享政策.加速促进了科学数据的开放保存、开放访问和开放利用。科学数据的开放共享会营造出更为丰富的开放科学数据环境,使科研人员能够轻松地发布、发现、访问、下载获取和使用开放科学数据资源。由此一来,科学数据开放获取的基础环境正在日益形成,为我国开放科学数据在更大范围内被开发和利用提供了坚实的资源保障。
2 我国的开放科学数据资源
2.1 我国的科学数据共享工程
为了增强我国的科技创新能力,提高我国科技的整体水平,使科技发展成为促进我国社会发展和经济发展的强劲动力,我国从国家层面实施了科学数据共享工程,其基本涵义就是提供开放科学数据资源,为确保我国到2020年实现全面建成小康社会的宏伟目标提供来自于科学数据的信息资源服务。我国的科学数据共享工程是国家科技创新体系建设的重要内容,也是我国科技发展基础条件服务平台的重要组成部分。科学数据共享工程实施以来,经过国家科技部和有关单位的共同努力,目前已经建成和相继启动了部分学科的科学数据共享平台。我国的科学数据共享工程目前主要是基础性科学数据资源和公益性科学数据资源的整合与开放共享服务,以后还会继续加强和完善后续各类开放科学数据资源的建设和服务工作。我国科学数据共享工程建设的总体目标,是构建国家科学数据管理与共享服务体系,制定和完善科学数据的共享政策、法规与标准体系,增强我国科学数据资源的积累,促进我国科学数据资源的信息增值。
2.2 开放科学数据资源体系
目前,我国通过科学数据共享工程,已经建立了初具规模的开放科学数据资源体系。该体系具有学科分类和地区分类相互配合、互为补充的特点。在大的学科分类方面,包括基础科学数据(如基础科学数据共享网)、天文学/地球科学数据(如气象、地震、国土资源、水文水资源、地质、寒区旱区科学数据中心)、生物科学数据、医药卫生数据(如国家人口与健康、公共卫生、基础医学、地理、中医药学、药学、临床医学科学数据中心)、农业科学数据(如农业、林业科学数据中心)、工业科学数据(如材料、先进制造与自动化科学数据共享网)、交通科学数据(如公路、铁路、水路、管路科学数据共享网)、航空航天科学数据(如航空、航天、空间数据库)、环境/安全科学数据(如环境、古环境、资源环境、安全科学数据库)。另外,还有按区域分类的开放科学数据。包括按地理区域分类的科学数据,如青藏高原科学数据共享平台、极地科学数据共享平台;按行政区划分类的科学数据,如省级的陕西省科学数据共享平台,市级的青岛市科学数据共享平台。
3 高校图书馆开放科学数据服务的优势
3.1 开放科学数据服务是高校图书馆知识服务的创新内容
高校图书馆是主要为本校的教学科研服务的学术性机构,作为信息资源和信息服务的重要提供者,可以进一步开拓信息服务领域,将开放科学数据服务作为一项新的知识服务创新内容。高校图书馆不仅可以开展开放科学数据的检索、发现、获取和管理服务,还可以开展开放科学数据的咨询、传递、存储等服务,从而促进科学数据的开放共享和开发再利用。不少高校图书馆长期以来对大学生开展了文献信息检索课程教育,在用户培训与用户信息使用行为的认知方面具有长期的经验、实践与研究,这也为开展用户科学数据素养培训打下了坚实的基础。显然,高校图书馆在为用户开展开放科学数据服务方面是具有先天优势的,在作为知识服务创新内容的开放科学数据服务方面也是可以大有作为的。
3.2 高校图书馆开放科学数据服务的优势
首先,高校图书馆具备专业的数据信息资源管理和组织能力,这是长期以来从对纸质文献信息资源的分类管理、整册管理、分卷管理、内容分析管理等不同层次的管理与组织开始就逐渐形成的职业专业能力。这种职业专业能力一直延续到对目前的数字文献信息资源的网络检索、下载获取、开放传送、开放存储等组织和管理中,并且这种职业专业能力一直在不断人发展和进步之中。因此,它成为高校图书馆具备专业的开放科学数据信息资源管理和组织能力的基础。其次,高校图书馆拥有一支长期与本校各院系保持稳定联系的专业学科馆员队伍,他们对于自己所对口服务的学科专业教育教学所需要的开放科学数据的内容是相当熟悉的。因此,在为用户提供专业对口性很强的开放科学数据资源服务时,他们会在选择开放科学数据资源的内容和类型方面具有很强的专业吻合度和教育教学适应性,可以大大提高利用开放科学数据资源为教育教学服务的质量和水平。
4 高校图书馆开放科学数据服务的类型
4.1 检索服务
高校图书馆为了给用户提供所需要的具有针对性的开放科学数据资源,必须首先对开放科学数据资源进行检索,这是高校图书馆最为熟悉的职业专业技术能力之一。这不仅是由于高校图书馆长期以来就是以文献信息资源的检索作为主要服务方式,还因为目前约有1/3的高校图书馆一直在为本校的大学生开设文献信息资源检索课程。因此,高校图书馆为用户开展对于开放科学数据资源的检索服务,可谓是轻车熟路的服务项目。尽管如此,毕竟开放科学数据资源与其他文献信息资源类型的特点和特征有所不同,所以,高校图书馆在为用户开展开放科学数据资源检索服务的过程中,需要不断地学习、研究、总结和提高,以满足用户对于开放科学数据资源的各类信息需求。
4.2 发现服务
高校图书馆可以利用自己所掌握的与开放科学数据相关的信息资源检索和获取方面的技术优势,对互联网上已经存在的与本校学科专业相关的,或者是用户特定需要的开放科学数据资源,进行有效地检索、分类、组织、整合、传送、存储和链接,形成为本校学科专业教学和科研服务的开放科学数据资源集合体系。并在此基础上,为用户提供开放科学数据资源的发现服务,用以增加对开放科学数据资源的访问量和利用率。这样可以使本校用户通过高校图书馆的网站,更容易发现所需要类别和内容的开放科学数据资源,从而为进一步地下载获取和有效利用开放科学数据资源提供基础。
4.3 申请服务
如果用户不能通过相关的开放科学数据网站直接查询或下载所需要的开放科学数据资源,或者是由于所需要下载获取的科学数据资源量过于巨大,用户自己不方便通过开放科学数据网站查询或下载,可以向高校图书馆提出申请。高校图书馆的开放科学数据服务人员将会对用户所提交的科学数据申请进行处理,并将处理结果及时反馈给用户。用户向图书馆提出的所有开放科学数据的申请信息,将会存储到高校图书馆网站的用户空间或用户信息反馈中。用户通过登录进入空间或通过图书馆的用户信息反馈,即可查询到所申请开放科学数据的相关信息或资源信息,亦或是图书馆所答复的相关信息,从而最终满足用户的开放科学数据资源申请服务。
4.4 获取服务
一般来讲,开放科学数据资源由于具有免费全文开放的性质,所以其获取也是完全开放的,基本上不存在获取方面的障碍。但是,对于较为全面的开放科学数据资源的获取方式,用户尚未全面而准确地掌握。因此,高校图书馆需要强化对用户的开放科学数据资源获取服务。另外,也有部分开放科学数据资源由于受到各种主客观因素的制约,当部分用户获取时会出现一定程度的获取障碍。这些障碍主要来自于开放科学数据资源的提供者制定了相应的开放获取限制条件。这些开放获取限制条件可有多种,如用户需要注册和登录,下载获取时需要一定数量的积分或虚拟充值,需要使用特定的下载获取工具软件等。此时,高校图书馆可以利用所掌握的技术优势,为用户提供这类开放科学数据资源的无障碍下载获取服务。
4.5 管理服务
高校图书馆对于所掌握的大量各类开放科学数据资源,需要通过一定的技术手段予以科学有效地管理,才能够实现开放科学数据资源价值的更好发挥和有效利用,也才能够为用户提供更好的开放科学数据的管理服务。高校图书馆开放科学数据管理服务的内容包括数据资源分类、数据资源验证、数据资源整合、数据资源平台建设、数据资源链接、数据资源维护、数据资源更新、数据资源使用反馈等多方面。高校图书馆在为用户开展开放科学数据管理服务时,可以借鉴如复旦大学的开放科学数据管理服务,以及武汉大学图书馆开放科学数据服务的经验,再融入本地特色并进行优化,最终就可以为用户提供优质的开放科学数据资源的管理服务。
4.6 关联服务
由于在各类文献的内容中往往会涉及到与科学数据之间的密切关联,所以,高校图书馆可以据此为用户开展开放科学数据与文献的关联服务。关于文献与科学数据的关联问题,84%以上的科学家认为将科学数据与学术论文进行关联是有用的,这是根据欧盟的最近研究显示的结果。目前文献与科学数据之间关联服务的主要内容是从文献单方向关联数据的,即包括从文章链接到数据,或从论文链接到数据集等。在科学数据的关联服务方面,高校图书馆可以与相关的机构和团体进行合作,积极实现开放科学数据与文献之间的整合,以互动的方式来展现开放科学数据,建立起开放科学数据和文献之间链接和引用的桥梁,用以提高开放科学数据的可检索性、易发现性、可解释性和重新使用性。
4.7 传递服务
高校图书馆可以利用所掌握的各类开放科学数据资源为用户提供资源的传递服务。因为开放科学数据只有在传递和流通运动的过程中,才能更好地实现它的现实价值和利用价值,也便于显现它的潜在价值和再利用价值。开放科学数据的传递服务,主要是指为大宗的数据用户或者为特殊的数据用户提供的开放科学数据服务方式。高校图书馆提供科学数据传递服务,主要是用户出于各种原因不方便自己直接下载获取所需要的开放科学数据,例如网络连接受限、数据量过大,或用户有其他特殊要求等,高校图书馆就可以采用电子邮箱、网络电话、网络硬盘等多种方式为用户提供开放科学数据的传递服务。
4.8 存储服务
现在已经有越来越多的高校和研究机构开始建立将开放科学数据予以存档的仓储库,也有越来越多的学术期刊出版物开始建议或者强制作者在公共仓储库中提交所发表学术论文中所涉及到的科学数据。由于学科、专业和数据量的庞杂,科学数据的存储库也是非常复杂的。对于用户来说,选择合适的科学数据仓储库变得更加困难。因此,高校图书馆可以根据用户需求,为其提供开放科学数据资源的存储服务。对于用户认为重要的、具有长期或永久保存价值的开放科学数据资源,高校图书馆可以采用网络硬盘、电子邮箱、资源仓储库等多种方式用户提供开放存储服务。
5 小结
随着大数据时代的发展,高校图书馆在为用户服务的项目上又产生了开放科学数据服务的新内容。开放科学数据服务不仅可以使高校图书馆为教学和科研提供更为有力的数据资源保障,而且可以有力地推动高校图书馆的知识创新服务进程。同时,也更符合国内外开放获取文献资源体系建设与完善的需求。