数字科研环境下的信息资源建设

2015-02-13 12:40:27张红丽
医学信息学杂志 2015年8期
关键词:数字资源环境

郑 婧 张红丽

(中国医学科学院北京协和医院 北京 100730) (国家开放大学图书馆 北京 100039)



•医学信息组织与利用•

数字科研环境下的信息资源建设

郑 婧 张红丽

(中国医学科学院北京协和医院 北京 100730) (国家开放大学图书馆 北京 100039)

分析数字科研环境的新特点及该环境下科研用户的知识需求特点,阐述信息资源建设方向,即对各类科研信息资源进行综合集成与深度分析,通过构建机构知识库实现高效管理和资源共享,构筑融入式科研服务平台,支持以科研用户为中心的学术交流。

数字科研环境; 信息资源建设; 科研用户

1 引言

进入21世纪以来,世界各国特别是欧美等发达国家都将知识创新战略置于国家发展的制高点,加大了对信息资源和服务保障体系的建设和投入。与此同时,伴随着计算机、网络技术和通信技术的快速发展和应用,传统的科学研究方式得以改变,一个开放共享、安全可控、分布协同的新型研究环境——数字科研环境成为学界和业界共同关注的焦点。数字科研环境是信息时代科研环境和科研活动的典型体现,它使科学家能够利用更加先进的技术方法从事科学研究,也使得研究高度协作与资源高度共享的“大科学”时代初见端倪。

科研环境的变化给科研用户的研究工作带来了深远的影响, 进而影响到科研过程的方方面面。这种变化导致科研用户在研究过程中对信息资源的建设内容和获取方式等方面需求较之传统环境出现较大的差异。因此,需要重新分析科研用户知识需求的新特点,以指导信息服务机构的信息资源建设工作,从而更有效地满足这种需求。

2 数字科研环境下科研用户的知识需求

2.1 数字科研环境的新特点

2.1.1 科研过程数字化 数字科研环境中的各种信息资源已经逐步数字化,如各类学术论文、技术文档、大数据、学术报告、可开放获取资源等,形成较为系统的网络化数字化信息资源空间;同时,以计算机模拟、协同试验、移动试验、网格系统等为代表的信息技术从科研过程的辅助工具逐渐转变为科研过程的重要组成部分,实现与观测设备、试验仪器、参考数据等传统科研工具的有机整合,促使科研的组织和运作机制也逐步网络化。此外,功能多样的数据采集与处理工具、宏观及微观数字化科研管理系统等,又为科研用户组织科研工作全流程提供有力支持,使科学研究逐步信息化[11]。

2.1.2 计算机模拟等新科研方法日趋成熟 传统科研主要采用理论分析和试验观测等研究方法;而数字科研环境下,人员、仪器、信息、过程以及管理机制聚合到了同一数字空间,计算机模拟和仿真分析等新方法成为科研用户创造科研成果的新模式。在环境与大气科学、物理与天文科学、医学与生物、材料与工程,甚至社会科学等领域,计算机模拟与仿真已成为主要的研究手段。这种新方法不仅可以支撑或替代传统的试验手段,还能更精准地描述大尺度或微尺度的实体或事件,更细致地展现研究对象的状态组合或变化,使得研究人员可以从之前研究过程中的任一阶段继续进行研究,极大地增加了科学研究的灵活程度,扩大了科学研究的范围。

2.1.3 大数据成为新的科学研究起点 现代科研活动产生大量的科研数据,呈指数级速度增长[2]:在科研的准备阶段,数据可能来源于研究环境,例如采集的数据、各类仪器产生的数据,以及人员沟通交流产生的数据等;在正式研究阶段,也会产生形式多样的非正式数据和信息,例如人员沟通记录、研讨会会议内容、仿真试验结果、非正式研究报告、程序源代码和研究备注等。这些海量科研数据蕴藏着大量、尚未发现的内容、关系和规律,成为新的科学研究起点。科研用户可以通过信息过滤、内容析取、数据挖掘、可视化分析等技术,对大数据进行广泛、灵活和深入的分析,发现规律、发掘趋势、揭示未知、引导研究[3]。

2.1.4 学术交流模式呈现多元化趋势 传统科研环境的学术交流体系以正式交流过程为主导,以学术文献的“正式”出版发行为标志,主要传播流程为“创作者——出版社——(数据库商/文献信息服务机构)——用户”。 数字科研环境下,各种“非正式”信息资源数量急剧增长,如开放获取资源、数据资源、数值型知识资源、教育资源、软件资源等,这些未经“正式”出版发行的信息资源时效性较强、内容较为全面,方便科研用户获取前瞻性的研究信息。同时,基于开放、交互、共享理念的Web2.0社会化网络和社交新媒体正以各种形式渗透到出版和学术社区,形成一类基于“创作者-用户”的双向互动信息流通链,从而科研工作者可直接将研究成果提供给用户,随时随地获取其他科研工作者的学术成果,促进了科研成果的充分利用和转化。

2.2 数字科研环境下科研用户的知识需求特点

2.2.1 “非正式”数据的收集、整理与利用 “非正式”数据虽然尚未正式出版,但能在一定程度上反映各学科的前沿动态和最近研究成果,对科研创新过程有重要的参考价值。科研用户对“非正式”数据有着强烈的需求,据美国研究图书馆协会(Association of Research Libraries,ARL)数字学术交流调查报告,目前数字学术资源中纯电子期刊的使用比例仅占23%,其他种类的信息资源包括数据20%、综合型17%、百科全书12%、论坛11%、博客7%、综述5%及预印论文5%[4]。目前,这些“非正式”数据有的散落在不同科研管理和服务机构、基金会等提供的各类研究工具和服务平台中,有的以开放获取资源的形式分布在各种开放获取期刊、机构知识库和学科知识库中,有的以个人网页、博客等形式发布于Web2.0社会化网络中,还有一部分因未及时采集保存随着科研活动的结束而消失。由于传统观念的影响,“非正式”数据尚未进入信息资源保障体系的建设内容之中,未得到系统有效的收集和利用,必须对这些“非正式”信息进行全面的收集和整理,使之成为数字信息资源建设体系的重要组成部分,在尊重知识产权的前提下为科研用户开通服务。

2.2.2 综合科技信息资源的集成服务 一方面,数字科研环境下,用户科研活动依赖的图书期刊、专利文献、数据库、多媒体资源等逐步数字化、网络化,不同机构按照自身需求构建元数据体系,对数字化信息资源进行组织和整理,形成不同的元数据定义和应用规则。新型“非正式”数据的发布格式更是多种多样,大部分“非正式”数据仍以非结构化的文本格式存在,没有统一的标准规范。另一方面,各服务机构在资源整合基础上开发的集成检索、同步浏览、参考咨询和扩展检索等检索或分析工具,种类繁多,特点各异,用户需要掌握工具(系统)的组织规律、挖掘原则与方法才能获取所需信息,信息获取成本较高。科研用户更倾向于采用一站式的方式获得所需要的科技资源与服务,避免逐一访问第3方平台完成该过程,服务机构应该基于统一的标准规范对上述各类信息资源进行收集和整理,对这些分布、离散、异构的信息资源和服务进行有效组织、动态链接和系统集成,使得科研用户从任何服务接入都可通过一次认证、一次输入、一个工作流程或一个逻辑系统地获取所需要的各种服务,可经由第3方系统和用户自主系统调用公共集成服务平台[5]。

2.2.3 融入式知识共享和科研服务平台 用户的科研活动需要的信息服务平台分散在不同应用环境(如桌面、WebX.0、MobileX.0)中,脱离科研用户的知识活动过程。为获取所需资源和服务,用户需要中断自己的科研活动登录到不同服务机构的平台。另外数字科研环境下,跨领域、跨机构团队合作成为研究和决策的基础方式,面向分布式团体的虚拟组织成为未来环境下科研和决策活动的重要主体[6]。在沟通协作的过程中,全球各地科学家之间的“即时”交流非常重要,通过“即时”交流可以发现参与者彼此之间思想的空白以及研究中存在的问题,激发创造性思维。因此,如何切实以用户需求为中心,提供嵌入科研用户知识活动过程和用户系统的数据分析和服务工具,使得科研用户能在自己特有的科研过程中便利地集成数字化的科研信息平台,将个人研究活动置于具有相似研究背景或研究目标的知识群体构成的智力支撑环境中,是数字科研环境下众多科研用户的迫切需求。

3 数字科研环境下的信息资源建设

3.1 实现数字资源的高效管理,促进科研信息资源的深度开发与利用

3.1.1 尽可能完整记录和保存科研活动中的各类信息资源 完备的科研信息资源保障体系是开发相关服务平台和工具的基础。首先,根据用户的客观需求和关注点,考虑资源体系建设过程中的用户体验,在建设过程中随时与用户互动,以提高机构服务水平和用户满意度;其次,随时随地记录用户使用分布式应用工具时产生的科研数据、情景信息和知识积累,尽量实现记录的自动采集和捕获,不要打断科研用户的科研活动;第三,全面记录传统科技信息资源并建立“非正式”信息遴选和采集机制,动态跟踪、监测和收集各类可开放获取资源、即时交流信息、技术转化和市场信息等。

3.1.2 实现各类信息资源的有效组织与整合 数字科研环境下的信息资源具有格式上的异构性、语义上的多重性以及关系上的非统一性等特点,如不经加工规范,很难进行组织与利用。因此,要构建完备的统一元数据标准来实现这些分布、异构、动态信息资源的语义操作,完善数据开放描述机制,利用计算机可识别的开放语言为各类信息资源的集成提供规范的描述方法、整合工具和集成格式。通过提供信息资源库中的资源发现、清洗、描述、加工、评价与利用的基本准则,增加分布异构的不同信息资源站点之间的互操作性和扩展性,同时向平台的高层协议中间件提供标准的数据访问接口[17]。

3.1.3 强化对知识资源的深度分析与导航 充分运用数据挖掘、知识发现、智能搜索等多种技术对科技资源中的知识内容和关联关系进行深度分析,可为科研用户提供更深层次的服务产品和问题解决方案。首先,采用规范的形式语言、精确的句法和明确定义的语义,对领域中概念与实体的各种关联进行预先标注,减少系统内各主体领域中概念和逻辑关系可能造成的误解和歧义。对资源库中信息内容、信息对象及不同对象之间的逻辑关系进行系统化的语义描述,结合特定信息资源的应用环境和特点,实现对知识对象整个生命周期的深层次描述并对其数据来源、应用情景、权威性、备注等“语境”信息进行揭示,通过单一语义映像和多层语义互联,将数据从不同类型的语义空间转换和整合到同一语义空间,实现跨专业、跨系统的语义互联和互操作[8]。其次,提供知识地图,以任一知识节点(元数据、图片、表格、引文、专业词汇标注项等)为入口,可视化地显示知识节点及其各种关联关系,消除知识孤岛,形成一个有机、动态、系统的知识网络[9]。第三,为用户提供隐性知识和显性知识导航。一方面按照不同学科领域、工作流程或项目情况构建个性化的显性知识地图,使其根据知识地图揭示的知识间的关联快速方便地找到相关信息;另一方面构建隐性知识地图,为用户提供隐性知识的获取线索(如隐性知识的拥有者、隐性知识的状态、隐性知识的范围等),从而加速隐性知识向显性知识转换,促进用户对隐性知识和显性知识的管理和利用[10]。

3.2 构建机构知识库,实现科研信息资源的高效管理与共享

机构知识库(Institutional Repositories,IR),又名机构仓储、机构库、机构存储、机构典藏,2002年学术出版与学术资源联盟(Scholarly Publishing for Academic Resources Coalition,SPARC)在研究报告[11]中将IR定义为“收集和保存一个或多个大学知识产出的数字资源集合”。报告认为IR包含4层含义:机构性——不同于学科或专题知识库;学术性——主要收藏学术资源;累积性和长期保存——长久保留本机构的智力资产;开放性和互操作性——保证机构内外的用户能方便存取资源,支持不同IR的互操作。IR用于机构对自有科研信息的集中管理和长期保存,提高机构知识产出的引用率和关注程度,加快知识的传播与应用。首先,IR应尽可能覆盖机构全部的知识积累和知识产出,不仅包括“正式”和“非正式”信息资源,还要致力于促进揭示和利用机构隐形信息资源。完善IR信息采集渠道,实现和提升对相关信息的自动采集和捕获能力;制定合理的信息资源存缴政策,保证IR资源的数量增长和更新频率;丰富开放集成应用接口,实现IR系统与机构原有知识产出和资源保存系统(如学位论文库、教师文库)之间的双向内容交换,避免资源的重复建设和浪费。其次,知识产权问题是IR建设无法回避的关键问题,需要对IR中资源的知识产权状况进行分析,根据不同资源的知识产权状况,采取灵活的访问控制策略,以便在对存储资源进行整理和转化后,最大限度提高IR资源的共享程度,促进开放获取[12]。第三,制定完善的IR建设标准规范体系,在全国范围内建立起联合的IR服务网格,促进全国知识成果和知识能力的集中展示和传播利用。

3.3 构筑嵌入式研究服务平台,支持以科研用户为中心的学术交流

根据用户需求,数字科研环境下应该以个人知识活动过程为服务导向、以个人知识单元积累为起点、以知识点研究为协作纽带、以虚拟个人知识空间为核心,构建一个情境敏感型、服务集成、知识单元收集、知识仓储、协作研究为一体的嵌入式研究服务平台。首先,一个用户就是一个知识网络节点,能否吸引并留住用户是系统成败的关键。平台建设的过程中要把科研用户放在中心位置,一切组织和交流的过程都应该按照以科研用户为中心的原则进行。其次,在对各类科研资源进行综合集成和深层开发的基础上,构建有机嵌入用户知识活动过程的服务模式,动态跟踪和识别用户科研活动中的个性化需求语境信息,实时提供与知识活动中各种对象、资源、工具、活动、过程等充分融合、组织和链接的集成服务平台。支持用户在科研活动中随时调用、组织和定制相应的服务内容。第三,构建分布统一的开放式虚拟个人知识空间,搜集、管理科研用户科研活动中的知识产出,支持第3方系统对个人知识空间的灵活集成。同时,以虚拟个人知识空间中的“知识主体(人)+个人分享区知识体”为网络节点,以研究主题为应用单元构建动态网络自组织研究社区,为有相同或类似研究主题的科研用户提供协助式“即时”交流平台,促进各个层次知识资产的有机融合、高效管理和充分共享[13]。

4 结语

科研环境的变化带来了科研用户学术交流方式和信息需求特点的变化。在数字科研环境下建设信息资源保障体系,必须以用户需求变化为导向,利用现代化信息技术和服务理念,同步跟踪和捕获用户及机构各类科研活动中的知识积累和知识产出,完整记录和管理各类“正式”和“非正式”信息资源,对各类科研资源进行综合集成与深度分析,在尊重知识产权的前提下提供开放获取服务。同时,将个人的研究活动置于具有相似研究背景或研究目标知识群体的智力支撑环境之中,提高科研用户的信息获取和知识转化能力,提升科研用户科研创新的效率。

1 陆玲宝.研究机构信息资源系统建设的思考[J].医学信息学杂志,2012,33(2):60-63.

2 曾民族.对科技信息服务的再认识[J〗.中国信息导报,2003,(10):15-18.

3 张奇志,尚武.大数据时代医学图书馆特色服务的机遇与挑战[J].医学信息学杂志,2014,35(3):75-78.

4 Maron N L, Smith K K. Current Models of Digital Scholarly Communication: results of an investigation conducted by Ithaka for the association of research libraries[EB/OL].[2014-03-05]. http://www.arl.org/bm~doc/current-models-report.pdf.

5 中科院国家科学图书馆.中国科学院文献情报系统“十二五”发展规划[R].北京:中国科学院国家科学图书馆,2010.

6 张晓林.重新认识知识过程和知识服务[J].图书情报工作,2009,(1):6-8.

7 尚慧,李雪琴.元数据技术在医学信息资源整合中的应用[J].医学信息学杂志,2010,31(10):45-48.

8 王延东.网络环境下数字图书馆知识服务平台的构建[J].医学信息学杂志,2008,29(8):32-34.

9 张红丽,吴新年. e-Science环境下面向用户科研过程的知识服务研究[J].情报资料工作,2009,(3):23-27.

10 张红丽,吴新年,张甫.数字知识环境下面向科研用户的知识服务体系构建[J].图书与情报,2011,(3):41-44.

11 Kirzner IM. The Driving Force of the Market Essays in Austrian Economics[M].London: Routledge,2000.

12 鲍永庆,孙璐薇.专题网络数字信息资源建设的知识产权问题[J].医学信息学杂志,2007,28(3):224-227.

13 乐小虬,管仲,袁国华,等.嵌入式泛在个人知识服务模型研究[J].现代图书情报技术,2009,(12):37-41.

Information Resources Construction in the Digital Scientific Research Environmentt

ZHENGJing,

PekingUnionMedicalCollegeHospital,ChineseAcademyofMedicalSciences,Beijing100730,China;ZHANGHong-li,LibraryoftheOpenUniversityofChina,Beijing100039,China

The paper analyzes new characteristics of the digital scientific research environment and features of knowledge demand of scientific research users in this environment, elaborates the direction of information resources construction, namely, making integration and in-depth analysis of all kinds of scientific research information resources, realizing efficient management and resources sharing by constructing the institutional repository, setting up a communicative scientific research service platform, supporting the scientific research user-based academic communication.

Digital scientific research environment; Information resources construction ; Scientific Research Users

2015-06-11

郑婧,硕士,实习研究员,发表论文1篇。

R-058

A 〔DOI〕10.3969/j.issn.1673-6036.2015.08.018

猜你喜欢
数字资源环境
基础教育资源展示
长期锻炼创造体内抑癌环境
一种用于自主学习的虚拟仿真环境
一样的资源,不一样的收获
孕期远离容易致畸的环境
环境
资源回收
答数字
资源再生 欢迎订阅
资源再生(2017年3期)2017-06-01 12:20:59
数字看G20
南风窗(2016年19期)2016-09-21 16:56:12