康奈尔大学嵌入式科研数据管理服务探析*

2015-10-22 08:03丁海容
图书馆建设 2015年12期
关键词:康奈尔大学数据管理科研人员

徐 菲 王 军 曹 均 丁海容

(成都理工大学 四川 成都 610059)

康奈尔大学嵌入式科研数据管理服务探析*

徐 菲 王 军 曹 均 丁海容

(成都理工大学 四川 成都 610059)

新研究范式下,为了满足研究机构数据获取、保存和管理需求,美国康奈尔大学组建了自上而下的科研数据管理服务机构,基于科研数据生命周期提供更具深度和广度的科研数据管理服务。康奈尔大学嵌入式科研数据管理服务具有理论体系完备、灵活、实时、交互性和扩展性强的特点,但也面临深化服务而出现的挑战,这些对于我国图书馆开展和提升嵌入式数据管理服务具有重要参考价值。

嵌入式数据管理服务 科研数据管理服务 数据馆员 康奈尔大学

伴随着信息技术的日新月异,科学研究范式发生了深刻变化,以信息技术为基础的数据密集型计算、分析和管理成为这个时代最明显特征,科学研究进入了E-science时代[1]。与传统研究范式相比,数据密集型研究对科学数据的交流和共享提出了新要求,科学发现越来越依赖于对科学数据的整合、分析和关联[1]。为应对信息技术环境和科学研究范式变化所带来的一系列挑战,发挥图书馆支撑科学研究发展的作用,推动学校在全美乃至世界范围内处于领先地位,康奈尔大学教务长Biddy Martin明确指出,提供数据管理服务,满足教学、科研资源需求是大学图书馆的基本目标,图书馆应服务于教学科研,为所属机构公共利益服务,保证其在国内乃至世界范围内处于领先地位[2]。

康奈尔大学嵌入式科研数据管理服务于2009年正式拉开帷幕[3]。为了更好地促进教学科研发展,2010年康奈尔大学成立了科研数据管理服务工作组(Research Data Management Service Group,简称RDMSG)[4]。2015年,工作组提出数据馆员不仅要以课题合作者身份参与科研团队科学研究,而且还要根据用户数据管理需求,在科研数据生命周期不同阶段提供适宜的嵌入式数据管理服务,在规划阶段提供科研数据管理计划与评估服务;在采集阶段协助科研用户搜集数字资源;在保证阶段给予科研人员数据质量控制、知识产权和版权保护方面的专业意见;在描述阶段创建元数据标引服务;在保存阶段提供数字计算空间存储服务;在发现阶段协同科研人员实现科学数据共享,达到目标人群检索、利用数据的目的;在整合阶段深度支持科研人员整合不同类型数据资源;在分析阶段实现科研数据与其他多元资源分类集成[5]。科研数据的生命周期循环往复,项目结束预示着科研数据生命周期的一个循环完成,而项目滚动或相关项目启动,则意味着科研数据生命周期的重新开始。

康奈尔大学基于科研数据生命周期的嵌入式科研数据管理服务,通过嵌入科学研究学术交流过程,依据数据生命周期全面分析、整理并记录科研数据处理情况,特别是后期对科研数据的发现服务、整合服务、分析服务,不仅有利于科研人员检索到与之相关的所有原始数据,而且更有利于数据密集型科学研究的学术交流。

1 机构设置

为了规范管理生命周期内的科研数据,康奈尔大学采取自上而下的机构组织模式(见图1)[6],取得了很好的服务效果,赢得了用户的认可和肯定。

图1 康奈尔大学嵌入式科研数据管理服务机构设置

上层管理机构总揽全局,具体事务由学校副教务长负责,并配置跨学科的数据分析技术人员。馆员作为主要成员与其他研究机构人员合作,协助科研用户制定数据管理计划,完成最佳的数据管理方案,并及时提供科研数据保存、分享服务。同时,康奈尔大学设立了院系咨询委员会,包括10名成员[2]。委员会成立的目的是“在E-science环境下追踪和发起‘科学’活动”,一方面调研学者面临的科研数据管理服务难题,提出解决方案;另一方面讨论科研数据管理服务发展方向,推动服务项目顺利进行,避免重复工作。另外,委员会还开发了支持数据驱动研究的结构软件,用于创建科研数据管理服务最佳实践环境[2]。

中间阶层是科研数据管理服务虚拟组织,是一个以现代信息存储技术、通讯技术、机器智能产品为依托组建的人机一体化组织。组织成员包括管理机构和执行团队。组织成员没有固定工作空间,工作时间也很灵活,主要通过高度自律和共同价值取向实现团队发展目标,保证工作组正常运作。

最底端的是科研数据管理服务提供者。在学校安排下,康奈尔大学图书馆罗列了一张能够协助图书馆开展科研数据管理服务的机构清单,所列机构包括康奈尔高级计算中心、康奈尔信息技术中心、康奈尔社会和经济学研究所等。上述机构中,康奈尔大学图书馆与康奈尔高级计算中心、康奈尔社会和经济学研究所的合作更多些,与康奈尔高级计算中心的联系大多建立在共同推进项目实施上,与康奈尔社会和经济学研究所的协作研究集中表现为:共同调研学者数据需求,共同探讨图书馆资源建设合理性,共同评估满足专家、学者信息需求的执行机构。

这种自上而下的机构管理模式不仅拓展了图书馆嵌入式科研数据管理服务的深度和广度,有助于营销图书馆资源,延伸服务空间,而且也有利于集中全校人力、物力、财力提升科研数据管理服务质量,为教学科研服务。

与此同时,康奈尔大学积极加强与校外研究机构合作。VIVO项目的顺利运作就是康奈尔大学与校外机构合作成功的范例。VIVO项目由康奈尔大学发起,美国多所学校、研究机构参与了项目建设。项目机构设置在康奈尔大学图书馆,数据馆员负责技术开发和学科内容录入,因此也是VIVO项目的研究团队成员,能够实时与科研人员互动以了解其数据需求。2009年,为了扩大VIVO项目规模,包括康奈尔大学在内的美国7所大学联合申请,从美国国家卫生研究院(National Institutes of Health,简称NIH)申请到了总额为1 120万美元的资助,这是NIH首次大笔资助此类专业社交系统[7]。VIVO项目实现了全国联网,成为一个连接多个研究机构的开源平台。目前,全球已经有175个国家和地区的588位科研学者参与到该项目中,把科研数据上传到VIVO,实现对科研数据规范管理[8]。

总之,科研数据管理需求决定了图书馆科研数据管理服务的发展方向,数据馆员和科研人员一对一的非正式会谈给科研数据管理服务提供了良好契机,使数据馆员有机会参与项目研究。但是,这种非正式的数据服务方式要求数据馆员具有一定学科专业知识,能够直接或间接地嵌入科研项目。随着科研数据管理服务的深入,数据馆员与科研人员的联系增多,科研人员逐渐转换角度思考图书馆价值,主动邀请数据馆员参与项目研究。康奈尔大学图书馆科技服务首席策划人Dean Krafft建议,图书馆聘用有科研经验的人员到图书馆工作,即那些曾经在学院工作过的科研人员,因为他们更了解学院数据管理需求,能为图书馆嵌入式服务提供无缝衔接[2]。数据馆员嵌入科研团队后,会与不同研究团队沟通,为研究团队交流建立合作共享空间,拉近相近或交叉学科领域科研人员间的关系,并通过合作共享实现研究目标。

2 服务模式

康奈尔大学科研数据管理服务工作组提出科研数据生命周期包括8个阶段,服务提供机构可以由此入手宏观把握科研人员数据需求,提供嵌入式科研数据管理服务[5]。

2.1嵌入式规划服务

美国自然科学基金委员会对科研项目资助的前提是科研团队必须提供科研数据管理计划,详细描述项目研究数据,详尽分析数据分享的目的与初衷等。康奈尔大学建议制定数据管理计划时使用科研数据管理规划工具(DMP Tool),即一种由第三方定制的在线网页输入工具[9]。科研人员登录科研数据管理规划工具主页后,在栏目框中选择机构康奈尔大学,使用用户名和密码快速登录,就能够从康奈尔大学图书馆获得填写科研数据管理计划的具体指导和帮助,包括:免费下载美国基金项目管理机构的数据管理政策;数据收集和分析方式的选用;维护数据完整性的方法;数据访问和安全政策的选取;数据管理评估计划;项目结束后数据的最终过渡计划,等等[10]。同时,康奈尔大学图书馆的网站提供RSS Feed,支持RSS订阅,帮助用户时刻了解科研数据管理最新消息;该网站还提供对应学科嵌入式数据馆员的简要介绍和联系方式,便于科研人员寻求帮助[11]。

2.2嵌入式采集服务

不同学科属性的科研人员获取研究数据的方法不同,自然科学科研人员通过科学仪器收集和分析样品采集学科资源,社会科学科研人员更多是基于海量数据的抽样分析来获取学术资源。为了保证科研人员采集的科学数据在未来能被利用,康奈尔大学图书馆数据馆员利用自身专业优势,审慎考虑不同学科科学数据采集的方法和文档的保存,利用数据采集系统、平台、工具实时为科研人员提供指导。并且在数据收集过程中,根据数据间复杂的逻辑关系,分类创建使用模板,以保证任何关联数据都能够被采集。除此之外,根据科研人员数据需求,康奈尔大学图书馆数据馆员主动通过现有数据库积极向科研人员推送学科前沿信息,使用电子邮件或博客把与项目研究密切相关的文章、图书、期刊、在线视频、新闻等资源推荐给科研人员,帮助其发现最佳知识库,使其能够便捷地从科学数据知识库和机构库中获取新的研究思路和资源。

2.3嵌入式保证服务

数据馆员在长期工作实践中积累了大量技术经验,具有敏锐洞察力,熟悉科研人员行为习惯,具备信息资源建设能力。因此,数据馆员通过参与基金资助项目相关材料的写作,协助科研人员分析、执行数据质量保证和控制的措施,描述影响数据质量的因素,设置数据指标来检查可疑数据,以便及时发现潜在问题。

同时,由于知识产权和道德方面的原因,科研人员可能会考虑限制数据发布。数据馆员有义务保护研究对象隐私、保证数据安全。通过参与项目研讨会,了解用户数据控制需求,康奈尔大学图书馆数据馆员或者采用许可证的形式限制数据使用、禁止数据共享,或者使用身份认证的方式保护科研人员隐私,或者提供加密服务来保护数据免受未经授权的访问。数据馆员还通过提供数据版权保护和知识产权咨询服务来指导科研人员许可授权和发布数据。

另外,为了确保科研人员在未来科研工作中能够利用数据,数据馆员拟定了动态数据保护方案,根据科研人员需求协同制定数据保留标准,确定数据保存期限。有的数据生命周期会随着项目终止而结束,有的数据保存的时间会比项目周期更长,有几年甚至几十年。为保证最大限度延长数据使用寿命,数据存储时科研人员需要预先确认有利于实验研究的数据,以及有潜力被再次利用的数据,以便数据能够深度支持科学研究[12]。

2.4嵌入式标引服务

由于科研数据具有短暂性、临时性、数量庞大的特点,因此只有经过组织标引的资源才能被用户充分利用和共享。科学实验中研究者描述数据的传统方法大多是记录在笔记本上。现在为了更快速、准确识别资源、检索资源、共享资源、评价资源,数据馆员提供了正式的数据描述方式,即采用元数据描述信息资源,实现对不同属性数字资源的有序化组织、索引、链接、建库、存储。

康奈尔大学图书馆数据馆员通过全程跟踪科研人员,实现对数字资源内容属性准确描述,包括数字语境、科学语境、参与者及相关参数信息等,尽量根据用户使用习惯或知识背景(User Profile)来叙述[13]。如果科研数据仅限学校内部使用,暂时没有合适的元数据标准,数据馆员就会指导科研人员写“自述”式元数据。如果数据要对外开放,创建标准化元数据又较困难和费时,康奈尔大学图书馆数据馆员大多会选择规范工具,协助科研人员完成元数据标引,如通过康奈尔大学图书馆科研数据管理服务中心登录到英国数字保存中心[14],查询相关学科元数据标准列表,实现对元数据收集、验证、规范化设计和保护,以应对不同用户的元数据使用需求。对于比较特殊的数据,为方便学者后期访问,发挥数据价值,科研人员可向数据管理人员咨询转换数据格式,以表格数据(Tabular Data)的形式来合理描述科研数据存储状态。总之,元数据应用是一项持续性、系统性的维护工作,目的是使元数据可以为科研评估和管理服务,最终实现原始数据价值。

2.5嵌入式保存服务

为了促进科学研究的进一步发展,减少重复劳动,便于数据检索和利用,数据馆员必须对数字资源的应用环境科学规划。康奈尔大学校内设有计算机中心和数字共享空间,主要依托机构库为科研人员提供科研数据保存服务。康奈尔大学机构仓储的最初设想是保存机构成员研究成果,同时为其提供作品出版机会。但是随着机构库建设的顺利推进,康奈尔大学开始探索以机构库为平台的数据馆员—用户互动模式,构建数据阶段型存储库(Data Staging Repository,简称DataStaR),开展嵌入式科研数据管理服务。DataStaR是康奈尔大学机构库支持数据密集型学术研究的新形式。目前,DataStaR已建设成为一个成熟的数据监护平台,是一个暂时的、过渡性质的数据共享存储节点[15]。DataStaR拥有多种可以产生高质量元数据的工具,主要由数据馆员协助科研人员使用,其最终目的是帮助学者发布、长期使用数据成果[16]。数据馆员通过对存储在机构库中的数据组织、建设,有效降低了数据过时的风险,增加了其长期研究的价值,以便更多人共享科研数据。

由于机构库存储空间有限,长期发展必然造成机构库资源增加与存储空间有限的矛盾。因此,康奈尔大学科研数据管理服务工作组通过与科研人员沟通,确定了上传数据的大小和数量。当数据量超过存储限制量时,数据馆员核实数据保存价值后,把一部分不太重要的数据暂时保存在临时空间。另外,为了提高数据管理服务性能,数据馆员在多语种和多语言(如C/C++、Perl、Python、Java、C#、MPI、OpenMP)平台上提供编程服务,优化数据库性能,充分发挥数据使用价值。

2.6嵌入式发现服务

康奈尔大学图书馆数据馆员通过面对面交流、电子邮件、电话、社交软件等与科研人员互动,协助其使用标准的、开放的软件工具和专业术语宣传自己上传的数据,完善数据共享策略,确保数据使用价值最大化。为了让目标人群有效发现数据,数据馆员在与科研人员深度沟通后,协同制定数据营销策略,再次确认数据共享数量、阶段(原始数据阶段、数据加工阶段或数据分析阶段)。对于暂时不共享的数据,科研人员需要标明数据开放共享的时间节点,为受众人群发现和分享数据提供方便,以提高数据使用效率;对于保密的敏感数据,则制定数据保护安全措施,以及数据存储标准、形式。

2.7嵌入式整合服务

数据库建立后,数据馆员要定期与科研项目负责人联系,及时更新数据,包括项目结题后产生的相关数据、解密的受保护数据等。所有这些数据集聚在一起,并不意味着就能形成满足研究的数据产品,不同类型数据集合在一起可能会不兼容。康奈尔大学图书馆数据馆员嵌入科研环境中,利用技术工具(如资源链接工具、批注工具、讨论工具、个性化内容组合工具、个人数据管理工具等)选择、加工、导入和组织相关的数据资源[12],完成异构数据的整合、改造,将后续研究数据有机组织、整理到研究机构及图书馆的信息平台之中,实现不同来源重要数据的融合,利于后期研究。

2.8嵌入式分析服务

数据分析最重要的是研究结果要遵循项目要求和数据需求,以及达到政策制定者和科学界预期的效果。因此,数据馆员与科研人员的联系沟通十分重要,除建立常规的联络机制外,还需要图书馆为研究团队依据学科背景设置数据管理服务联络人,即对口服务的嵌入式数据馆员,让科研人员能够随时随地享受专业化数据分析服务。科学的工作流程管理软件可以集成、分析和可视化数据,特别是在科研数据成为图书馆文献资源一部分后,康奈尔大学图书馆数据馆员利用专业管理软件将这部分科研数据与其他馆藏资源(特别是科学文献)关联化,即将某一数据或数据集与依托其产生的科学文献关联起来,从而使得潜在用户检索数据或数据集时,能够轻松检索到与数据或数据集相关的科学文献和其他多元资源[17]。例如,在VIVO项目中,数据馆员将科研数据与其他多元资源,如人员信息[18]、科研项目信息、机构信息、会议信息、设施设备参数、模型、图像、三维地图等信息资源关联集成,这样用户检索科学数据时,就能挖掘与其相关的集成信息,用户能发现搜索范围显著扩大,检索结果明显增加,这有助于科研人员进行更详细的数据密集型计算分析,提升研究数据价值[19],图书馆嵌入式服务也更加具有灵活性和扩展性[20]。

综上所述,康奈尔大学图书馆数据馆员通过嵌入科研过程和环境,与用户良性互动和实时交流[21],并利用先进计算机技术(如语义网、Web3.0和机构库等),基于数据生命周期帮助科研人员集成管理各种类型的科研数据[22],有利于科研数据长期保存使用,满足学校教学、科研资源需求。

3 面临的挑战

从科研数据管理计划的制定到数据存储再到数据分析,康奈尔大学形成了完备的嵌入式科研数据管理服务理论体系,与此同时,VIVO、DataStaR等项目的顺利运作也表明其科研数据管理服务具有交互性、动态性、可操作性强的特点。基于科研数据生命周期,康奈尔大学图书馆数据馆员为科研人员提供了丰富而多元的嵌入式科研数据管理服务,但是伴随服务工作的发展与深化,仍然面临下述挑战:

(1)数字资源的利用和共享问题。一方面,数据具有价值,其就是资产,核心数据资源能够形成核心优势和核心竞争力,个别科研人员可能不愿意共享科研数据或者用于共享的数据有限;另一方面,部分数据服务商业机构可能认识到数据的潜在价值,有意延迟或阻碍数据共享。因此在科研数据资源保护和共享之间找到平衡点成为亟需突破的关键观念问题。

(2)在数据馆员配置方面,寻找和吸引具有创意的程序员与软件开发者,以及既具有图书情报专业知识又具备学科背景的专业人才参与科研数据管理变得较为困难。为了能够最大限度地发挥每一位数据馆员的效用,康奈尔大学图书馆为科研数据管理服务设置了3个永久性职位,除此之外其他编程人员都是临时人员,根据项目经费预算来聘任。由于经费有限,收入不高,具备相关专业知识的人才可能会更趋向于寻找高薪工作,图书馆面临在未来3~5年很难聘用具有适当专业知识和数据开发水平的工作人员[2]。

(3)在经费方面,随着科研数据管理服务开展,扩大服务的需求会明显增长,数据资源管理产生的费用会随之增加。尽管美国国家基金委员会要求科研人员申请项目时,必须将项目经费的一定比例拨付给数据管理机构用于数据服务,但项目经费是固定的,而科研项目的关键资源却在不断增长,这必然造成管理经费不足。同时,由于康奈尔大学科研数据管理服务涉及多个研究机构,因而参与各方的成本分摊与利益分配需要进一步明确。

(4)数据管理还需要从道德层面和法律层面解决可能出现的各种问题,包括参与各方的权利和义务、数字资源版权保护、数字资源安全等。另外,数据存取可能泄露个人隐私,在单条数据或单维度情况下或许得不到有价值的结论和线索,但是当数据资源集聚在一起在多维度下就可能泄露研究者隐私,导致学者共享数据时有所顾虑。

4 启示与结论

目前,嵌入式科研数据管理服务在我国大陆地区多停留在理论探讨阶段,开展相关探索实践的图书馆屈指可数,大量有价值的科研数据因缺少管理和保存而流失。美国康奈尔大学的一些做法对我国图书馆嵌入式科研数据管理服务的深入开展具有一定启示。

首先,E-science环境下,收集、储存、分析和共享海量数据的各个环节都需要设备、技术、人才与资金,图书馆开展嵌入式科研数据管理服务仅依靠一己之力远远不够。从康奈尔大学成功案例看,图书馆虽然是嵌入式科研数据管理服务的主要窗口,但更需要学校及科研资助机构的高度重视,在发展政策、经费上给予大力支持,如科研资助机构可以要求科研团队在申请项目时提交科研数据管理计划,也可以明确规定从科研项目研究经费中按比例提取一定份额用于数据管理。同时,图书馆需要与其他机构协同合作,建立专门机构(如数据管理服务工作组)来协调合作机构之间的权责,明确服务阶段和任务,提高管理效率,弥补图书馆建设能力不足。

其次,图书馆应加强基础设施建设,提升嵌入式科研数据管理服务的技术支撑能力。从康奈尔大学的做法来看,对密集、复杂的科研数据管理,需要依托强有力的基础设施和软件工具,主要包括大型存储设备、高性能服务器及服务终端等,并配置相应软件系统,便于数据采集、发现、整合和分析。数据存储可以采用与其他机构合作的途径共同创建数据存储库,也可使用自建的数据或机构仓储设备来完成数据存储。如果存储的数据不在图书馆,则可通过数据导航服务,由图书馆链接到存储中心来实现,这时图书馆的职责是建立完备的科研数据环境,对科研数据集成并统一管理。国内高校图书馆可以根据自身技术条件和设备条件在这3种形式中选择合适的仓储设备和软件平台。

再次,数据馆员作为研究团队组成部分,要时时与用户沟通,把握用户需求,在科研数据生命周期的全谱段与科研人员合作,建立对应学科科研数据馆员联系机制,保护科研人员隐私,提供恰到好处的服务。同时通过举办讲座、研讨会的形式加强与科研人员交流,让他们了解在E-science环境下,科学研究范式发生了显著变化,看似分散、零碎的科学数据仍然具有巨大的经济价值和社会价值,科技创新越来越依赖于对海量数据的控制和再利用,激发他们上传数据的热情。

最后,借鉴康奈尔大学经验让数据馆员有机会参与科研数据管理服务学术交流和接受继续教育。康奈尔大学图书馆和雪城大学签订协议,优秀数据馆员能够到雪城大学接受一期的ISCHOOL课程培训,学习内容包括数据管理、计算机科学和数据库管理等[2],都是特别有价值的课程,对康奈尔大学图书馆数据馆员科研数据管理服务能力的提升有很大帮助。

康奈尔大学嵌入式科研数据管理服务的相关信息与案例体现了在E-science和大数据环境下图书馆发展的必然趋势和方向。虽然嵌入式科研数据管理服务没有固定的模式和机制可以遵循,每个图书馆都可以“因馆而异”,但是一切以用户为中心的服务理念已经成为一种共识。学习、借鉴国外先进做法,对我国图书馆开展嵌入式科研数据管理服务、完善和深化服务工作具有重大意义。

[1]Hey T,Tansley S,Tolle K. The Fourth Paradigm:Data-Intensive Scientific discovery[M]. Washington: Microsoft Research, 2009: 3-26.

[2]Soehner C,Steeves C,Ward J. E-Science and Data Support Services: A Study of ARL Member Institutions[C]. Washington: Association of Research Libraries, 2010:5-7,32-36.

[3]RDMSG Planning Group. Meeting Funders' Data Policies: Blueprint for a Research Data Management Service Group(RDMSG)[R]. Ithaca:RDMSG, 2010:2.

[4]Cornell University. Research Data Management Service Group(RDMSG)[EB/OL]. [2015-08-10].https://confluence.cornell.edu/ display/rdmsgweb/home;jsessionid=73DF1608333 FB2D6FoFDCB 976AB20C76.

[5]Research Data Management Service Group. The RDMSG:Data Management Planning and More [R]. Ithaca:RDMSG, 2015:40.

[6]Research Data Management Service Group. Research Data Management Service Group: Summary of Activities and Accomplishments July 2012-June 2013[R]. Ithaca: RDMSG,2012: 23.

[7]李 力.国外研究型图书馆学科服务的发展态势及启示:以康奈尔大学为例[J]. 图书馆学研究, 2013(14):82-85.

[8]Cornell University Library. VIVO:Research & Expertise Across Cornell[EB/OL]. [2015-07-10]. http://vivo.cornell.edu/.

[9]University of California. Data Management Planning Tool[EB/ OL]. [2015-07-10]. https://dmptool.org/user_sessions/institution.

[10]Cornell University. Data Management Planning [EB/OL]. [2015-07-10]. http://data.research.cornell.edu/content/datamanagement-planning.

[11]Cornell University Library. Cornell University Library [EB/OL].[2015-07-10]. https://www.library.cornell.edu/.

[12]Cornell University. Data Management Services at Cornell [EB/ OL]. [2015-07-10]. http://data.research.cornell.edu/services.

[13]Cornell University. Metadata [EB/OL]. [2015-07-10]. https:// confluence.cornell.edu/display/rdmsgweb/metadata.

[14]Digital Curation Conference. List of Metadata Standards[EB/OL].[2015-07-10].http://www.dcc.ac.uk/resources/metadatastandards/list.

[15]杨鹤林. 从数据监护看美国高校图书馆的机构库建设新思路:来自DataStaR的启示[J].大学图书馆学报,2012(2):23-28,73.

[16]Institute of Museum and Library Services. DataStaR[EB/OL].[2015-07-10].http://datastar.mannlib.cornell.edu/.

[17]吴新年.学术图书馆的科研数据管理服务[J].情报资料工作,2014(5):74-78.

[18]Corson-Rikert J,Holmes K,Lowe B,et al. Introduction to VIVO[C]. St.Louis:VIVO 2013 Conference Workshop, 2013:10-12.

[19]NCRIS. Research Data Australia[EB/OL]. [2015-07-10]. https:/ /researchdata.ands.org.au/.

[20]肖 潇, 吕俊生. 图书馆嵌入式学科化科学数据服务研究[J].图书馆学研究, 2012(21):85-87.

[21]马晓亭. 图书馆大数据监护系统的构建:以生命周期理论为视角[J].图书馆建设, 2014(12):31-33,38.

[22]初景利. 嵌入式图书馆服务的理论突破[J]. 大学图书馆学报,2013(6):5-9.

Research on the Embedded Scientific Research Data Management Service in Cornell University

In order to meet requirements of data acquisition, storage and management of research institutions, the Cornell University set up a top-down scientific research data management service agency, which based on the life cycle of scientific research data to provide more depth and breadth of scientific research data management service. Embedded scientific research data management service of Cornell University has characteristics of complete theoretical system, flexible, real-time, strong interactivity and extensibility, but also faces the challenge to deepen the service, which has important reference value for China's Library to develop and enhance the embedded data management service.

Embedded data management service; Scientific research data management service; Data Librarian; Cornell University

G252

A

徐 菲 女,1979年生,博士,现工作于成都理工大学图书馆,馆员,已发表论文10篇。

王 军 男,1958年生,现工作于成都理工大学图书馆,副馆长,研究馆员。

曹 均 男,1967年生,现工作于成都理工大学图书馆,研究馆员。

丁海容 女,1978年生,现工作于成都理工大学图书馆,副研究馆员。

2015-08-16 ]

*本文系四川省哲学社会科学重点研究基地四川学术成果分析与应用研究中心项目“基于地球科学的中文图书引文数据库建设及其学术影响力分析研究”,项目编号:SCAA15B01;2013-2016 年成都理工大学高等教育人才培养质量和教学改革项目“教辅单位为创新型人才培养提供多层次服务的保障机制研究”,项目编号:13JGY81 的成果之一。

猜你喜欢
康奈尔大学数据管理科研人员
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
企业级BOM数据管理概要
科研人员揭示油桃果实表皮不长毛的奥秘
定制化汽车制造的数据管理分析
康奈尔大学制造出可拉伸传感器
科研人员破译黑猪肉特征风味物质
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
书写中国留洋科学家传记不应迷恋博士学位
企业科研人员激励问题及对策研究