(南京政治学院上海校区军事信息管理系 上海 200433)
在Web2.0时代,具有高知识依存度和高协同工作度特点的学术科研人员,如何在完成科研任务的同时,对个人(包括课题组)学术信息空间内大量的信息进行有效的序化组织和管理,以应对在信息超载的世界里的信息饥渴感与焦虑感,从而专注于完成科研任务是一个重要的研究课题。
随着个人计算机性能的增强、存储容量和网络带宽的增大、云存储的普及、种类繁多的用户终端设备以及信息资源的数量和可获取渠道的增多,学术科研人员可以很方便地将大量资源保存到自己的存储空间中。为了完成科研任务,学术科研人员享受着信息流动所带来的便利,如饥似渴地检索、发现、搜集相关信息,个人计算机或个人学术信息空间里往往挤满了大量与学术相关的信息(曾经为某一主题或某一课题特地搜集的、在浏览中偶然发现的…)。
相信很多学术科研人员都有这样的经历:偶然的机会遇到自己非常感兴趣,或对于自己非常有价值的信息,如在上网的时候偶然发现了一篇对自己非常有用的学术文章;与同行交流的时候,突然有了一个非常好的想法……等等,但是无法用有效的手段及时将其记录下来。
自己长期积累的学术信息,往往随机记录在纸上,或保存在自己的计算机内,因为版本、存放位置、信息组织和管理方法问题,往往在真正需要的时候(如论文写作中需要引用某篇权威文章的观点、数据)却无法重新找到,或者要付出较高的查询成本。根据中国互联网数据中心(IDC)的研究报告,知识工作者1/3的时间用在了寻找某些他们永远没有找到的信息上。
2010年7月,OCLC研究部发布了《研究生涯:美国研究人员所需的信息支持》报告。〔1〕该报告对美国研究人员在工作中所需的各类信息支持情况进行了访谈。访谈结果表明,有关个人信息管理方面的问题,如“文件、数据集的管理与存储”、“引文管理”(引文的插入、存储和处理)已经成为研究人员最受困扰和最为关注的问题。
笔者曾面向学术科研人员做过一个有关“数字环境下学术科研人员科研信息行为与需求”的问卷调查,〔2〕调查内容包括“学术信息管理行为与习惯”(信息保存〈收藏〉、维护和管理以及使用)。通过调查一方面为深入了解学术科研人员的学术信息管理行为和习惯提供实证依据,另一方面为分析困境的深层原因和提出解决对策提供参考指导。
JISC的研究表明,学术用户有很强的信息消费本能,他们习惯于以下载的方式将内容存储起来,特别是免费资源。〔3〕在数字信息环境下,书房、书架已经不是研究人员的主要学术资源库,绝大多数的研究人员都拥有个人数字学术资料库,用于积累和保存获取和创建的数字学术资料。调查结果表明,绝大多数研究人员主要将学术资源保存在个人PC上,占97.06%;有16.28%的研究人员还将个人资料库保存在图书馆提供的个人数字图书馆内;8.82%的人则选择存放网络上各种免费空间内(如Google Docs,360doc,邮箱硬盘等)。随着云存储技术的兴起,云存储已经成为学术科研人员学术信息存储的重要方式之一。
据参与问卷的研究人员估算,下载保存的数字资源中平均有约48.26%的文档都有较为确切的文献记录款目(如作者、关键词、篇名、期刊、网址)。其中,理科、工科的研究人员平时所参考的学术资源主要为权威的数据库,文献著录项目较为确切、规范,因而,平均估算比例高达70%以上;而人文社科的研究人员反映他们下载的资源中有不少来自于博客文章、专业网站、新闻报道等,这些资源的文献记录款目往往不是很确切,因而估算的比例相对较低一些。当然,在面对面访谈中,自然科学领域的研究人员也表示,他们在科研过程中也会经常在网上找一些学术性较强的视频、演示文稿等,这些资源主要来自于视频网站、会议网站、同行的个人主页(或博客)。
所有参与调查的研究人员都认为有必要建立并维护好自己的个人学术资源库。大多数的研究人员对自己手头的资料进行了某种方式的管理,其中74.42%的研究人员下载收藏数字学术资源时的态度和做法是“以文件夹形式粗略归类存放”;18.6%的受访者“认真标注后归置到个人资料库中”;但也有4.65%的研究人员则是“下载后随意存放”。
数字环境下,研究人员的信息阅读行为是一个值得关注的问题。在线信息查询过程表明,随着全文资源的广泛可获取,用户往往会首先下载然后确定其相关性,因此,不可避免地导致有相当数量的全文下载后不再被阅读,有部分具有一定学术参考价值的资源可能就此被淹没,而学术价值不大的资源则会成为后续科研信息利用中的噪音。参与调查的研究人员对所获取的学术资源所采取的阅读习惯,有27.91%选择整篇阅读(其中,化学和生命科学领域的研究人员阅读全文的比例最高);30.23%采取阅读摘要;41.86%会选择阅读有用片断。这一调查数据表明,即使在信息“碎片化“时代,研究型学者仍然比其他类型的信息用户阅读全文的时间更长,尤其在某些学科领域,如化学、生命科学,这可能与这些领域的科研性质和特点有关。
另外,参与调查的研究人员表示他们或多或少地都会对个人数字资料库中的文档在保存和阅读时作了某种注释或标记,如文档的发表年份、权威作者、主题(关键词)、学术参考价值、类型(综述、演示稿、博士论文、实验报告、专利报告等),阅读启发、感想、重点标记等,或注释于文档名,或在阅读过程中进行加注,以方便在后续的研究过程中查阅、引用。根据研究人员填写的粗略估计比例,最低的为5%,最高的为90%,但大部分都低于40%,经过估算,受访研究人员注释和标记的比例平均为28.49%。
研究人员搜索、保存的学术信息资源是经过筛选的、对科研有用的资源。但在科研过程中,当需要调用和引用某个资源时,有9.3%的研究人员经常碰到保存好的资源却找不到的情形;81.4%的受访者表示有时会碰到,这是让很多研究人员甚为头疼的问题。有95.35%的研究人员已经意识到维护和管理好个人学术信息资源是非常重要的工作,可以有效节省科研时间和提高科研效率。这一调查结果说明,随着个人可获取和存储的学术资源的不断增多,研究人员普遍认识到对个人数字资源库进行有效的组织和管理对于科研工作是非常重要的。
调查结果显示,有55.81%的研究人员知道并使用过某种文献管理软件。研究人员在撰写学术论文时,有58.14%表示经常遇到版本修改管理、投稿格式、编制参考文献方面的问题,但仅有39.53%的研究人员使用辅助论文写作工具,如NoteExpress、EndNote的Word插件。
这一调查表明,对获取保存的文献进行管理是研究人员利用学术信息的一个薄弱环节,是影响其科研效率和产出的不可忽略的因素。尽管国内外近年来研制和发布了多款集引文和编排参考文献功能于一体的个人参考文献管理软件,并在各高校和科研院所推广,对文献管理软件的了解并正在使用的人数比前两年也有了一定程度的增长(先前北京大学图书馆的调查结果只有9.3%),但如何进一步将其应用到研究人员的个人数字资源库的组织、管理和学术论文的撰写中还需要信息服务机构的努力和探索。
通过对上述问卷调查结果的分析,笔者认为学术科研人员个人学术信息管理的困境,究其深层原因主要归结为主观和客观两个方面。
个人学术信息空间所存储的信息具有如下几个特点:
(1)资源类型格式异构性
个人学术信息空间的资源类型多样,包括数字文档、软件、多媒体、网页、链接、Email等;资源格式复杂多样,如文档格式有doc、pdf、Latex、caj等。这种异构性来自于媒体的异构性、信息来源的异构性和组织方式的异构性。
(2)累积更新频繁
个人学术信息随着个人科研经历的丰富而不断累积。其中有些过时、陈旧的信息被剔除,与新科研任务相关的信息则随着研究进程的推进会不断收藏和增加。
(3)信息碎片化
科学研究除了需要获取学术性文献信息资源,还需要获取与科研工作有关的各种信息,如学术会议、科研基金、期刊投稿、科研人际关系等不同类型和格式的大量异构信息片断。另外,个人在科研过程中也会产生大量笔记、数据、文档。随着信息种类的多样化和信息获取渠道的日益丰富,个人学术信息空间的碎片化现象越来越严重。
上述特点,给学术科研人员信息组织和管理带来了很大的挑战。诸如参考文献管理工具之类的个人学术信息管理系统常常由于对学术科研群体的研究活动涉及的信息及信息处理目标要求分析不够,存在信息组织和管理设计上的不合理性,导致不能真正有效利用这类科研辅助工具组织管理个人学术信息空间内的信息和达到提升科研效率的目的。
从上述的调查可以得出,主观上,学术科研人员信息探寻过程的发散性和信息保存行为上的随意性,也导致了个人学术信息管理的困境。
(1)个人学术信息探寻过程的发散性
学术科研人员面对的是一个高度链接关联的网络信息空间。CNKI、Google Schholar、CiteSeerX等各种商用学术数据库基于开放链接机制、引文链接机制等使得学术信息之间高度关联。这样的学术信息关联网络,一方面为学术科研人员的学术搜索提供了极大的便利,另一方面也会因为信息搜寻过程中人类认知的复杂性,使得搜索和浏览行为往往不能总是集中于某一既定主题或与某一课题相关,而是表现出显著的“顺链而行”的发散性。这种发散性的信息探寻过程也会导致发现和获取的结果呈现出主题上的发散性,从而必然会对既定结果的保存路径或方案产生影响。
(2)个人信息保存行为的随意性
学术科研人员之所以被称为“极端信息工作者”,主要体现在整个科研过程所包含着的各种信息行为,即不断地搜索、发现、获取、存储、利用和创建信息。但是他们在保存信息的时候,常常习惯于任意堆放信息而疏于对所搜集的信息进行有效的组织和管理。比如堆放在桌面上,而不是把信息分门别类的放在对应的目录中;或者对偶然遇到的有用信息,需要及时保存的时候,随意新建文件夹或临时存放在某个已有的文件夹内,为以后使用时发现和查找带来了隐患。
解决个人学术信息管理的困境可以从如下两个层面着手:一是“工具”,即从客观上改进和优化学术信息管理工具;二是“人”,即从主观上加强学术科研人群重视学术信息的组织和管理意识的培养和技能的培训。
针对上述学术科研人员学术信息管理困境的原因,结合学术科研人员研究活动所呈现的特性,我们可以尝试从以下几个方面对现有的学术信息管理工具进行改进和优化。
(1)虚拟文件夹存储管理满足科研任务驱动
从研究活动任务驱动的特性来看,用户需要将有关同一项目(课题或主题)的信息汇集在一起,包括各种类型格式的文档、数据。虚拟文件夹存储管理模式无疑满足这一特性。它可以方便实现以项目为中心的虚拟存储和集中管理,也解决了同一信息项与多项目关联时的存储和管理问题。虚拟文件夹最大的好处是能够自由地管理文件。因为虚拟文件夹是一个容器,用来装载文件或文件夹的镜像,就如同快捷方式,而不是文件或文件夹本身。
(2)支持文档多维属性的揭示和组织
根据Kwasnik’s对办公室实体文档组织的实验研究分析得出:人们对文档的描述中,只有30%的属性是与文档有关的(如作者、文档类型、主题、题名等);而70%的属性是和用户与信息之间的交互有关的(如状态属性、处置属性、时间属性、认知状态等)〔4〕。这一结果表明用户更喜欢根据主观属性而非客观属性组织个人文档。现有的学术文献管理工具在预置文献信息的元数据构架时习惯于传统的对文献信息通用的和客观的属性进行揭示,而忽略了那70%的用户与信息之间交互的主观属性。因此,学术文献管理工具应加强“主观属性”的揭示,支持文档多维属性的丰富揭示和分面组织。
(3)支持多种元数据格式的自动捕获
对于学术科研用户来说,对每一篇收藏、保存的文档都要著录相应的元数据是阻碍参考文献管理工具推广的重要原因之一。现有的学术信息管理工具(多指“参考文献管理工具”)通常对来自数据库的学术论文、图书等结构化良好的参考文献数据有较好的支持,但对于与学术科研相关的其他众多非结构化资源类型支持不够。因此,应扩大对多种类型、格式的文档元数据捕获的支持,为各种资源类型自动预制生成相应元数据模板供用户保存资料时选择,包括音频、视频、博文、百科全书文章、论坛帖子以及即时消息等涉及科研及管理过程各种类型的非常规类型学术对象,以适应用户对学术文献和碎片化信息、文件的管理。当然,无论学术信息管理工具在自动捕获元数据方面的功能再强大,用户自身提高对保存文档元数据著录和完善重要性的认识依然是第一位的。
(4)支持即时记录碎片化信息和多终端间数据的同步
学术科研人员的研究过程也是一个创新的过程。随时随地摘录有价值的学术信息、实验数据,记录瞬间碎片化的灵感思路是其研究工作的常态。为用户提供支持即时记录和管理碎片化学术信息是迎合学术科研用户创新特性的必备功能。
科研活动的过程也是一个不断学习和不断修正优化的过程(如写作科研论文)。随着个人办公设备、移动终端的不断丰富,文献数据的同步功能变得不可或缺。数字环境下,个人学术文献管理工具应支持多台工作电脑、移动终端之间文件的存储、同步以及版本控制。同一用户不同终端设备文献数据的自动同步,省却了导出导入的烦恼,必然提升用户体验。
调查中,在进一步分析受访者的学科背景和年龄构成后,笔者发现使用辅助论文写作工具的研究人员均为有自然科学背景的中青年。这或许与自然科学领域研究人员的信息技能有关,通常这类人群技术接受能力较强,更容易尝试和掌握小工具、小软件,也可能与其学科特点、论文写作特点、参考文献著录规范等有关。
中国最有影响力的科研学术站点——小木虫〔5〕,全球华人科学社区——科学网〔6〕,其会员主要来自国内各大院校、科研院所的研究人员。小木虫网站就开辟有“科研工具”(包括参考文献管理工具)交流版块;科学网也开辟有“文献管理”、“科研经验”交流版块,包括教程、使用、心得体会的讨论和交流。这在一定程度上反映了用户有掌握参考文献管理工具为学术信息管理和论文写作提供帮助的需求。因此,在引进文献数据库平台,科研辅助软件工具时,图书馆应承担起针对学术科研人群学术信息管理意识的培养、学术信息管理工具使用技能培训的职责。比如高校和科研院所图书馆可以通过学科服务渠道传输高效的学术信息管理理念和技能。
1.Susan Kroll and Rick Forsman. A Slice of Research Life:Information Support for Research in the United States.〔2014-01-22〕.http://www.oclc.org/research/publications/library/2010/2010-15.pdf
2.包冬梅等.“学术科研人员科研信息行为与需求”的调查与分析.数字图书馆论坛,2012(5):17-26
3.JISC. Information Behavior of the Researcher of the Future.〔 2014-01-22〕.http://www.bl.uk/news/pdf/googlegen.pdf
4.Kwasnik, B.H. The Importance of Factors that are not Document Attributes in the Organization of Personal Documents. Journal of Documentation, 1991(47):389-398
5.小木虫 .〔2014-01-22〕.http://www.emuch.net
6.科学网 .〔2014-01-22〕.http://www.sciencenet.cn/