刘丽
(北京语言大学 图书馆,北京100083)
e 印本文库(e-print archive)是开放存取(Open Access)运动推荐的一种非正式科学交流系统,旨在促进研究成果及时发布。它通过作者自存档方式收集各种形式的学术论文的电子版本,经由互联网提供全球用户开放存取。e印本是e印本文库收录的对象,最初主要是待发表的论文预印本(preprint),后来扩大到包括期刊论文、图书的部分章节等在内的已发表论文(postprint)。[1]再后来扩大到包括作者提供的与研究相关的各种形式的电子版学术论文。
e印本文库是一种促进学术研究成果及时发布的网络学术交流平台,它具有传播速度快、无出版时滞、成本低、有利于学术交流尤其是灰色文献的交流等特点,可帮助科研人员追踪本学科最新研究进展,避免重复研究。
目前,e印本文库的类型主要包括:学科e印本文库、机构e印本文库、期刊e印本文库、专类e印本文库、个人e印本文库[2]等。本文选取了国内外四个有代表性的学科e印本文库进行分析和评价,以期对e印本文库的建设和发展有所裨益。
arXiv.org是最早出现,也是现在知名度最大的e印本文库,由美国国家科学基金会和美国能源部资助,于1991年8月由美国洛斯阿拉莫斯(Los Alamos)国家实验室建立。目前,arXiv.org由美国康乃尔大学维护和管理。arXiv.org主要收录物理学、数学、计算机科学、定量生物学、定量金融学、统计学、非线性科学等,共收录文章719181篇(2011年12月1日统计)。它在世界各地设有14个镜像站点,以方便世界各国研究人员随时调用其中的文献资源。在中国的站点位于中科院理论物理研究所(http://cn.arxiv.org)。
Cogprints是在英国联合信息系统委员会的资助下,由南安普顿大学电子和计算机学系于1997年创办的认知科学的e印本文库,主要收录心理学、神经科学、语言学、计算机科学、哲学、医学、人类学以及与认知学研究相关的社会学、物理和数学等方面的文章。到目前为止共有3846篇文章(2011年12月1日统计)。
中国科技论文在线是经教育部批准,由教育部科技发展中心主办,针对科研人员普遍反映的论文发表困难,学术交流渠道窄,不利于科研成果快速、高效地转化为现实生产力而创建的科技论文网站。到目前为止共有首发论文55895篇文章(2011年12月1日统计)。
中国预印本服务系统是由中国科学技术信息研究所与国家科技图书文献中心联合建设的,以提供预印本文献资源服务为主要目的的实时学术交流系统。该系统由国内预印本服务子系统和国外预印本门户 (SINDAP)子系统构成。国内预印本服务子系统主要收藏的是国内科技工作者自由提交的预印本文章,共5499篇 (2011年12月1日统计)。国外预印本门户(SINDAP)子系统是由中国科学技术信息研究所与丹麦技术知识中心合作开发完成的,它实现了全球预印本文献资源的一站式检索。通过SINDAP子系统,用户只需输入检索式一次即可对全球知名的16个预印本系统进行检索,并可获得相应系统提供的预印本全文。目前,SINDAP子系统含有预印本二次文献记录约80万条。
e印本文库的用户主要包括作者用户和检索者用户,他们主要关注e印本文库是否便于提交论文,是否便于查找使用e印本资源,能否获得有用的高质量的信息,因此本文从审稿机制、检索功能和检索结果三个方面来分析。
各文库论文的发布流程基本一致:注册—登录—投稿—审核—发布。用户通过注册成为e印本文库的用户,登录后将自己创作的学术论文及其相关信息,如元数据等按照e印本文库的规定存入其中,一般需提供标题、作者、关键词、摘要、所属学科等信息,支持.doc、.pdf、.ps、.tex、.txt等文件格式的全文。用户也可对已提交的论文进行修改。一旦在期刊上发表,可在论文记录中加入正式发表的有关信息。arXiv.org将初稿和每次修订的稿件作为不同版本保存起来,用户可以看到修改过程中科学家之间的讨论。与其他系统不同的是,在投稿流程中,Cogprints为不同类型的内容提供了不同的投稿界面和元数据信息。[3]e印本文库对用户提交的学术论文进行快速、简单的审核,然后将其放入数据库中供大家检索利用。e印本文库一般都遵循 《开放文库计划》(OAI)协议,可实现系统互操作和数据整合,以便于向增值服务提供者提供所采集e印本的元数据记录,常见的增值服务类型有跨库检索、引文链接、长期存取等。
论文的质量控制问题是e印本文库建设和发展的难点。四个文库基本上采取文责自负原则,只对论文形式和内容进行简单的审核,比如:提交格式是否正确,论文内容是否有违法或抄袭,以及是否具有学术性等。值得一提的是,arXiv.org于2004年1月17日开始引进认证制度,根据在三个月到五年这段时间内的投稿量选择认证人,第一次提交文章的作者需要与合格的认证人联系。2007年 8月 27日,arXiv.org开始使用反剽窃软件。[4]中国科技论文在线有固定的写作模板供用户使用,成立了由35名中国科学院院士和中国工程院院士组成的顾问委员会提供学术指导,同时拥有庞大的评审专家群。采用“先公布、后评审”的论文评价方式,作者“同意评审”的论文在线公布后请几名同行专家进行评审。中国科技论文在线的专家评审表共包含两部分内容:第一部分包含论文审查的内容和综合评价意见。内容审查分别从论文题目、中文摘要、英文摘要、科学创新、研究方案、数据处理、文字表达、参考文献、学术价值9项进行打分。每个审查项目分为四档,对应的得分分别为10分、8分、5分、1分。综合评价部分由专家对论文的整体情况进行打分,给出综合的评审意见,从优先发表到不宜发表共分为五档。内容审查占总分值的40%,综合意见占总分值的60%;第二部分为专家详细修改意见,作者可根据专家的详细意见进行修改。中国科技论文在线评审系统根据专家打出的分值对应不同的星级,85分(包含85分)至100分对应五星,表示同行专家对该论文的综合评价为优秀;70分(包含70分)至85分对应四星,表示同行专家对该论文的综合评价为良好;60分(包含60分)至70分对应三星,表示同行专家对该论文的综合评价为较好;40分(包含40分)至60分对应二星,表示同行专家对该论文的综合评价为一般;0分至40分对应一星,表示同行专家对该论文的综合评价为较差。中国科技论文在线还设有“名家推荐精品论文”栏目,请知名学者推荐其研究领域内的国内外优秀论文在中国科技论文在线上发表。中国科技论文在线还特别强调在线发表论文的学术道德和行为规范。一旦确认作者的违反行为,不仅会在网上发表声明,公开点名谴责,还会撤销其已发表的论文,收回刊载证明;同时禁止其三年内在该网站发表论文,并通知其所在单位。中国预印本服务系统不收录违法或危害国家安全的文章、非学术性或非研究性的文章、已经公开发表的文章,不对文章进行学术审核。
arXiv.org有详细的“help(帮助)”信息,包括文库简介、检索帮助、用户注意事项、论文发布等内容。Cogprints有文库简介但无检索方面的说明。中国科技论文在线有“投稿帮助”和“检索帮助”。中国预印本服务系统有“系统介绍”但无检索方面的说明。各文库都提供分类浏览、文章检索(包括简单检索和高级检索)等功能,Cogprints和中国科技论文在线支持二次检索,arXiv.org和Cogprints还提供个性化推送的服务。
(1)分类浏览
各文库都提供了按类别或学科进行浏览的功能。相比较而言,国外文库的专业性更强,国内文库涉及的专业面广,比较综合。arXiv.org支持按物理学、计算机科学、数学、非线性科学、定量生物学、定量金融学、统计学等学科进行浏览,物理学有12个二级类目,每个二级类目下又包含不同个数的三级类目,数学等6个一级类目下都只有1个二级类目,每个二级类目下又有不同个数的三级类目。Cogprints将资源分为生物学、计算机科学、电子出版、期刊、语言学、神经科学、哲学、心理学等主题。Cogprints还提供按年份浏览服务。中国科技论文在线将资源划分为43个学科及一个交叉学科专题。设有首发论文、优秀学者及主要论著、名家推荐精品论文、自荐学者及主要论著、科技期刊、热度视界、博士论坛、专题论文、科技论文概要、学术圈子、电子杂志、认可专栏、多维论文创作平台等栏目。中国预印本服务系统将资源划分为自然科学、农业科学、医药科学、工程与技术科学、人文与社会科学五大类,各类下面又划分为若干个二级类目。
(2)文章检索
arXiv.org支持简单检索、高级检索、逻辑检索、通配符检索等。简单检索界面可按题名、作者、摘要、全文、文献号等字段进行检索;高级检索界面可限定年份、每页结果数等,逻辑算符包括AND、AND NOT、OR。用户可通过订阅电子邮件或RSS服务,每天跟踪arXiv.org的更新。Cogprints支持简单检索、高级检索。简单检索界面提供一个简单的查询框,没有字段的选择;高级检索界面提供全文、题名、作者、摘要、关键词等字段的检索,可选择“all of”和“any of”,可选择主题范围、文献类型、出版状态、有无参考文献、文件格式等,可限定编者、出版单位、日期等,可按作者、年份、题名排序。注册用户可设置“定期推送”选项,入藏新文献后会获得邮件通知。中国科技论文在线支持简单检索、高级检索。简单检索界面提供一个简单的查询框,可选择全部、首发论文、优秀学者、自荐学者、科技期刊、会议论文等检索范围;高级检索界面提供全文、题目、作者、作者单位、摘要、关键词等字段的检索,可选择检索范围、所属学科、起始时间、截止时间、语种、每页显示数,可按相关度、发布时间、下载次数排序。中国预印本服务系统提供标题、关键词、摘要、作者等字段的检索,可选择组配方式包括“同时包含”、“或者包含”、“不包含”,可选定全部学科或某一学科大类(包括自然科学、农业科学、医药科学、工程与技术科学、人文与社会科学)。
检索结果是用户最终想要的东西。检索结果输出格式如何、检索结果的信息描述是否全面,会在很大程度上影响用户对检索结果的判断、选择和利用。从检索结果的角度,主要考察检索结果的统计信息、显示内容(信息描述是否全面)、排序方式、显示方式,是否允许个性化定制,检索结果是否具有良好的反馈功能,是否为用户提供方便的处理检索结果的方式。arXiv.org的检索结果页面显示检索式、结果数量,每条结果记录包括题名、作者、页数、图表数、其他出处、所属学科、全文等。点击题名后可看摘要、提交记录等信息。全文文件格式包括.pdf、.ps等。Cogprints提供检索式、检索结果数量等信息,并可按EndNote、Excel、RSS等多种格式输出结果,可按作者、年份(最新的在前)、年份(最早的在前)、题名等方式排序,可选择“修正检索”或“新检索”。每条结果记录包括作者、论文发布年份、题名、文献类型等,文件格式包括.pdf、.html等。点击题名后可看到文章摘要、参考文献、元数据等,每篇参考文献都附带了“seek”功能,可帮助用户查找参考文献的全文。中国科技论文在线的检索结果页面显示检索式、结果数量,每条结果记录包括题名、作者、作者单位、所属学科、论文摘要、关键词、综合评价、同行评议、发布时间、下载次数、收藏次数等信息,文件格式为.pdf等。页面左侧还提供“缩小检索范围”的选项,用户也可按学科、时间、星级进行筛选。可选中文章进行收藏或以引文格式导出,方便用户著录参考文献。中国预印本服务系统提供检索结果数量、题名、作者、发布时间、是否在其他出版物发表过等信息,点击题名后还可看到所属分类、摘要、关键词等信息,文件格式为.doc等。
e印本文库是发布、检索、利用和评价e印本的平台,在系统功能的设计上,应该有易用的投稿界面和“投稿须知”,允许作者随时提交更新文件或修改相关信息,可通过组织同行评议、开放用户评论、择优期刊发表等措施调动作者的投稿积极性并引导作者提供高质量的论文;应该增强检索功能,提供“检索帮助”,允许高级检索、限制检索、二次检索、结果聚类或排序,在检索结果页面增加一些论文的相关指标,如同行评论、用户评论、论文星级、下载次数、收藏次数等,以便于用户发现自己需要的高质量论文,允许个性化定制等。另外,可以参考网络中常用的积分奖励模式,对投稿和发表评论给予积分奖励,积分累积值可区分用户的级别和用户可以评价的领域。[5]
[1]乔冬梅.e印本文库(e-print archive)研究——介绍一种非正式科学交流系统 [J].图书情报知识,2006(1):66-69.
[2]乔冬梅.e印本文库创建过程研究[J].情报理论与实践,2006(2):232-235.
[3]徐刘靖,陶蕾,俎宇鹏.国外三大预印本系统对比研究[J].中国索引,2008(3):56-59.
[4]刘银娣.电子印本仓储——arXiv运营情况研究[J].出版科学,2009(3):78-82.
[5]贾延霞,胡明晖.e印本文库内容质量控制保障机制研究——以中国科技论文在线为例[J].情报理论与实践,2010(11):94-97.