基于大数据的科技期刊数字化转型研究

2014-08-22 09:05易基圣
关键词:科技期刊选题编辑部

易基圣

(中国航船研究设计中心 《中国舰船研究》编辑部,湖北 武汉 430064)

随着移动互联网、物联网、WEB2.0等技术的兴起,人类产出和拥有的数据量呈现爆发性增长,人类社会已经进入一个数据驱动的时代——大数据(Big Data)时代。关于大数据,尚没有统一的定义,但其3V属性[1-2],即规模性(Volume)、多样性(Variety)和高速性(Velocity)已得到广泛认同。规模性是指数据量巨大,量级至少达到TB(1012B)级,甚至是PB(1015B)级以上;多样性是指数据类型繁杂,既包括结构化数据,又包括半结构化和非结构化数据(如社交网络数据、搜索记录、音视频数据,等);高速性是指数据变化速度快,每时每刻均有海量的新数据在创建、发布、处理和分析,并且这种速度还在持续加快。

近年来,大数据已成为学术界关注的热点。世界顶级的《自然》(Nature)[3]和《科学》(Science)[4]杂志先后于2008年和2011年推出大数据专刊,主要围绕科学研究中的大数据问题展开讨论,说明了大数据对于科学研究的重要性。被誉为“大数据时代预言家”的英国牛津大学教授舍恩伯格则认为,大数据将从根本上改变人类认知世界的方式,改变人类生活和工作的方式,开启一次重大的时代转型[5]。

国内期刊界也开始关注大数据的影响。吴锋[6]认为,大数据对科技期刊出版具有革命性的影响,将推进科技期刊编辑流程的再优化、科技期刊出版业态的多媒体化和科技期刊评价规则的多元化。祝兴平[7]以龙源期刊网Top100期刊排行榜为例,分析了“大数据”对期刊产业数字出版的影响。田丁[8]认为,在大数据时代,科技期刊出版将快速变迁到数据化与多媒体化,科技文献将是数据、可视化和多功能分析软件共存的混合体,未来将出现期刊平台集约化与期刊个体全媒体、特色化发展的新形态。

下面,笔者拟结合科技期刊出版的主要流程,分析大数据在这些流程中的应用,及其对提升办刊质量、促进科技期刊数字化转型的影响。

一、基于大数据的选题与组稿

选题与组稿是科技期刊出版工作的重要流程。科技期刊为了提升品牌形象,扩大影响力,无不重视选题和组稿。在“小数据”时代,科技期刊在选题、组稿和约稿方面存在多种做法。有的建立了选题论证会商制度,通过责任编辑、编辑部主任和编委会三级会商来确定选题;有的动员编辑人员走出办公室,深入科研院所、高等院校和重点实验室等科研生产一线,与科研人员交朋友,了解科研进展,提供信息支持,主动捕捉选题和进行组稿;有的要求编委会成员参与组稿和约稿,甚至下达明确的数量指标;有的通过承办或参与学术会议组稿和约稿;有的则通过定向发布征稿函组稿和约稿。应该承认,这些做法均有一定作用,有些期刊甚至运作得相当成功。但是,其也存在一些不足,期刊选题容易局限在本单位、本系统的某一些研究方向或研究人员身上,“圈子”比较小,视野比较窄,学术思想容易形成固定的模式,导致“近亲繁殖”;时间和人力开销大;选题和组稿的预见性和超前性较差等等。

在大数据时代,有望克服上述不足。在大数据时代,决策将日益基于数据和分析得出,而不是基于经验和直觉判断做出。大数据面对的是全体数据,可以摆脱传统上对随机采样的依赖;大数据可以挖掘事物之间的相关关系,预测人类的行为。例如,2009年,谷歌公司仅凭网民搜索留下的痕迹,就比疾病控制中心提前两周准确预测了特定地区和州甲型H1N1流感的爆发,准确率高达97%。2013年,又成功预测了美国流感的暴发[5]。

因此,在大数据时代,可以通过监测搜索引擎中的热词、社交网站中的评论、博客中的发贴和跟贴等,了解并预测读者的需求,了解新的学术成果,洞察本学科或专业的新动向和新趋势,把握学术热点,确保期刊选题具有先进性、前瞻性和针对性。可以了解和掌握作者的研究兴趣和专长、承担的基金项目及其研究进展、合作关系、引证关系、作者的投稿习惯、论文产出率等,从而遴选、培养和挖掘出期刊的核心作者,有针对性地组稿和约稿。

二、基于大数据的期刊审稿

科技期刊的审稿工作大多采用“三审制”,即编辑初审、同行评审和主编(或编委会)终审。其中,同行专家的评审意见是期刊编辑部决定论文是否可以发表的主要依据。同行评审是由同一领域的其他专家学者对论文的创新性、科学性和应用价值等进行综合评价的过程。对期刊编辑部而言,同行评审专家的数量多寡、专业分布、专家的学养甚至个性等均会对审稿质量和进度带来影响。尽管期刊编辑部可以通过征集、推荐等方式丰富审稿专家库,但由于学科专业的细化和交叉化,常常发生审稿专家对待审论文所涉专业不熟悉或不感兴趣,导致出现退审、审稿时间延误、审稿意见不具体甚至不客观等问题。这些问题的出现,使编辑部在决定稿件取舍上不能很好地把握,从而影响期刊发表论文的质量。

在大数据时代,编辑部可以利用大数据对来稿的创新性进行初步判断,淘汰一部分不符合要求的来稿,从而减小同行专家评审的压力。当前,期刊编辑部应用的学术不端行为检测系统是大数据局部应用的一个例子。但是,在辅助进行创新性判断方面尚不够全面。若能利用大数据对作者以往的研究成果、发表的文献及作者的学术影响力进行综合分析,则对来稿创新性的判断将会更准确。

此外,编辑部可以利用大数据遴选审稿专家和实现智能送审。通过大数据分析,可以区分出审稿专家的主要研究方向和次要研究方向,掌握专家在当前时期的研究兴趣,保证将合适的稿件送给合适的同行评审,避免专家对论文所涉领域不熟悉或不感兴趣而导致退审或审稿不积极的情形,最大程度地减小评审偏差,从而提高审稿质量。

大数据还可能催生出新的审稿模式。大数据审稿平台可以引入核心审稿人+开放评审相结合的方式,评阅可以像现行方式一样采用双盲制。在系统设定的评审期限内,所有对待审论文感兴趣的人均可作为开放评阅人发表评论,作者也可在线答辩。在审稿期结束时,大数据审稿系统结合核心审稿人和开放评审的意见,给出综合评审意见。对于开放评审意见,不再讲求“精确”而是讲求“概率”,即不要求作者对每一位开放评阅人的意见均做出回应或修改,但应尊重多数人的意见。编辑部在决定稿件取舍时,对于核心审稿人和开放评审分别给予不同的权重,从而实现量化评审。

三、基于大数据的编辑加工

编辑加工是编辑出版工作的重要环节,是由编辑人员对决定采用的文稿进一步审读、修改和整理的过程。编辑加工的目的是在不损伤原稿基本内容的情况下通过内容加工、文字加工和技术加工进一步提高文稿的质量,力求做到术语规范、语言通顺、表达清晰、符合相关编辑出版标准。编辑加工质量的好坏,取决于编辑本身的学科背景、工作经验、业务水平、语言功底以及对编辑规范的理解等诸多方面。为了提高编辑加工质量,一些编辑部常常采取不同编辑交叉核对等措施,以相互补位、减少差错。尽管如此,由于科技期刊涉及的内容比较广泛、新颖和精深,学科交叉现象又非常普遍,因此,编辑加工时仅靠编辑个人的学识是远远不够的。尤其是年轻编辑,在编辑加工时往往感到无所适从。

大数据可使编辑人员“站在巨人的肩膀上”,迅速获取前人积累的知识和经验。当编辑面对个人难以准确把握的概念、术语、知识点、用法或其他疑难问题时,大数据就是最好的老师。大数据(如Google scholar)不一定能告诉你应该采用哪一种文稿加工方法,以及为什么要采用那种加工方法,但是,它一定可以告诉你哪一种用法是最多人使用的、出现频率最高的。在大数据时代,“相信大多数人”的做法,将有助于提高编辑加工的质量、减少不必要的差错,促进编辑人员的知识积累和成长。

四、基于大数据的精准传播

随着数字化和网络化的不断发展,科技期刊除了发行质纸版之外,大都以各种形式开始了数字化转型。有的加入国内外的期刊数字化集成平台(如国外的汤森路透、爱思唯尔、斯普林格,等;国内的中国知网、万方数字化期刊群、维普中国科技期刊全文数据库,等);有的建立了基于期刊集群的行业门户;有的建立了自有版权的期刊网站;有的利用微博、微信等社交网络开展了跨媒体发布。但是,上述数字化发布形式基本上属于“广播”性质,编辑部关心的只是以各种渠道尽快将期刊内容传播出去,至于读者是否阅读了、是谁阅读了、读后有何反馈,等等,则较少关注。

大数据则将关注并分析读者的阅读行为(例如,读者的浏览记录、下载记录、引用记录、付费记录、发表的言论及评价,等)以及读者的身份信息(例如,性别、年龄、教育背景、职业、所在地域,等)。通过对大数据的分析,可以准确把握读者的兴趣,筛选出读者关注的议题,准确定位读者群体,从而进行精准的、个性化的内容推送。

五、基于大数据的一体化期刊编审发布平台

从上述分析可以看出,大数据的应用离不开面向期刊出版的大数据平台。目前的集成期刊编审系统实现了在线投稿、审稿、网络发布(甚至是跨媒体发布和数字优先出版)等功能,有的还集成了基于大数据的学术不端行为检测、参考文献核对等功能。但是,尚未集成基于大数据的智能选题、审稿专家挖掘和智能送审、知识搜索、阅读行为监测和精准推送等功能。

随着大数据应用的深入,基于大数据的一体化期刊编审发布平台(图1)必将与期刊的整个出版流程全方位对接,串联起期刊出版的整个生态链,从而对科技期刊的数字化转型带来革命性影响。

图1 基于大数据的一体化期刊编审发布平台

大数据对于转变编辑工作模式、扩大期刊影响力具有重要意义,但是,大数据分析及其应用需要建立起基于大数据的一体化期刊编审发布平台,这有赖于期刊主管部门、相关IT企业和编辑出版单位的共同努力。此外,应该指出的是,由于大数据可以监测、分析和预测人的行为,因此,如何管理和利用这些数据,使其价值最大化,而又不侵犯人的隐私权,也是大数据应用中需要解决的关键问题之一。

参考文献:

[1]Wikipedia.Big data[EB/OL].http://en.wikipedia.org/wiki/big_data,2014-05-21.

[2]CHEN Jinchuan,CHEN Yueguo,DU Xiaoyong,et al.Big data challenge: a data management perspective[J].Frontiers of Computer Science in China,2013(2).

[3]Nature.Big Data[EB/OL].http://www.nature.com/nature/journal/v455/n7209/edsumm/e080904-01.html,2008-09-04.

[4]Science.Special online collection: Dealing with data [EB/OL].http://www.sciencemag.org/site/special/data/,2011-02-11.

[5](美)舍恩伯格·V.M.,库克耶·K.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

[6]吴锋.“大数据时代”科技期刊的出版革命及面临挑战[J].出版发行研究,2013(8).

[7]祝兴平.“大数据”与期刊产业的数字出版[J].出版参考,2013(34).

[8]田丁.大数据时代科技期刊的未来形态[J].中国科技期刊研究,2014(2).

猜你喜欢
科技期刊选题编辑部
科技期刊的分类
科技期刊的分类
科技期刊的分类
科技期刊的分类
本刊诚征“独唱团”选题
谈诗词的选题
本刊诚征“独唱团”选题
本刊诚征“独唱团”选题
编辑部的春天日常
疯狂编辑部之鸭腿饭(四)