应用大数据思维对科技论文信息价值整合再利用的探讨

2015-04-10 06:25林培德
韶关学院学报 2015年2期
关键词:办刊大数据时代

林培德

(广东省医学学术交流中心 广东省医学情报研究所《广东医学》编辑部,广东广州510180)

应用大数据思维对科技论文信息价值整合再利用的探讨

林培德

(广东省医学学术交流中心 广东省医学情报研究所《广东医学》编辑部,广东广州510180)

摘要:应用近年兴起的“大数据”思维,从稿件中提取研究类型、基金课题、栏目、所在专科、当前身份、所在地等信息,整合并分析这些信息与作者的投稿行为的关系,为科技期刊编辑部办刊提供数据化的参考.

关键词:大数据时代;科技期刊编辑部;办刊

2013年十分畅销的《大数据时代:生活、工作与思维的大变革》指出,在大数据时代,人们不再认为数据是静止和陈旧的.但在以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了[1].大数据时代的来临使人类第一次有机会和条件,在非常多的领域和非常深入的层次获得和使用全面数据、完整数据和系统数据,深入探索现实世界的规律,获取过去不可能获取的知识.例如,2014年初,央视晚间新闻“据说春运”特别节目,首次采用百度地图LBS定位的可视化大数据,播报国内春节人口迁徙情况[2].目前,大数据时代思维在科技期刊办刊方面的应用还鲜有报道,对科技期刊编辑出版印刷的革命性影响是否存在、何时到来还是个未知之数.但就笔者看来,大数据主要是大量数据的储存即再利用,既然已经身处在这样的时代,不妨应用这样的思维对科技期刊编辑工作进行再思考.《广东医学》从2010年起改半月刊,在国内的省级医学杂志中,属于刊期较短的那极少数期刊之一[3],2013年收稿7 800余份,近3年年均收稿量已接近7 000份,应也属于收稿量较大的那极少数期刊之一[4].对于期刊编辑部,期刊的生命之源就是稿件,笔者认为,面对如此大的数据,对编辑部发展而言应该是一笔财富.现就如何应用大数据思维对科技论文信息价值的整合再利用进行如下探讨.

1 稿件的研究内容分析

1.1研究类型

根据研究类型不同,大致可划分为体外研究、体内研究、临床研究.目前国内科技期刊有4 758本,其中医学类期刊又占了较大比例,987本[3],差异化发展是必然局面,因此,每本期刊都有自己的选稿偏好.比如广东医学编辑部选稿以临床研究为主,虽然从每期刊发的版面即可体现,但笔者在平时工作中发现还是有相当部分作者投稿前对该杂志知之甚少.如果通过对稿件此项目数据的再分析,发现投稿本身的构成比与每期刊发的研究类型所占版面的构成比有较大出入的话,则应考虑是否调整选稿范围,或者在《稿约》或者网站适当提醒,引导作者.

1.2基金课题

基金课题按所申请部门的级别可以分为:国际级、国家级、省级、市级.按是个否有基金资助可以分为有基金资助、自筹经费.由于课题申报是有一定审核程序的,如果稿件标记了课题,则提示稿件涉及的研究内容已经经过专家审核,内容具备一定新颖性.并且,从级别以及有无经费资助也可以一定程度再对新颖性做划分.如果通过对稿件此项目数据的再分析,发现某类课题的稿件少了,可以对此进行分析,是否该课题验收的要求中,又或者是之前对此课题稿件的处理不当,打击了作者再次投稿的积极性,进一步总结出原因和相应的应对措施.

1.3栏目

生物医学类期刊论文按照论著、综述、短篇3种栏目[5].论著多为前瞻性的研究,或者内容较多且有一定深度的回顾性研究,而综述多为开展某项研究前对该领域的研究状况进行一定汇总分析,以找到该选题尚有研究价值的突破口.短篇报道和病例报告多为涉及内容深度较浅或病例数过少无法展开较有说服力的论证,只为及时报道传播一定信息的文献类型.由于论著类文章可能阅读价值总体更大些,所以对来稿构成比的分析上,也应注意按类型进行一定的分析.

2 稿件的作者信息分析

2.1所在专科

由于传播阅读方面的特点[6-7],对于具体从事某专科研究的学者,中华医学杂志社各专科期刊的吸引力会比其他综合性期刊大,将自己的研究成果在更有利于交流的平台发表是情理之中.但随着科学研究的深入,所涉及的面也会更窄,甚至分化出新的学科,对于部分新兴学科还没有对应的专科杂志的情况,较有影像力的综合性期刊则是他们较好的选择.因此,作为综合性期刊,定期分析所收稿件的专科分布,可能有利于争取优质稿源.另外,由于科技期刊繁多,不同的科技期刊的要求也不完全一致,有时作者会因为较熟悉某科技期刊的流程,而将自己相当一部分的稿件投给该科技期刊,如果科技期刊的处理过程产生了良好的口碑,则可能该专科的同行也会较多考虑该科技期刊作为投稿首选.时刻关注专科的分布,也有利于排查既往处理稿件有无不当之处,维护刊物在该专科医生中的口碑.

2.2当前身份

就目前而言,将自己的研究成果总结成一篇科技论文,是一个较为适当的方式,也是目前较多评审里所需考核的环节.因此,了解不同作者的身份,有助于了解目前科技论文在发表交流之外的作用以及趋势.假如在数据统计时发现第一作者所署单位是高校非教研室、即学生身份者或在职求学者,则提示此科技论文与毕业、学位获取有较大关系.如果作者职称是中级或副高级职称,参照该单位或所在省份晋升职称的相关要求,则可推测此科技论文是否与晋升职称有一定关系.而如果是高级职称或者在单位里担任一定职务的,则可能此科技论文与年度考虑有一定关系.总之,充分了解科技论文的其他用途,也有利于争取优质稿源.

2.3所在地

分析稿件作者所在地,与分析稿件作者身份作用类似,也是通过投稿的数量、质量来分析当地的相关政策要求是否对刊物收稿造成影响.其中需要考虑诸如省份、所在工作单位,其中医院又可划分为附属医院和非附属医院,高校以及其他科研院所.如果前后两年某省份、地区或某高校的稿件较少,则应警惕该地区或单位对刊物的认定出现了变化.

3 目前存在的问题和面临的挑战

3.1数据的核实

要想得出科学的分析结果,首先肯定需要确认数据的真实性.在日常工作中,笔者发现,可能由于理解上的错位,有部分稿件的基金课题的标注并不严谨,所标课题的研究内容并非所投稿件的核心内容.但由于作者邮寄单位证明和基金批复复印件与编辑部对稿件相关信息的录入有时间差,所以如果编辑部在查收了基金批复复印件,发现两者研究内容并不相关,应及时在科技期刊采编办公系统中进行修正,以利于后期的数据分析.

3.2数据量

顾名思义,“大数据”的分析依据是数据,而且是大量的数据.在接触这个概念的时候,比如书籍、新闻报道,其中提及的数据分析者均为著名企业.作为单个科技期刊编辑部,从各方面的能力上是无法与那些企业相提并论的.尤其是从数据量上,有着天壤之别,而数据量一旦不够大,则分析的基础不牢靠,推理出来的结论适用性和实用性可能会受影响.如果全年的收稿量不多的编辑部,可考虑延长收集数据的时间窗.

3.3数据残缺

虽然近年来很多同行已经引入了办公系统,设立了自己期刊的官方网站,但对数据的处理以及获取仍未重视,目前应用大数据时代思维收集本刊编辑部数据进行分析,为自身发展方面提供依据的探索还鲜有报道.广东医学编辑部于2007年启用科技期刊采编办公系统,随后则开始了漫长的登录官网投稿和电子邮件投稿共存的时期.通过官网投稿的稿件,由于投稿程序相对完整,投稿者提供给给编辑部的数据相对齐全,而且编辑部对重点关注的项目可以通过流程上的设置而让每个作者在完成投稿之时即提供完整,规范作者的投稿操作.相对而言,电子邮件投稿,在简化了投稿步骤的同时,也丢失了大量的数据.假如作者通过自己的电子邮箱发送一份电子邮件给编辑部,附件即为其所投稿件的电子版,虽然关键的稿件电子版编辑部已经采集完整,但编辑部必须从这份电子邮件提取各种数据填写进采编系统,鉴于2013年广东医学编辑部的收稿量已接近8 000份,如果有一半的稿件的信息需要编辑部去后期补充的话,工作量是巨大的,而在人员相对不足的情况下,电子邮件投稿的稿件,则以残缺的数据量录入进了采编系统.需指出的是,对4 000篇稿件相关信息完整的数据进行分析,与对8 000篇稿件中一半的相关信息完整的数据进行分析,虽然工作量可能接近,但是后一种分析效能会较差.

3.4相关硬件的支持

不管是安装了科技期刊采编办公系统的各个编辑的办公电脑,还是维持官方网站运行的服务器以及数据库,都是不可忽略的硬件支持.在2007年,广东医学编辑部购买的全套办公软件在当时是相对先进的,但可能软件在设计之初只考虑了业界大部分编辑部的办公情况,在本刊编辑部收稿量超过5 000份的时候,科技期刊采编办公系统的运行已不如当初,数据量的增速与基数已超出了软件设计之初的范畴,软件运行报错、卡顿等情况已时有发生,对编辑部的日常工作造成了不可忽略的影响.而以收稿量稳定增加的态势,2014年的全年收稿量有可能超过8 000份.并且,软件设计之初未处于“大数据时代”,可能未考虑编辑部对数据的再利用,所以部分功能仍不完善.是否需要更换能支持大数据量运行的办公系统是个值得思考的问题.

3.5服务意识的延伸

笔者认为,在投稿环节上体现编辑部的服务意识,是让作者在投稿操作上减少不必要的操作.作者是可以合理交流的朋友,而不是高高在上的“上帝”,此处的“必要”也应尝试从编辑部角度进行思考.如果编辑部的工作强度并无法支撑大量残缺数据的补充录入,则在投稿时提示作者录入对编辑部日后发展可能有用的信息,比如前文提及的一些项目,对分析可能用处不大的信息则无需作者填写.以并不让作者厌烦的程度让零散的各位作者花极少的时间补全信息是可取的,“化整为零”的思路是处理此矛盾的关键所在.如果说纸稿时代确实难以支持对稿件大数据的分析,只能着眼于具体稿件的认真处理,以此来体现服务意识的话,那么在有条件分析大数据的时代,对来稿数据的科学分析有助于提高编辑部的竞争力,提高编辑部服务作者的能力,才是新时代的服务意识,或者说旧时代服务意识的延伸.

综上所述,虽然单个编辑部并无法完成像google或百度那种大企业有条件收集大量的数据并进行分析,但是,既然已是“大数据时代”,那么作为科技期刊编辑工作者,完全有必要了解这种思维,思考是否稿件研究、作者信息等数据背后还蕴藏着什么能利于编辑部发展的财富,尝试运用新事物、新思维为传统的编辑出版行业添加新的活力.目前同行在此方面的探索还较少,本文的思考可能还有欠成熟的地方,还有待同行们予以指正.

参考文献:

[1]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杨燕,周涛,译.杭州:浙江人民出版社,2012:7.

[2]中国新闻网.央视携手百度看春运:大数据下的中国人口迁徙[EB/OL].(2014-01-26)[2014-04-20]http://finance.chinanews.com/ it/2014/01-26/5782141.shtml.

[3]郭玉,赵新力,潘云涛,等.我国科技期刊基本状况统计与分析[J].编辑学报,2006,18(1):1-4.

[4]刘振兴,郭志明,万玉玲.中国科学院科技期刊编辑队伍的现状、问题与建议[J].中国科技期刊研究,2007,18(1):34-37.

[5]李宏伟,张威.科技论文题名字数统计分析及建议[J].中国科技期刊研究,2012,23(5):821-824.

[6]王慧瑾,邓德灵.医学研究生科研意识状态分析[J].华夏医学,2012,25(6):963.

[7]杜利民.科技期刊进行刊后跟踪报道的研究[J].中国科技期刊研究,2007,18(3):421-423.

(责任编辑:邵晓军)

中图分类号:G23

文献标识码:A

文章编号:1007-5348(2015)02-0066-04

[收稿日期]2014-09-22

[作者简介]林培德(1984-),男,广东汕头人,广东省医学学术交流中心,广东省医学情报研究所《广东医学》编辑部编辑;研究方向:编辑学.

Methods of Editorial Department of Academic Journals Management in an Age of Big Data

LIN Pei-de

Abstract:Based on recently popular Age of Big Data methods,study patterns,fund projects,columns,departments, identity,and areas were collected from articles.Above information were combined and analyzed,in order to reveal the relations between the behavior and the information,thus to provide digital information for editorial department of academic journals.

Key words:Age of Big Data;editorial department of academic journals;management

猜你喜欢
办刊大数据时代
《粮油食品科技》办刊理念视觉表达
全省首届少儿期刊办刊经验交流会在长沙召开
论蒙古语内部期刊办刊难题及解决方法
大数据时代下计算机信息处理技术的应用
大数据时代背景下高职院校宣传思想工作的思考与实践
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
坚持开门办刊,讲好行业故事
借助院校资源提升高职学报办刊质量