大数据时代中学术期刊的困惑及思维创新

2015-02-26 15:33:10
学报编辑论丛 2015年0期
关键词:学术期刊思维研究

孙 珏

(上海师范大学学报期刊杂志社,上海200234)

大数据时代中学术期刊的困惑及思维创新

孙珏

(上海师范大学学报期刊杂志社,上海200234)

综观目前在出版领域的大数据相关研究成果,可以发现两年来相关研究主要集中在出版产业的宏观发展图景、战略性政策、应用价值和商业运作模式上,极少涉及社科类学术期刊。笔者以教育学专业期刊为例,阐述学术期刊在大数据浪潮冲击下所产生的困惑,思考大数据思维对学术期刊深层次的影响和启发。

大数据;学术期刊;思维

2013年被定义为“大数据元年”[1],两年来,大数据研究已经从计算机科学“一枝独秀”到各行各业“全面开花”。目前,大数据在IT产业、信息通讯、市场消费及金融贸易等行业已经产生了一定的规模效应,由此也引起了公共管理部门及学术领域的高度关注。与大数据相关的社会科学方面的研究呈现出以下的特点和局限。

1 大数据在出版业领域的研究现状

综合目前在出版领域的大数据相关研究,可以发现近年来研究的特点如下:研究主要集中在出版产业的宏观发展图景以及战略性政策方针上;介绍西方出版业大数据运用的成功案例,以此对我国出版业走向有比较借鉴意义;将大数据作为出版体制改革的技术工具来论述的也比较普遍,主要探讨大数据的概念、内涵、特点、出版领域应用价值和商业运作模式。

出版业发展日新月异,责任和使命并行,正在积极把握大数据全球化这一发展趋势所带来的契机和挑战。而学术期刊也是媒介,离不开媒介发展的大环境。因此,身处出版业之中,遵循出版发展的规律,顺应出版发展的趋势,是学术期刊必须转变的观念,2011年,国家新闻出版总署要求学术期刊进行体制转型改革,目的是为了以改革促发展。作为学术期刊的编辑,笔者深切地感受到这次转型的意义重大。而与此同时,大数据正在进入出版业的方方面面,对这一领域的未来发展产生着深远的影响,并已经引起了相关专业的学者们的关注。目前,出版学界对于大数据的研究仍处于比较初步的阶段,关键在于操作性的叙述较多,深层次的思考不够,无论深度还是广度都十分有限,大数据研究极少涉及学术出版自身来探讨,即便有所涉及,将大数据与学术期刊转型结合起来的研究几乎没有深入下去。笔者以教育学专业期刊为例,阐述学术期刊面临大数据浪潮的困惑,尝试让学术期刊在思维上能有所突破。

2 在大数据热潮中学术期刊的困惑

按照维基百科的定义,大数据是指利用常用软件工具捕获、管理和处理数据所耗时间超过可容忍时间的数据集。大数据具有规模性、多样性、高速性和价值性等特点[2]。因此不少学术期刊认为大数据与以市场盈利为目的的大型出版集团有关,主要运用在出版的商业运作环节上,而学术期刊是以产生社会效益为办刊宗旨,不以盈利为目的,读者和作者都是小众群体,因此与大数据关系不大。他们产生这样的疑问在所难免。以下三点困惑是比较普遍存在的。

2.1困惑一:大数据等同于规模超大的海量数据吗?

若是以维基百科定义大数据的标准,可以说能称得上大数据的数据库真的非常少,普通的学术期刊编辑部甚至期刊杂志社日常的数据集绝大多数与大数据沾不上边。其实,大数据的大是相对而言的,不是绝对的大。对于学术期刊来说,能够尽可能地搜集创刊以来的所有数据和资料,越全面详细越好。因为所有这些数据就是元数据,即大数据的数据。可以说,每一家学术期刊编辑部都应该建立自己的大数据规划图。反过来说,海量数据并不一定能称其为大数据,因为真正体现大数据能量的是不仅要具备收集数据的能力,还要具备低成本分析数据的能力[3]。学术期刊对于大数据的关注,应该更多地放在对出版资源的获取与利用方面,因为对信息的获取和利用也是非常有价值的大数据研究一部分。

2.2困惑二:数据挖掘和分析全部需要技术支持吗?

大数据本身就是属于高科技领域的产物,整个大数据的处理流程可以定义为在合适工具的辅助下,对广泛异构的数据源进行抽取和集成,结果按照一定的标准统一存储。利用合适的数据分析技术对存储的数据进行分析,从中提取有益的知识并利用恰当的方式将结果展现给终端用户[4]。可见大数据的每一个环节都离不开计算机技术的支撑,但是大数据发展的趋势是,从数据集成到数据分析,直到最后的数据解释,简单易用应当贯穿整个流程之中。目前大数据的易用性研究还处在起步阶段,易用性表现为易见、易学、易用[4]。这将意味着学术期刊不必在内部开发或引入所有的大数据技术,可以利用云服务或预先设置好的应用程序来解决数据分析需求从而专注于学术出版业务。

2.3困惑三:社会科学研究将被大数据分析所取而代之吗?

大数据与社会科学研究一结合,就遭到了一些社会科学学者的反对和质疑。教育学教授阎光才指出:“在几乎所有的社会科学实证性研究中,研究问题的确定本身就来自人的意向性……如果没有研究者对生活世界的体验、关切、理解和自我偏好甚至价值‘偏见’在先,数据的生成和获取就成为不可思议的事情。”[5]阎光才一针见血地批判现在的教育研究为了迎合大众趣味,为了大数据而进行各种缺乏意义深度诠释的数据分析,完全是徒有形式的计数而已[5]。此番话语不无道理,这样的大数据研究只是形式上的简单模仿,根本没有掌握大数据精髓其中一二。《大数据时代》作者同样认为:“我们也要继续重视那些数据不能解释的事物:由人类的智慧、独创性、创造力造就的理念,这是大数据分析无法预测的。”[6]任何将大数据妖魔化的狂热想法或行为都是有悖于大数据精神的。在大数据出现之前,人类探索世界所使用的科学方法和工具不仅不会被大数据取代,而且会和大数据并存。大数据可以完善和补充社会科学现有的研究体系,使之更加多元多样、合乎学术规范以及精确有效。

3 突破传统:学术期刊的思维创新

“因为社会所受到的影响要比技术上的滞后几十年,真正的革命不会是一个从A点到B点的有序过渡。相反,A点到B点之间可能经过一个长期的混乱。在此混乱时期,旧的体系已经崩溃,而新的体系尚未确立。”[7]笔者认为学术期刊所受到大数据的影响可能还要滞后更长的时间,许多学术期刊人或许不会被要求投入到创新如此之大的体系中,但他们至少需要对大数据有全面和充分的认识,知道在今天这样的出版环境下如何更好地运用大数据思维,来应对学术期刊自身的转型和变革。

什么是思维?杜威对思维作了这样的定义:“知识仅仅是已经获得并储存起来的学问;而智慧(思维)则是运用学问去指导改善生活的各种能力。”[8]为什么我们首先需要启发“思维”?因为“(思维能力的各种价值是指)每个人每日、每时、每刻都需要确定他没有直接观察到的事实:这不是出于增加他的知识贮存的一般目的,而是因为事实本身对他的兴趣或者他的职业来说是重要的。”[8]所以说“谁在大数据价值链中获益最大呢?应该是那些拥有大数据思维或者说创新性思维的人。”[9]由此可见,数据的价值已经从技术转移到了数据自身和大数据思维上[6]。笔者以教育学术期刊为例,结合编辑具体实务,阐述学术期刊的大数据思维可以从以下几个方面进行创新。

3.1相关性思维,即“是什么”的问题研究

大数据时代探求的是“是什么”,而不是“为什么”,也就是关注数据值之间的相关关系。相关关系的核心是量化两个数据值之间的数理关系,相关关系强是指当一个数据值增加时,另一个数据值很有可能也会随之增加[6]。而不同于基于假设和推理分析的方法,相关关系分析法是利用数据驱动的方法来分析,它不易受到偏见或传统观点的影响,因此这种方法更加精准和高效。

以教育学术论文为例,在一篇教育专业文章的结论部分,作者通常会总结自己的研究成果,结论通常由两部分组成:①描述研究结果或调研发现了某些相关性特征及因果;②推断两个或两个以上研究的变量之间因果关系。此外,期刊编辑或评审常常要求作者在他们文章中来推测其研究对时间和政策的推动作用,因为这样会使文章体现出实践意义和应用价值,从而使其更具可读性和吸引力。不少作者被编辑引导去相信这样做会增加文章的发表概率。结果是,每篇文章几乎都包含有研究的重要性和实践意义,从而有些研究者会为了显示研究的意义而刻意设计实践中存在的问题、难点和挑战,以此来预测本研究潜在地带来的解决方案和测量。如此完美的设计看似没有缺陷,其实毫无价值,完全背离科学研究的初衷。

学术论文作者应该严格区别这两个问题:“是什么”与“可能是什么”。报告研究数据,主要是对某一研究现象尽可能全面的数据进行分析和挖掘,以及研究结论。有关实践建议应该存在于研究者和那些实践或政策领域的专家之间对话交流中,思想火花在碰撞中产生真理。这样的实践策略公开发表才合情合理,会受到政策制定的政府部门的关注,社会影响自然也会随之而来。而编辑应该理解学术刊物的学术生产和再生产之间的关系、尊重和保护学术创作的独立性与自由性,还需要与作者之间建立起一种新型的真正的学术关系,不以功利目的和固有模式来影响作者写作。

3.2复杂性思维:即整合跨学科的学术资源

从数据到大数据的演变是一个渐进的过程,它不是大数据时代简单地代替小数据时代,而是一个由简单到复杂的各种形式相互包容、不断完善的过程。在大数据时代,理论并非不重要,而是变得更加重要。我们所指的理论也并非僵化一成不变的固守旧有理论,而是在处理问题的过程中意识到海量数据所带来的复杂性,坚持分析方法和理论的不断创新[10]。如今的大数据先行者们通常都有着交叉学科和整合学科的背景,他们会将这些知识与自己所掌握的数据技术相结合,应用于广泛的领域之中。由此可见,复杂性思维可以影响着学术期刊编辑能够收集的数据类型以及我们对这些数据的挖掘分析方式,从而影响学术期刊对教育学专业领域内的学术研究展开全新的理解。

国外学术界主张发表在学术刊物上的文章,是具有科学规范的学术论文,不同于单纯的个人意见和见解。而这一点,是中国内地的很多社科类期刊,包括教育学术期刊所忽视的[11]。不少教育学论文类似于对教育教学实践、教育政策的建议,并没有样本、环境、广泛的条件、大量的调查研究概括而得来。这些建议削弱了政策和实践结论的复杂性,使建议显得浅薄而没有说服力。复杂的政策和教育实践不可能建立在如此单一的研究调查之上,甚至无论规模大小,是作者精心设计的随机干预的研究。这种推理性的建议将作者一己之见与科学依据混为一谈,不但没有任何价值,而且减弱了证据的公正性。因此,单一研究结果经各方面证实是存在缺陷的,即使表面上无缺陷,也不能普及运用[12]。

复杂性思维告诉我们,对研究成果的概括和归纳具有复杂性和艰巨性。教育学术期刊需要关注两方面的研究:一方面是研究综述、总和,包括对研究成果转化为实践或政策的实际影响的探讨等等;另一方面是针对某一项特定研究潜在的实践意义,由期刊组织评论或者对话形式的栏目,以专业视野来评估,而不同于仅仅来自于单一论文形式的研究,更多地鼓励跨学科、多学科、交叉学科以及整合学科的研究能够不断涌现。除此之外,复杂性思维还要求对学术期刊的评价也不能简单地运用某方面的统计数据就可以地进行学术评判等等,一系列的问题将来都将在大数据时代运用人类的思维和技术来得以一一解决。

3.3个性化思维:即挖掘具有巨大潜力的大数据

个性化特别是智能个性化,是大数据思维的核心,个性化技术是大数据时代最重要的技术。在大数据时代,仅仅为客户提供一个简单的登录页面已远远不能满足客户的需求,网站的设计还要给人以视觉上的吸引力。此外,网站的内容还应更加翔实,应能发挥其潜能并能实现客户的有效转化。随着社会化媒体和搜索变化更加侧重于有趣的内容及与人类有关的话题,网站的设计也要做出改变。他们需要更加重视数据驱动型设计,以创建吸引人的网站和内容——而不是去适应机器[3]。对于学术期刊来说,用户就是读者,而读者当中有不少都是作者,包括是潜在的作者,因此其个性化思维就是能在网络时代的海量数据中,挖掘出潜在的研究议题和不断变化的读者需求。

大数据时代,用户的任何一个想法或不经意的举动都是个性化需求的契机或信号。谷歌公司曾经开发了一种用户在线交互的副产品,包括浏览的网页内容、浏览的时间、鼠标光标停留的位置、上传了信息内容等,谷歌对其进行分析并反馈给系统。许多公司因此对系统进行了设计,使自己能够得到这些数据并循环利用,以改善现有的服务或开发新服务[6]。而学术期刊恰恰在这一方面是软肋,甚至是空白一片。缺少个性是困扰相当数量的教育学术期刊的严重问题。打开一些学术期刊的网站,浏览其目录如果不是看刊名,根本就分不清是哪本刊物。千刊一面、毫无特色、内容拼盘已经波及了学术期刊的网站、微博、微信公众号等数字出版形式,导致大多数学术期刊在新媒体应用方面差强人意,这些应用只是表面热闹繁荣,在专业方面有影响力的微信公众号里根本找不到学术期刊的声音,对纸质媒体的照搬做法已经远远不能满足当今读者的多元化需求。另外,数字发行的价值也被严重低估,很多学术期刊只管埋头收稿发稿,根本不问读者在哪里,他们在思考什么。

笔者曾经和一名资深编审交流过如何办刊问题,他提出最多的问题就是:“读者在哪里?”“你们找到读者了吗?”由此述及,学术数据库以及期刊的网站里有哪些读者在下载或在线浏览哪些文章?他们是在有目的地精读还是无意地略读?如何能够找到这些读者并与他们进行点对点的交流?这些是学术期刊的最大价值来源,而大量的潜在的有价值的数据还没有被开发就白白地流失掉了。一旦能够掌握这些数据,不仅可以挖掘出学术研究的潜在议题,而且还能够反复利用开发,从中找到真正的读者群和作者群。

4 结 束 语

真正的思维必然以认识到新的价值而告终的[8]。对于学术期刊来说,出版业进入大数据时代已经不再是遥远的未来,大数据带来的全新理念和价值也是不可估量。数据的价值最根本还是来自于思维上的创新,文章主要阐述了相关性思维、复杂性思维、个性化思维的内涵以及它们对学术期刊编辑方式和刊物内容的影响,大数据思维远远不止上述的这三条。笔者认为在大数据语境下,学术期刊应结合刊物自身特点,积极应对时代所带给期刊人的挑战和问题,不断进行思维创新、观念的突破,努力与大数据对接。因此,对于这一变革能够给学术期刊带来怎么的创新和发展还值得进一步探讨和研究。

[1]冯海超.大数据时代正式到来[J].互联网周刊,2012(24):36-38.

[2]Big data [EB/OL].[2015-07-15].http://.en.wikipedia.org/wiki/Big-data.

[3]大卫·芬雷布.大数据云图[M].盛杨燕,译.杭州:浙江人民出版社,2014:62.

[4]孟小峰,慈祥.大数据管理:概念、技术与挑战[J].计算机研究与发展,2013,50(1):151.

[5]阎光才.教育及社会科学研究中的数据——兼议当前的大数据热潮[J].北京大学教育评论,2013(4):82-83.

[6]维克托·迈尔-舍恩伯格,肯尼思·库克耶.与大数据同行:学习和教育的未来[M].赵中建,张燕南,译.上海:华东师范大学出版社,2015:113.

[7]舍基.人人时代:无组织的组织力量[M].胡泳,沈满琳,译.北京:中国人民大学出版社,2012:55.

[8]约翰·杜威.我们怎样思维·经验与教育[M].姜文闵,译.北京:人民教育出版社,2005.

[9]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].盛杨燕,周涛译.杭州:浙江人民出版社,2013.

[10]刘德寰,李雪莲.大数据的风险和现存问题[J].广告大观:理论版,2013(3):70.

[11]李涛.中国教育国际化战略中的教育学术期刊国际化发展[J].教育学术月刊,2011(10):12.

[12]Staines G L.The causal generalization paradox: the case of treatment outcome research [J].Review of General Psychology,2008,12:236-252.

猜你喜欢
学术期刊思维研究
思维跳跳糖
思维跳跳糖
思维跳跳糖
FMS与YBT相关性的实证研究
思维跳跳糖
辽代千人邑研究述论
学术期刊引证指标
学术期刊引证指标
视错觉在平面设计中的应用与研究
科技传播(2019年22期)2020-01-14 03:06:54
EMA伺服控制系统研究