张耀坤,牛艳霞,汪朝州
(南昌航空大学经济管理学院,江西 南昌 330063)
当前,科研人员广泛地利用社交网络进行学术交流和协同创新,特别是新近出现的综合性学术社交网络平台如ResearchGate(以下简称RG)、Academia.edu、Mendeley等,正吸引着越来越多科研人员的关注与使用[1-3]。基于学术社交网络平台,科研人员可以及时公布和关注最新科研进展信息、共享科研成果、交流和协同解决科研过程中所遇到的问题[4]。与传统学术交流方式相比,学术社交网络使得科研人员信息共享方式更加多样化、学术交流过程更为便捷,创新过程也更趋向于开放式。
高影响力学者在科研创新中处于关键位置,是学术社交网络的核心节点,其使用行为往往具有示范带动作用,能够为学术社交网络平台带来大量有价值的内容与人脉。探索高影响力学者学术社交网络平台的使用行为,有助于对基于学术社交网络平台的科学交流行为规律加深理解,同时也能够帮助学术社交网络平台认识其核心用户特征并不断优化其服务,提升学术交流与创新效率。
本研究旨在探究高影响学者对学术社交网络平台的使用行为特征与规律,主要研究其注册行为、信息共享行为与社交行为,并研究其行为与其影响力之间的相关性。
ESI学者,全称为ESI高被引学者(ESI highly cited scholars)。美国Clarivate Analytics公司(原汤森路透知识产权与科技事业部)每年将所属学科领域论文对应年度的他引次数进行统计排序,排名在前1%的论文为该学科领域的高被引论文,其作者即为ESI高被引学者。目前,ESI相关指标已被学界所公认,因而本研究选择ESI学者作为高影响力学者的代表进行研究。
RG创立于2008年,目前已成为全球最受欢迎的学术社交网络平台之一[5]126-127。RG旨在服务全球科研工作者,通过在该平台上建立账号,用户可以发布个人最新的科研成果且免费查阅其他科研工作者发布在平台上的项目,寻找有相同研究兴趣的研究人员。本项研究选择RG作为研究平台,对ESI学者的使用行为进行研究。① ESI学者名单数据见https://clarivate.com/her/.
2.2.1 ESI学者名单的获取
本研究通过ESI学者官方网站①获取了2017年度ESI学者名单,该名单中包括3538位学者。我们对数据进行了清洗处理,重点对同一学者跨学科的情况进行了合并处理,合并后学者实为3332位。这些学者分别来自58个不同的国家和21个不同的细分学科。我们按照ISI的分类规则将该21个学科分为5个大类,分别为工程学、自然科学、健康科学、生命科学及社会科学,以进行后期分析(见图1)。
图1 ESI学者分布及其RG注册数
2.2.2 ESI学者RG行为数据获取
本研究通过以下过程来获取ESI学者在RG平台上的行为数据:
首先,在RG平台上手工检索学者姓名。考虑到国内外对姓名认知的差异以及学者注册时可能使用的姓名的差异,其检索规则采用Mas-Bleda[6]提出的方案。同时考虑到存在重名现象,应结合学者单位、学位等信息共同筛选,以确定该学者是否已进行注册。如已注册,则记录其个人主页(Profile)的URL。
其次,利用自主开发的数据获取软件,通过URL获取并解析已注册ESI学者基本信息,记录各相关指标数据,各指标(见表1)的具体意义可参见RG网站。在研究资料下,列有较多二级类目,如论文、会议论文、报告、全文(Full-text)等,因数量较多,不一一列举。值得注意的是,全文并非是指该学者所拥有的研究资料的全文数,而是特指由该学者亲自上传的全文总数。
表1 RG用户信息分类及其指标
2.2.3 ESI学者RG行为数据处理与分析
本次采集到的行为指标数据存在很多指标数据特别是二级指标数据缺失的情况,为了后续统计,笔者人工进行缺失值补0。数据处理完毕后从三个方面对数据进行分析:一是对ESI学者注册行为进行分析,重点考察学科对于其注册行为的影响;二是对ESI学者的信息共享行为和社交行为进行分析,对相应的指标数据进行描述性统计分析;三是对ESI学者学术RG显示度与影响力指标数据进行描述性统计分析,并对信息共享行为、社交行为与影响力之间的相关性进行深入分析。
本研究中,ESI学者在RG平台上的注册率为38.66%(1288/3332)。目前,已有较多研究针对学者对学术社交网络平台的注册比率进行了调查研究。其中,《Nature》杂志社的调查研究由于样本量较大而较为具有代表性。该调查于2014年展开,来自全球的3000多名学者回复了这项调查,有接近一半的学者回应称知晓并经常访问RG。而这其中,有29%的学者注册了RG账户[5]127。从注册比例来看,本研究中的注册比例远高于《Nature》调查中用户的注册比例(折算比例约15%)。对相关研究的综合分析表明,学者使用RG的目的主要有社交与互动、信息获取和知识分享、进行学术合作等[7]。从RG的功能来看,仅有信息获取比如检索文献、下载文献等不需要进行注册,其他均需注册。因而,本项研究表明ESI学者可能比一般学者对于学术社交网络平台的使用意愿更为强烈。同时,从时间上看,近些年学术社交网络平台日益盛行,学者对于学术社交网络平台的接受度日益提高,这也是ESI学者RG注册比例较高的原因之一。
当前,研究人员的在线显示(online presence)已成为提升其学术影响力的重要渠道。在传统网络环境下,研究人员创建个人主页,或者在机构网站上展示个人信息成为通行做法。而在社会网络环境下,研究人员则广泛利用社交媒体来“创建、促进和测度学术声望”[8],并由此“获得、保持在线学术身份”[9]。尽管存有疑问,但仍有部分研究指出,对社交工具的利用能够帮助研究人员及其研究成果获取更为广泛的关注[10]。RG作为专门服务于科研群体的学术社交网络服务,为已注册研究人员提供创建主页(Profile)、上传研究论文、关注同行、参与主题讨论等功能,显然能够为研究人员带来最大限度的学术影响力提升效应,因而ESI学者的高注册率便不难理解。
本文也对不同学科ESI学者注册情况进行了深入分析,其结果如图1所示。图1显示,社会科学领域ESI学者尽管在绝对数量上不占优势,但其注册比例最高。注册比例及卡方检验(Chi-square tests)数据也显示,社会科学与工程学、生命科学之间注册率极为接近,并不存在显著差异(p>0.05),但与健康科学、自然科学之间存在显著差异(p<0.05)。
以往的研究表明,不同学科学者对于学术社交网络平台的采纳率存在差异,同时对于不同学术社交网络平台的使用也存在倾向性,比如自然科学学者较社会科学学者更倾向于使用RG[13]。显然,本文对于ESI学者的研究结果与上述结论既有共性,亦有差异。
一方面,本文研究结论显示,不同学科之间对学术社交网络平台的注册和采纳行为确实存在一定差异,而这一点至关重要,它至少意味着学术社交网络服务的设计与优化应当遵循“领域导向”(domain-oriented)的基本原则。当前,许多新的针对科研群体的学术社交网络平台不断出现,以我国为例,万方等知名学术信息企业均有意涉足该项服务。但令人遗憾的是,相关服务并没有考虑这一特性,同质化现象较为严重。
另一方面,本文的研究也发现,社会科学领域ESI学者RG注册率最高,这与以往的调查结论有所不同。笔者认为这一结果反映出社会科学领域的ESI学者相比普通学者群体而言,对学术社交网络平台的使用意愿更为强烈,同时也隐含着这样一个观点,即随着时间的变化,学术社交网络平台的服务和用户群体都处于变化当中,而学科群体的聚集是对变化最为直观的反映,这也提示学术社交网络平台应不断跟踪用户行为模式的变化,以便不断优化服务。由于研究平台单一的局限性,笔者无法考察本文的观察是否是特例。但显然,以往这种笼统的结论可能会隐藏某些学科或特殊群体的交流行为特质,形成固有错误观念并进而可能导致未来服务的偏差。
科研信息的共享是学术社交网络平台的重要功能之一。研究表明,获取科研信息特别是文献是研究人员使用学术社交网络平台的重要动机。RG为研究人员共享科研信息提供了十分便捷的渠道,研究人员可以共享研究项目信息和研究资料。这些信息中,一部分已经公开出版或公布,如项目、论文、会议论文等;另一部分则没有公开出版或公布,如报告(Presentation)等。对于已经公开的特别是已公开出版的资料,RG能够较为全面地收录,并且提供了作者认领机制,允许系统向已注册用户推荐与其姓名相符的已公开发布的研究资料信息,用户可以确认该资料是否为自己发表的资料。对于未公开出版或公布的信息,则大多依赖用户自己手动添加相关信息进行共享。本文对ESI学者共享的信息进行了统计,其结果见表2。
表2 ESI学者RG信息共享行为指标的统计(N=1288)
整体上看,各项数据均不遵从正态分布。进一步的数据拟合则表明,各项数据分布大多近似于幂律分布,说明少数ESI学者共享了较多的信息,而大多数ESI学者只共享了为数不多的信息。进一步地将数据进行细分,则可以发现其中存在的一些差异。
针对已公开出版或公布信息的共享,ESI学者总体呈现较高的水平:每位学者平均提交了2.74个项目,最高的提交了35个科研项目信息;每位学者平均提交了364.12项研究资料,最高的提交了2962项研究资料。通过数据可以确认的是,一方面,RG提供的认领机制是非常有效的。这一机制免除了用户手工输入信息的烦琐,有利于吸引并维系更多的用户使用,也有利于为用户提供最大的显示度。另一方面,ESI学者通过共享信息来扩展自己学术影响力的意愿非常强烈。在学术界,学者在个人网站或所在机构网站提供自己主持或参与的科研项目信息以及发表的论文信息等已是惯例。社会网络环境下,ESI学者可以通过社交网络平台(如LinkedIn等)来公开信息以扩大学术影响力,而RG作为新型的学术交流平台,无疑为这种行为提供了极佳的机会[12]。值得注意的是,正如我们之前观察到的,全文数代表了用户自主(非经其他人)上传的全文数量,代表了用户主动共享论文资料的真实意愿。笔者统计分析了全文数据,其平均值为112.53项,其共享全文的平均比例达30%,可见ESI学者通过共享公开研究资料以扩大学术影响力的意愿之强。
针对非公开出版或公布信息的共享,ESI学者则总体呈现较低的水平,在可观测的项目上,预印本的人均提交量仅为0.048项,最高仅为11项;而报告(Presentation)的人均提交量仅为0.13项,最高提交量仅为10项。除该两项之外,其他项目观测水平均非常之低。这一原因主要有二:一是RG对非公开出版或公布信息无法提供认领机制,必须由用户自主手工录入相关信息,对于ESI学者而言,可能并没有太多时间用于信息的录入;二是,学者影响力主要来源于公开出版的信息,非公开出版或公布信息对于学术影响力的提升较为有限,学者共享此类信息的意愿较弱。
社交也是学术社交网络平台的重要功能之一。对于学术社交网络平台而言,其创立的目的便是经由社交关系进而达到学术交流的目的。RG为用户提供了三个细分社交功能:一是对于个人信息的展示,主要包括对个人履历、研究专长(Skills and expertise)以及所关注的研究主题(Topics)的展示;二是学者对于其他学者的关注;三是在平台提出问题与回答问题。本文对涉及的功能各指标进行了统计分析(表3)。
表3 ESI学者RG社交行为指标的统计(N=1288)
RG提供了基于研究主题的信息汇聚机制,在研究主题下,汇聚了最新的项目、论文、问答以及专家等。用户可以选择是否擅长于该主题,一旦选择,则其所有共享的信息都将及时汇聚到该主题下。用户也可以关注某主题以获取最新信息。统计数据显示,ESI学者人均提供了11.78个研究特长点,说明ESI学者对外信息展示、共享研究信息的意愿较强。与此同时,ESI学者人均关注了6.57个研究主题,与其提供的特长点数量相比,悬殊较大。事实上,选择的特长点越多,意味着ESI学者的科研信息可能在更广的群体中扩散。而关注的主题越多,则意味其接收到其他学者的科研信息越多,同时无关信息也可能越多,所以在关注主题方面,ESI学者尤为谨慎,更倾向于选择与自己需求密切相关的主题。
与传统学术交流平台不同的是,学术社交网络平台用户经由关注(Following)与被关注(Followers)形成社交关系,并经由该关系形成学术信息的追踪与学术信息的交流。关注行为代表了学者的主动社交行为,一旦关注了某学者,可以在系统中得到对于该学者所共享科研信息的自动推送,同时也可能增加与其他学者交流的概率。从表3数据来看,ESI学者人均关注了81.05人。我们与耿斌等人[13]对南京大学学者在RG平台的平均关注数(20.22)进行了比较。可以发现,ESI学者关注的人数远超平均水平,其社交意愿总体较为强烈。
除此之外,RG还提供了问答机制,允许用户提出问题,并回答别人所提出的问题[14]。问答机制是RG提供给用户非常重要的交流渠道,但已有研究也表明,与微博等社交工具不同的是,研究人员似乎很少使用学术社交网站进行非正式的个人交流[9]。表3数据显示,ESI学者平均仅提出了0.03项问题,仅回答了0.51项问题,其整体参与问答进行非正式交流的意愿较弱。这些数据也暗示,ESI学者更倾向于进行基于信息共享的正式信息交流。目前,已有相关研究对研究人员使用学术社交网络平台的动机进行了分析,结果显示学术性动机比社交动机更为重要[15]。研究人员通过关注其他学者以跟踪最新研究进展情况、获取研究资源,同时也在平台上分享自身的研究项目、研究资料等,以最大限度地扩大自身学术影响力和显示度。显然,这一行为对于良性的学术社交生态系统构建至关重要。
在学术社交网络平台上,学者的影响力既有传统的学术影响力,同时也包含了其社交影响力。RG提供了若干指标以测度用户的影响力,除了以往业内所熟知的被引次数、h指数外,RG还提供了被关注数、被阅读数、RG指数等自定义指标。根据RG对各指标的说明,被关注数及被阅读数大致可以被视为社交影响力指标,而被引、h指数则通常被视为学术影响力指标,RG指数则两者兼顾。各相关指标统计分析结果见表4。
表4结果显示,ESI学者平均得到了520.32人的关注,平均被阅读次数为32700.76次,平均被引次数为23868.55,RG指数平均为41.97,h指数平均值为62.44。总体上看,ESI学者无论是学术影响力还是社交影响力都非常高,这既是对ESI学者群体影响力的客观体现,同时也说明RG作为学术社交网络平台的巨大价值所在。尽管如此,数据也表明,仍有部分ESI学者在初始注册后,未能持续使用RG,说明RG在吸引ESI学者持续使用方面仍有进步空间。
为了探讨ESI学者使用行为对其影响力的影响,笔者对RG中相关指标进行了相关性检验。根据K-S检验结果,选取非参数检验中的Spearman检验方法,其检验结果如表5所示。
表5 不同测度指标之间的相关性
注:*相关性在0.05水平上显著(双尾);**在0.01水平(双尾)上呈现显著相关。
3.4.1 ESI学者信息共享行为与影响力的相关性
表5结果显示,ESI学者所共享的项目与研究资料之间存在较强的相关性(r=0.539>0.5)。一般而言,ESI学者主持项目越多,其研究产出也可能更多,也更愿意将研究资料予以共享。我们重点关注ESI学者信息共享行为对其影响力的影响。
针对ESI学者RG平台社交影响力的分析可表明,ESI学者所共享的信息(项目与研究资料)与被关注、被阅读之间均存在较强的相关性(r>0.5),这说明用户在平台上共享的信息越多,就有更大的概率获得其他学者关注,同时也能获取更多的阅读次数,因而可以认为ESI学者共享信息可以提升其社交影响力。
笔者对ESI学者所共享信息与其RG平台学术影响力的相关性也进行了分析。分析结果表明,ESI学者所共享的研究资料与其被引、h指数之间均存在较强的相关性(0.7 相关性检验结果还表明,ESI学者共享信息行为与RG指数之间的相关性均高于其与社交影响力和学术影响力指标之间的相关性。在社交网络时代,发展有效的学者影响力替代测度指标已成为一种趋势。RG指数作为RG平台独有的指标,有效地结合了社交与学术影响力,成为衡量学者影响力的重要途径。 3.4.2 ESI学者社交行为与影响力的相关性 本研究考察了ESI学者社交行为与其信息共享行为及影响力指标之间的相关性。数据显示,ESI学者社交行为指标与其信息共享行为指标之间仅存在非常弱的相关性或不存在相关性(表5)。笔者重点关注ESI学者社交行为对其影响力的影响。 数据显示,ESI学者社交行为指标(特长、主题、关注)与社交影响力指标(被关注、被阅读)之间仅存在非常弱的相关性,仅关注与被关注这两个指标存在较弱的相关性(r=0.415),同时与学术影响力指标(被引、h指数)之间几乎不存在相关性或存在极弱的相关性。这充分说明,目前ESI学者在RG上的社交行为对于其社交影响力和学术影响力的提升极为有限。 本文以2017年ESI学者为研究对象,研究了其对RG的使用行为特征与规律。本文的主要研究结论如下: (1)ESI学者在RG平台上的注册率高达38.66%,其对于学术社交网络平台的采纳意愿非常强,同时学科的差异性也客观存在,社会科学领域ESI学者的使用意愿最为强烈。 (2)ESI学者更倾向于共享公开的项目和研究资料等能够提升显示度和影响力的信息,对于未公开发布或出版信息的共享意愿较弱。 (3)ESI学者RG平台上的社交行为以信息的展示和信息的获取为主,而对基于问答的信息交流行为参与意愿较弱。 (4)ESI学者信息共享行为能显著提升其社交和学术影响力,而现有的社交行为则对其社交和学术影响提升作用有限。 本研究也存在以下一些不足之处:首先,本研究只考虑了RG这一平台,而对于其他学术社交网络平台的考察则未能进行,这导致研究结论的推广上具有一定局限性;其次,本研究对使用行为的划分较为粗略,同时对使用行为的表征过于强调量化研究,而对相应的质性研究缺乏关注,比如对用户所提供的个人履历、问答内容的分析等,这有赖于后续更为深入的研究。4 研究结论与不足之处