严炜炜 温馨 刘倩 易胜伟
关键词:ischool;学术社交网络;用户行为;被关注一关注比例;ResearchGate
学术社交网络可以帮助科研人员在专业学术领域内.以专业知识为主题开展知识共享与交流等活动,其不仅改变并拓展了科研人员信息交流方式,也使得科研人员在知识搜寻、知识交流和知识贡献等方面有迹可循。当前,以ResearchGate(RG)、Academia.edu、Mendeley等为代表的学术社交网络已得到了科研人员的广泛认可。尤其是对图书情报学科学者而言,其不仅已成为学科热点研究对象,也吸引着本学科学者的参与和利用,以适应管理类学科用户强烈的在线学术社交倾向。而iSchool联盟作为全球顶尖信息科学学院联盟,代表着国内外图书情报学科领域的知名院校.其成员机构用户参与学术社交网络的情况反映了图书情报学科领域对学术社交网络的前沿利用状态。
另一方面,学术社交网络面向用户提供了各种计量指标,而其指标在学术影响力评价中的效用也已成为近年来学术社交网络相关研究的关键问题。研究不仅揭示了学术社交网络指标与传统文献计量之间存在显著相关关系:同时还将学术社交网络指标与机构排名(如Webometrics世界大学排名、QS世界大学排名、泰晤士报高等教育世界大学排名等)指标相比较,显示了学术社交网络指标在机构评价中的效用。此外,RG还将用户的综合表现转化成学术绩效指标(RG Score),其与文献计量学的强相关性表明具有较高学术影响力的科研人员亦具有较强的社会影响。
学术社交网络的社交属性功能及相关指标还为用户的细分提供了新的依据,学术社交网络用户的关注与被关注数量在研究中即被用作用户分类的度量依据。而被关注一关注比例指标也在相关研究中被证明可作为学术社交网络用户细分的依据,即用户依据其被关注一关注比例可细分为:明星型用户(比率≥3)、社交型用户(1/3<比率<3)、搜寻型用户(比率≤1/3)3类;其中明星型用户关注内容和应用服务,社交型用户重视群体与活动,搜寻型用户关注导航与推荐。显然,基于被关注一关注比例的用户细分方式可支撑机构用户结构与利用行为的比较揭示。
因此,本文选择iSchool成员机构作为研究对象,利用被关注一关注比例对用户进行分类,结合学术社交网络指标探究学术社交网络图书情报学科用户结构和利用差异,并从机构所属地区、机构层级两个视角进行比较分析,旨在揭示图书情报学科用户对学术社交网络的利用特征,为激励图书情报学科用户参与并科学合理的利用学术社交网络提供参考。
1数据获取与处理
在国内外多元化学术社交网络中.RG在支持协同交互的功能服务、用户群体分布和用户交互参与程度上具有明显的比较优势。截至2019年1月,RG共拥有来自193个国家和地区的超过1500万的用户,同时iSchool成员机构在该平台内同样具有数量可观的用户基础。因而本文选择RG作为学术社交网络平台的代表,进行iSchool成员机构用户的数据获取和分析。
为获取样本数据,首先从iSchool官方网站中获取所有正式成员机构名单,在RG中检索获取各机构在RG中的用户列表页面,然后编写Py-.thon程序爬取各个机构所有用户的URL链接,并对各个用户页面中的姓名、RG Score、成果数量、成果被浏览量、成果被引用量、關注数量、被关注数量等字段进行爬取。其中,用户的关注与被关注数量作为用户分类指标,通过计算被关注一关注比例,设定阈值为1/3和3划分用户群体,并剔除关注或被关注数量为零的用户样本:而用户的成果数量、成果被浏览量、成果被引用量等指标则用于用户的利用特征分析。
此外,iSchool官方网站提供了地区与机构层级两种分类方式。其中,按地区划分为亚太、欧洲和北美,按机构层级将正式成员机构划分为6个级别(iCaucus、Enabling、Sustaining、Supporting、Basic)。由于iCaucus作为iSchool的决策机构,在全球图书情报学科处于绝对领先地位,所以本文从学术水平能力和管理等级方面将样本中的机构层级划分为理事会成员(iCaucus)和其他。iSchool官方网站提供的分类可为后文的地区、机构层级分类与比较提供了科学合理的依据,便于后续从地区、机构层级等视角分类比较与展开讨论。
研究样本数据的信息采集时间为2018年11月28日至2018年12月29日,总计包含61所机构的用户信息,剔除页面失效等成员机构用户数据后,最终得到4723条有效信息。
2iSchool成员机构的学术社交网络用户结构分析
依据被关注一关注比例进行的用户分类结果显示,在RG中iSchool成员用户共包含明星型用户有1076人(22.78%)、社交型用户有1757人(37.20%)、搜寻型用户有1890人(40.02%)。由于明星型用户通常具有最高的学术声誉和影响力,而搜寻型用户与之相反,故而整体上iSchool成员机构用户在学术社交网络中学术影响力有限,相较而言用户更多地以获取学术信息资源为核心目的.寻求学术交流和拓展学术关系网络的社交性用户比例也较高。
2.1地区间iSchool成员机构用户结构比较分析
地区间的iSchool成员机构用户结构比较首先将iSchool机构分为亚太、北美和欧洲3个地区,并比较各地区明星型、社交型、搜寻型用户占地区整体用户数量的比例,结果如表1所示。
社交型用户在亚太(37.47%)、北美(37.75%)和欧洲(36.23%)中的比例基本相同,体现了图书情报学科用户在学术社交网络中对社交属性功能的稳定需求。相对而言,亚太和欧洲的用户结构基本相同,北美则相较于亚太和欧洲拥有较多的明星型用户(26.61%)和较少的搜寻型用户(35.64%),即北美地区iSchool成员机构用户的学术影响力整体更高。
图1进一步揭示了按地区分类的各用户类型占各个机構用户总人数的比例。从各地区iSchool成员机构的均值表现上来看,其比较趋势与表1所示的整体用户结构基本一致,个别排序差异变化发生于用户比例接近的地区之间。如亚太地区iSchool成员机构的社交型用户比例均值(41.34%)在图2中稍高于北美地区(39.21%)。而从各地区iSchool成员机构的各类用户比例分布上来看,亚太地区(明星型用户15.22%~50.00%,社交型用户23.53%~55.56%,搜寻型用户8.33%~52.64%)和北美地区(明星型用户10.91%~52.73%,社交型用户21.28%~50.00%,搜寻型用户9.09%~59.57%)iSchool成员机构间的差异均比较显著,而欧洲的用户类型比例分布范围则相对较小(明星型用户16.00%~32.00%,社交型用户26.79%~58.00%,搜寻型用户26.00%~55.36%,即该地区的iSchool机构间用户结构相近。此外,图2中还显示了部分用户比例结构相对异常的奇异点。如北美的加利福尼亚大学尔湾分校.其明星型用户超过了60%,而搜寻型用户则不足3%,这可能是由于RG在该成员机构内的普及程度有限,使得其参与用户均是有一定影响力的学者且对学术社交网络的利用较为积极。而拥有相对较高社交型用户比例(66.67%)的首尔大学,则可能是由于该机构的样本用户数有限(仅12人),影响到该机构的用户结构整体分布。
2.2机构层级间iSchool成员用户类型分布比较分析
机构层级间的iSchool成员机构用户结构比较则将iSchool的机构分为iCaucus和其他(非iCau.cus的会员)进行分析,比较不同用户类型占该机构层级整体用户数量的比例的差异,如表2所示。
与地区间的用户结构比较结果相似.社交型用户在iSchool不同机构层级间的表现差异并不明显:而iCaucus机构的明星型用户占比(26.01%)则要明显高于其他机构(20.34%)。iCaucus机构的用户结构与北美iSchool机构的用户结构具有整体的一致性.表现出了在图书情报学科具有学术领先水平的机构在学术社交网络中用户结构特征,即在稳定的社交需求表现下,相对其他机构而言具有更高比例的明星型用户。
图2则揭示了按机构层级分类的各机构用户类型占比。各机构的均值表现与表2的整体用户结构一致,iCaucus机构的明星型用户(28.13%)和社交型用户(39.42%)的比例均值高于其他机构(明星型用户23.50%,社交型用户39.29%),而搜寻型用户的比例均值(32.45%)则低于其他机构(37.21%)。从各机构层级iSchool成员机构的各类用户比例分布上来看,iCaucus机构(明星型用户13.43%~61.76%,社交型用户26.42%~50.00%,搜寻型用户2.94%~59.57%)的机构间用户结构差异较为显著;对于其他机构而言,除社交型用户(23.53%~58.00%)同iCaucus机构一样相对较广外,其余用户的机构整体差异均相对较小,如明星型用户(10.91%~36.84%),搜寻型用户(22.22%~55.36%)。在奇异点中,可以发现除首尔大学和马里兰大学帕克分校外,罗格斯大学和延世大学在各自机构层级间也具有用户结构的明显差异性。
3iSchool成员机构的学术社交网络利用差异分析
为进一步揭示不同iSchool成员机构对学术社交网络的利用差异,本文同样从地区和机构层级两个视角,结合其他RG指标(包括RG Score、成果数量、成果平均被引用量、成果平均被阅读量、关注量和被关注量等)对iSchool成员机构用户的综合表现进行比较分析。
3.1地区间iSchool成员机构RG利用差异比较分析
表3显示了按地区区分的各类型用户在各RG指标上的均值表现,以结合RG指标揭示不同地区对RG的利用情况。其中,活跃用户占比是以RGScore为衡量依据,由于RG Score是衡量用户在RG中的综合表现与影响力,对于RG Score≥0.01的用户视为RG的活跃用户。显然,整体而言,明星型用户的活跃用户占比最高(66.30%),社交型其次(43.31%),搜寻型最少(8.52%);地区间比较而言,北美的明星型和社交型用户的活跃用户占比最多,亚太的搜寻型用户活跃用户占比最多。此外,在明星型用户和社交型用户中,北美地区的所有RG指标均高于亚太和欧洲地区:而搜寻型用户中,除成果平均被阅读量外,亚太地区的其他RG指标均高于北美和欧洲地区。对于成果平均被阅读量指标的差异表现.可能是由于成果全文是否可阅读性以及RG用户频繁上传新成果而导致均值下降.最终导致了其指标表现与其他指标之间的差异。
为了进一步探究地区间用户在各RG指标上的表现是否具有显著差异,本文采用Kruskal-Wallis检验方法进行验证,该检验方法适用于在样本受限和总体分布未知的情形下的多个独立样本之间的差异比较。检验结果显示,在95%置信水平下,不同地区明星型用户在活跃用户占比(p=0.001)、RG Score(p=0.016)、成果平均被引用量(p=0.001)3个指标上表现具有显著性差异;不同地区社交型用户在活跃用户占比(p=0.017)、成果平均被引用量(p=0.000)、成果平均被阅读量指标(p=0.014)上具有显著性差异;而不同地区搜寻型用户仅在RG Score(p=0.044)具有显著性差异。以上结果表明从搜寻型到明星型,地区间用户学术影响力的差距越来越明显,明星型和社交型用户在地区间拥有学术社交网络参与和学术影响力上较为明显的差异。
根据以上比较结果.北美的明星型用户和社交型用户表现突出.说明北美iSchool机构成员用户对RG的利用程度更高,用户更愿意将RG作为一种展现自我和进行互动的平台;而亚太地区的搜寻型用户的表现较好,说明亚太地区将RG更多的作为一个信息搜寻工具,更多地关注他人,以获得相关的学术动态和信息。
3.2机构层级间iSchool成员RG利用情况比较分析
表4为不同机构层级间各用户类型的RG指标平均值,以反映不同机构层级对RG的利用情况。从活跃用户占比来看,不论何种用户类型,iCau.CHS机构的活跃用户占比均高于其他机构,说明整体而言,iCaucus机构用户的活跃度要高于其他机构用户。此外,除搜寻型用户的成果平均被浏览量和关注量指标外,其余无论是明星型、社交型还是搜寻型用户,iCaucus的各RG指标均高于其他类型的机构用户。而前文也提到,成果平均被阅读量会受到许多因素影响而受到波动.而关注量主要体现用户积极参与互动和利用学术社交网络获取学术信息的意愿,主要反映出在学术社交网络的参与情况。
进一步采用Mann-Whitney检验比较iSchool机构层级间各指标差异的显著性。Mann-Whitney检验适用于在样本受限和总体分布未知的情形下的两个独立样本之间的差异比较。结果显示,在95%的置信水平下,RG Score指标仅明星型用户具有显著性差异(p=0.009),这表明机构层级间的差距主要体现在明星型用户中:同时被关注量的显著性检验结果(p=0.028)也反映出相同的结果,结合iCaucus在各RG指标中更佳的表现.指标的显著性可能由于iCaucus本身拥有较多的具有学术影响力的成员机构用户.他们很好地利用学术社交网络并在其中同样拥有较高的学术声誉且受到更多的关注。同时从具有显著性差异的指标数量来看,明星型用户同样与社交型和搜寻型用户相比,较多的指标具有显著性差异.明星型用户在机构层级间拥有较为明显的学术影响力差异。
根据以上比较结果.iCaucus机构用户能更有效的利用学术社交网络并在其分析学术资源,而其他机构用户则更多地利用学术社交网络进行学术资源的跟踪获取.即具有较高机构层级和影响力的iSchool机构在RG中表现出较好的学术社交网络声誉和影响力。同时在RG中RG指标对iSchool机构层级间的区分效果比较理想,能够反映出iSchool机构层级间明显的差异。
4结语
本文以61所iSchool机构为样本,从地区和机构层级的角度,利用被关注一关注比例对样本在RG上的用户结构和RG利用情况进行分析。结果显示,从地区的角度来看,北美地区拥有较多的明星型用户和较少的搜寻型用户,用户参与的活跃度高于亚太和欧洲两个地区:亚太和北美地区机构间的用户结构的差异性较大,而欧洲地区机构间的用户结构则较为相似:北美机构在明星型用户和社交型用户对RG利用情况高于另外两个地区,反映了北美机构更倾向于将RG作为一个展示自我学术能力和进行交互沟通的平台,而亚太机构在搜寻型用户对RG利用情况较高,体现了亚太将RG更视为一个学术信息搜寻的工具。从机构层级的角度来看,iCaucus相较于其他机构拥有更多的明星型用户和更少的搜寻型用户,且RG的整体利用情况要高于其他机构,说明iCaucus机构用户能更有效的利用学术社交网络,并表现出更多的学术资源分享行为,而其他机构用户的跟踪获取学术资源需求更普遍:iCaucus机构的机构间用户结构的差异性大于其他机构。同时,基于RG指标,iSchool机构差异在RG整体利用水平上得以体现。
研究结论综合揭示了对于图书情报学科而言,學术影响力和机构层级领先的iSchool成员机构对学术社交网络的利用更加积极并更有效地利用了学术社交网络。此外,iSchool在学术社交网络中整体的搜寻型用户占比较高.用户实际对学术社交网络的利用还不够理想,而学术社交网络的利用程度可以反映出机构在网络中的学术影响力和声誉.因此iSchool机构的成员可通过激励和优化学术社交网络的使用,以提升机构在网络中的学术影响力。
此外,本文仍存在不足之处.机构层级间的分类仅分为了iCaucus和非iCaucus两类.后续研究可进行更深入的分类比较。在今后的研究中还可以结合各机构中科研人员的身份.对学术社交网络中的用户进一步筛选,并探究其学术社交网络的利用特征。