我国网格服务研究进展

2013-04-29 19:34孙雨生陈卫
现代情报 2013年7期
关键词:社会网络分析文献计量

孙雨生 陈卫

〔摘要〕本文以CNKI收录的2003-2012年间321篇网格服务文献为研究对象,采用文献计量、社会网络分析法,从文献的年代、来源期刊及基金资助分布,作者合作关系、研究机构合作关系,研究热点及其演进等方面可视化分析了国内网格服务研究进展。

〔关键词〕网格服务;文献计量;社会网络分析

DOI:10.3969/j.issn.1008-0821.2013.07.024

〔中图分类号〕TP393〔文献标识码〕A〔文章编号〕1008-0821(2013)07-0102-10

Research Development of Grid Service in China

——Bibliometric and Mapping Knowledge Domains Analysis Based on CNKI from 2003 to 2012Sun YushengChen Wei

(School of Management,Hubei University of Technology,Wuhan 430068,China)

〔Abstract〕With 321 literature on grid service indexed by CNKI from 2003 to 2012 as research object,this article visually unveiled research progress of grid service in China,adopting the methodology of bibliometric and social network analysis in the perspectives of literature distribution of age,journals and funds,author cooperation,institution cooperation,research hotspots and their evolution.

〔Key words〕grid service;bibliometric;social network analysis

随着网格技术逐步发展和成熟应用,网格服务已从独立应用程序和中间件发展到对Web服务标准的融合[1],广泛用于以分布式服务集成为主要特征的科研和商业领域,逐步形成面向服务的网格应用环境和全球网格服务体系。近几年,随着云计算迅猛发展,网格服务受关注度有所下降,同时出现较多云计算和网格比较研究(笔者以CNKI为信息源,以“网格”和“云计算”为关键词组合在题名中检索,结果为期刊论文26篇,硕士论文1篇),甚至有学者提出“云格”来实现两者优势互补,以降低网格复杂度、提升云计算安全性,因此,有必要定量分析国内网格服务、云计算研究,深度对比两者基本状况、研究群体及研究机构、研究热点等,以准确认识两者联系与区别。

本文主要用文献计量和社会网络分析法,从基本研究状况、研究群体及机构、研究热点等角度揭示国内网格服务研究进展。

1数据来源、研究框架与研究方法

1.1数据来源

为全面掌握国内网格服务研究状况,笔者以CNKI的中国学术期刊网络出版总库为信息源,用关键词“网格服务”在题名中进行检索(检索日期为2013年1月15日),结果为2003-2012年间共发表321篇期刊文献,其中,“网格服务”最早出现在张立红等于2003年发表的《面向金融服务的开放网格服务架构》中。

1.2研究框架与研究方法

笔者基于文献计量和社会网络分析法构建的国内网格服务研究进展分析框架与方法见图1,主要由数据收集、数据分析及数据可视化构成并逐层推进,最终得出国内网格服务研究进展。实施步骤:首先,确定文献来源(笔者选择CNKI),下载数据并用Excel 2010预处理;其次,对收集的数据进行词频分析,得出国内网格服务发展历程、来源期刊、基金资助、研究群体及研究机构、研究热点等统计结果;再次,通过共词分析揭示国内网格服务研究热点、作者及研究机构合作关系等并进行可视化显示;最后,结合词频分析、共词分析结果等,得出国内网格服务研究进展。

图1国内网格服务研究进展分析框架与方法

2研究结果分析

2.1文献分布分析

2.1.1年代分布

文献年代分布一定程度反映领域学术研究水平和发展速度[2],国内网格服务文献年代分布及趋势见表1和图2。可看出,该领域起步于2003年,到2012年连续有研究成果出现,大致分为4阶段:2003-2004年为起步阶段,网格服务随2002年OGSA提出而产生,国内相关研究开始兴起;2005-2006年为高速发展阶段,文献产出快速增加,每年递增20篇左右;2007-2009年为产出稳定阶段,相关成果缓慢递减,但发文量仍保持较高水平;2010-2012年为产出递减阶段,由于某种原因(笔者通过研究,认为主要是由于部分网格服务核心研究者转向云计算研究),研究成果大幅减少,产出低于平均水平,因此2010年是国内网格服务研究转折点,到2012年时,几乎回到2004年水平,文献产出基本保持稳定。

2.1.2来源期刊分布

来源期刊分布分析领域文献发表期刊分布状况,为读者、学者获取信息、发表论文提供指导,方便主办方把握办刊方向[3]。网格服务文献刊载在148种期刊上;发文2篇及以上期刊见图3,共载文212篇,占总量66.04%,是国内网格服务文献重要来源,且多属计算机与互联网类期刊和大学学报;根据布拉德福定律,核心期刊刊载文献量占文献总量1/3,前9种期刊共载文102篇,占总量31.78%,为国内刊载网格服务文献核心期刊。

2.1.3基金资助分布

基金资助文献是由国家各级政府、部门和社会团体等资助的项目,在研究过程中或结题时发表的文献[4],常反映领域科研创新能力和前沿动态[5]。2003-2012年该领域321篇文献中共207篇获基金资助,比例为64.49%,其中,国家自科、国家社科及教育部基金资助文献149篇(若一篇文献同时获多个基金共同资助,仅计1次),占基金资助文献总量71.98%,说明国家对网格服务研究投入力度最大,推动作用较强,省市级基金资助文献78篇(含一篇文献获不同类型基金资助情形),其他来源基金(主要包括学校科研基金、企业公司基金)资助文献共24篇(含一篇文献获不同类型基金资助情形)。国内网格服务基金资助文献年代分布趋势见图2,可看出,与所有文献年代分布趋势基本保持一致,且在2012年呈上升趋势,说明虽然国内网格服务文献总量在减少,但相关基金仍较关注该领域。

2.2文献作者分析

2.2.1高产作者分析

国内网格服务文献作者统计见表2,共657位。根据洛卡特定律,当领域发表1篇文献作者达到60%左右时,其核心作者群便会形成[6],国内网格服务发文1篇作者高达83.26%,其核心作者群尚未形成。根据普赖斯定律,高产作者最低发文量N=0.749×Nmax,Nmax是统计年限内最高产作者发文量[7],根据表2可算出N=2.37,即高产作者最低发文量为3篇。由表2可得共41人,占总量6.24%,累计发文97篇(剔除合作作者在文献中共现导致的重复累计情形),占总量30.22%,虽未达到普赖斯提出图3国内网格服务文献来源期刊分布(2003-2012,3篇以上)

的标准(50%),但贡献仍相当可观。

2.2.2作者合作分析

科研合作对降低科研难度、提高成果含金量、产出率有重要意义[8]。笔者主要分析作者合作度、合作率及合作网络,以揭示国内网格服务作者群及其合作关系。

(1)合作度与合作率

合作度与合作率是衡量作者合作状况的文献计量指标。前者指篇均作者数,说明合作规模[9],后者指合著文献占文献总量比重。2003-2012年国内网格服务作者合作度和合作率趋势见图4,各阶段合作率一直处于较高水平,基本达到80%,合作度虽有起伏,但基本都在2.5以上,两者均值分别为85.41%和2.72。可见,网格服务研究难度较大,且2011年开始合作度猛增,说明其研究深度在增加,难度在加大。因而高水平网格服务研究需进行合作。

图4国内网格服务作者合作度、合作率趋势(2003-2012)

(2)合作网络可视化

①合作网络构建

考虑到核心作者贡献、作者规模过大导致合作网络关系过于复杂及显示效果不够理想等原因,笔者先用Excel生成该领域文献中作者出现频次不小于2的110名作者的合作矩阵,再用Ucinet进行社会网络分析,用Netdraw可视化显示国内网格服务作者合作网络,见图5。其中,节点及连线代表作者及合作关系,连线粗细和数值表示合作强度及次数。

②合作网络结构分析

由图5可看出,国内网格服务作者间多存在合作关系(110名作者间合作关系共107对),且合作强度普遍在2以上(共90对),具体分为29个合作子网(节点数为2的合图5国内网格服务研究作者合作网络(2003-2012)

作子网14个,节点数为3~6的合作子网13个,节点数超过6的合作子网仅2个)。可见,多数网格服务文献由两位作者合作完成;合作关系固定的研究群体较多,合作4次以上的关系有6对,其中李志蜀与卢暾合作5次,吴澄和王跃宣合作4次,王汝传和邓松合作4次,朱建军、贺小箭、肖小聪所在研究群体进行的4次研究均由3人共同完成;6人以上的合作网络分别以杨扬、李志蜀(卢暾)为核心,为揭示两者区别,笔者通过Ucinet的Network菜单分析整体合作网络中心性,见表4。其中,杨扬、李志蜀和卢暾的程度中心度排名前三,李志蜀和卢暾属同一合作子网,说明一个群体以杨扬为核心,另一群体以李志蜀和卢暾为核心,他们在各自研究群体中起决定性作用。此外,杨扬所在合作网络呈星状,中心性过高,需进行改善。李志蜀和卢暾所在合作网络信息共享最强,删除任何一节点均不影响整体网络连通,成员间合作更频繁,合作关系较理想。

2.3.1发文量分析

机构发文量体现其在相关领域的研究实力及影响力[5],国内网格服务发文3篇以上研究机构见图6。笔者将研究机构分为高校、科研院所、企业公司及其他共3类。高校发文量最多,共279篇(含不同类型机构合作情形),其中北京科技大学信息工程学院发文11篇,中南大学信息科学与工程学院发文9篇;其次是科研院所,共48篇,其中中科院计算机网络信息中心发文9篇;企业公司及其他单位共发文14篇。可见,国内网格服务研究集中在高校和科研院所,这与其技术前沿性、基金资助多投向高校和科研院所有较大关系,使得高校和科研院所在该领域发展较迅速,研究水平较高。值得注意的是,网格服务已引起地方企业公司关注,有从高校、研究所走向实际应用趋势。图6国内网格服务研究机构发文量(2003-2012,3篇以上)

2.3.2合作分析

国内网格服务研究机构合作网络见图7(去除孤立点和合作关系仅在两机构间且仅合作1次的合作子网),其中,节点及连线代表研究机构及合作关系,连线粗细及数值表示合作强度和次数。该合作网络共86对合作关系,各合作子网中多数研究机构仅与一个研究机构合作且只有1次,合作2次以上的关系仅11对,说明国内网格服务研究机构间合作限制因素较多,未形成稳定合作关系;机构合作多在省内高校及科研院所间,跨省合作且合作达2次的只有上海交通大学、湖南科技大学和武汉理工大学构成的合作子网;最大合作子网以中科院研究生院为中心,合作关系较固定,但基本在中科院体系内部完成;值得注意的是:南京大学与南京邮电大学在该领域合作密切;而发文最多的北京科技大学虽与多家机构合作,但均只有1次,合作关系不稳定,多数研究在其内部完成。

2.4研究热点及其演进分析

研究热点常随时间推进而变化,最终形成研究脉络[10],笔者用关键词词频分析法、共词分析法研究国内网格服务4阶段研究热点及其演化,以识别该领域研究脉络。

2.4.1关键词词频、共词分析

关键词可揭示文献所属领域和研究主题,关键词词频分析揭示领域研究热度,研究主题与热点分布,关键词共词分析揭示领域研究热点联系及演进规律。2003-2012年国内网格服务研究各阶段频次排名前25位的关键词见表5,四阶段关键词整体状况见表6。

可看出,“网格服务”、“网格”、“OGSA”、“Web服务”、“Globus Toolkit”始终频次较高,说明网格服务以网格、OGSA、Web服务、Globus Toolkit等为核心和基础。就数量而言,起步阶段多数关键词均只出现1~2次,但篇均关键词数为2.94,说明该阶段研究重点较分散,主题较广,当然文献总量较少也是客观原因。高速发展和产出稳定阶段文献数量较多,高频关键词较多。限于发文量锐减,产出递减阶段关键词频次大幅下降。就内容而言,各阶段均重视技术与方法研究,其中,本体、服务管理(描述、注册、发布、发现、组合、挖掘等)、工作流始终受关注,是研究核心和热点,且对服务管理、本体和具体应用的研究逐步加深,OGSA研究则逐渐减弱。此外,起步阶段还较关注体系结构,高速发展阶段还较关注网格服务安全,产出稳定阶段逐步关注实现和应用,与电子商务、数字图书馆等领域联系密切;产出递减阶段还关注网格服务应用,与供应链、制造网格等领域关系密切。

2.4.2高被引文献分析

高被引文献可反映文献依据科学性、学术影响力及文献间关联[11],反映研究热点、研究方向。通常,被引频次越高,文献作者影响力越大,受关注度越高[12]。国内网格服务研究文献共216篇被引用过,占总量67.29%,总被引频次为1 206,篇均被引频次为3.76。h-b指数常用于确定研究领域高被引文献,所谓h-b指数是指在研究领域的文献集N中,h篇文献每篇至少被引h次,剩余N-h篇文献的被引频次均不大于h,h即为该领域的h-b指数[13]。据此可得国内网格服务高被引文献共13篇,累计被引386次,占总量32.01%,相关信息见表8。其中,3篇处在2003-2004年,内容为网格服务定位机制、数据管理框架等;9篇(8篇为2006年发表)处在2005-2006年,侧重网格服务调度算法、体系结构及开发、具体应用等;1篇处于2007-2009年,内容为资源聚类;2010-1012年无高被引文献,一方面该阶段文献发表较晚,尚未受到普遍关注,另一方面说明近些年该领域无重大理论或技术突破。结合文献分布结果,可得出,2006年是网格服务研究沉淀期,文献数量达到峰值,质量提升;此外,该领域主要关注调度算法、智能管理、具体应用等。

3结论与分析

本文从文献年代、来源期刊与基金资助分布,作者合作、研究机构合作、研究热点等方面揭示了2003-2012年国内网格服务研究进展。2005-2006年是国内网格服务研究高速发展期,2006年研究产出开始放缓,但高水平研究成果较多;网格服务研究产出稳定阶段由于云计算突然兴起,导致一批早先网格研究者转向云计算,使2010年成为国内网格服务研究转折点,之后相关研究呈下降趋势;计图9国内网格服务研究关键词共现网络(2005-2006)

图10国内网格服务研究关键词共现网络(2007-2009)

算机与互联网类期刊较关注网格服务研究;国家高度重视网格服务研究,推动作用较强;网格服务研究核心作者群尚未形成,限于研究难度及前沿性,该领域合作度和合作率均较高,分别形成以杨扬、李志蜀(卢暾)为核心的两大研究群体;现有研究主要集中在高校和科研院所,机构间合作难度较大、未形成稳定合作关系,现有合作主要集中在省内、体系内的高校及科研院所间,合作广度和深度不够;网格服务研究起步阶段主要研究网格服务、Web服务和OGSA,研究主题较广,随着技术发展和研究深入,文献数量和关键词频次猛增,研究成果和主题逐渐增多并聚集,网格服务和网格成为研究中心,OGSA逐步成熟并变为次研究中心,Globus Toolkit、Web服务、工作流、基于本体的网格服务管理研究始终与各阶段核心关键词联系紧密并保持较高中心性,在网格服务研究中居核心地位。此外,网格服务研究始终重视网格服务描述与调度算法研究。目前,国内网格服务研究方向和核心主题逐渐明确:更多关注领域实现和应用,如数字图书馆、电子商务、物流与供应链、制造网格等;注重网格服务智能管理(与本体、工作流相结合)。图11国内网格服务研究关键词共现网络(2010-2012)

表7国内网格服务研究各阶段对比(2003-2012)

阶段结构特点研究重点研究特点高中心性关键词

(降序排列)2003-2004整体松散,以网格服务、Web服务、OGSA为核心,且三者联系紧密,存在多个中心性级别相似关键词OGSA、网格服务、Web服务和虚拟组织OGSA刚提出不久,受学者关注并成为研究中心,涉及所有网格服务相关研究;主题较广但不深入,多为理论研究OGSA、网格服务、Web服务、虚拟组织、网格计算、网格、信息传输、数据挖掘等2005-2006整体结构紧凑,围绕网格服务、网格、OGSA聚为3类;出现工作流、服务质量等次中心网格服务平台、网格服务实现和应用围绕网格、网格服务研究增多,其重要性开始与OGSA相当,与网格服务联系紧密的有工作流、网格应用;与OGSA联系紧密的有网格技术、网格计算、服务挖掘;Web服务、Globus Toolkit 3.0在三者之间且与其紧密联系,即Web服务、Globus是网格服务研究的核心技术。服务质量、制造网格、本体、服务发现相对较独立,和3个核心关键词间无明显聚类关系,即相关研究虽开始引起关注,但未融入网格服务研究体系网格服务、网格、OGSA、工作流、服务质量、网格应用、Web服务、网格计算、本体、服务发现等2007-2009整体结构紧凑,基本围绕网格、网格服务聚为两类,聚类效果明显。其他中心性较高关键词多集中在两者间并与其紧密关联网格服务实现和应用,较关注本体及相关服务发现、语义关联研究网格服务研究开始和领域融合,如电子商务、数字图书馆、模糊决策、物流等,较关注Web服务、服务质量研究;网格服务平台研究由GT3转向GT4;OGSA关注度下降且与其它关键词共现关系不强,中心性降低,不再是核心关键词,其研究趋于成熟网格服务、网格、Web服务、本体、服务质量、OGSA、服务发现、Globus Toolkit 4.0、数据挖掘、电子商务、数字图书馆等2010-2012整体结构较松散,只有网格服务、网格中心性较高;高中心性关键词间共现强度较高网格具体应用、网格服务、网格、服务管理和语义本体围绕网格服务的关键词多与生产、管理联系紧密,如生产资源、工作流、生产服务、信任评估、模型组织与管理等;网格服务与GT4联系紧密;围绕网格的关键词多与服务、算法相关。如服务、服务发现、服务组合、任务调度、WSRF等网格服务、网格、服务发现、Web服务、服务、网格计算、本体、生产资源Globus Toolkit 4.0、制造网格等表8国内网格服务研究高被引文献(2003-2012)

参考文献

[1]Foster I,Beery D,Djaoui A,et al.The Open Grid Service Architecture,Version 1.0(2004)[EB/OL].https:∥www.ggf.org/documents/GFD.30.pdf,2013-03-15.

[2]许洪军.基于文献计量的我国电子资源评价研究[J].现代情报,2010,(1):26-29.

[3]刘昕.近10年我国乡镇图书馆研究文献计量分析[J].图书馆学刊,2011,(12):125-128.

[4]王天军.体育核心期刊基金项目的载文情况分析[J].北京体育大学学报,2003,(2):172-174.

[5]刘会玲,曹烃.我国体育科学研究地图——基于知识图谱的CSSCI(2009年)文献计量分析[J].湖北体育科技,2012,31(3):263-267.

[6]彭希羡,孙霄凌,朱庆华.国内社交网络服务研究的文献计量分析[J].情报科学,2012,30(3):414-418,671.

[7]于康平.我国课程论研究论文的文献计量分析[J].现代教育管理,2011,(12):100-104,629.

[8]林菡密,孙绍荣.2001-2010年基于CSSCI的行为经济学文献计量分析[J].现代情报,2011,31(5):92-97.

[9]姜春林,李江波,杜维滨.期刊文献计量与知识图谱对《情报科学》的解读[J].情报科学,2009,27(2):166-174.

[10]张建华,司虎克.我国休闲体育研究动态计量分析[J].河北体育学院学报,2012,26(3):44-48.

[11]范丽雯,孙良吉,陈继东.2006年《北京体育大学学报》文献计量分析[J].情报科学,2008,26(2):240-246.

[12]郝屹.近五年竞争情报研究的文献计量分析[J].情报科学,2012,30(12):1907-1910.

[13]魏瑞斌.h-b指数的应用研究[J].情报理论与实践,2011,34(3):66-69.

(本文责任编辑:马卓)近年来我国跨语言信息检索研究的统计分析

收稿日期:2013-04-05

基金项目:本文为国家社科基金项目“图书馆移动服务模式与质量评价研究”(编号:12BTQ019)和黑龙江省社科研究规划项目“基于BSC黑龙江省信息资源共享平台的绩效评价研究”(编号:11B044)成果之一。

作者简介:张雪梅(1974-),女,副研究馆员,硕士在读,研究方向:图书馆学。

通讯作者:过仕明(1959-),男,经济学院院长,教授,博士,硕士生导师,研究方向:情报学、图书馆学,发表论文50余篇。

猜你喜欢
社会网络分析文献计量
基于文献计量的数据素养及其教育领域研究态势分析
国内电子商务学术研究进展分析
我国医学数字图书馆研究的文献计量分析
国内外智库研究态势知识图谱对比分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
展会品牌利益相关者的构成及其网络结构研究
境外公益旅游研究进展与启示
新浪微博娱乐明星的社会网络分析
基于文献计量分析我国生物科学素养研究状况(2001~2016年)