石李妍
摘 要:本文以CNKI期刊库为数据源,对2007-2017年发表关于中国数字鸿沟研究领域的期刊论文进行收集,分别从发文量、期刊分布、著者、关键词方面进行了统计分析,较为全面地分析了国内数字鸿沟的研究现状和未来发展趋势,由于我国接触数字鸿沟研究时间较晚,研究结果显示国内数字鸿沟从产生到现在发展比较缓慢。
关键词:中国数字鸿沟 洛特卡定律 期刊分析 关键词分析
中图分类号:G645文献标识码:A文章编号:1003-9082(2019)09-000-02
数字鸿沟是在全球数字化进程中, 不同国家、地区、行业、企业、人群之间, 由于对信息、网络技术的占有和应用程度不同所造成的“信息落差”、“知识分隔”和“贫富分化”问题[1]。数字鸿沟是信息时代的全球问题。在中国,这个问题不仅体现了信息的滞留问题,还反映了信息时代的社会公正问题。为了更好的把握 国内数字鸿沟问题研究的热点和规律,本文将对2007-2017年国内数字鸿沟研究论文进行统计和分析,为今后的研究提供参考。
一、数据来源和处理方法
1.数据来源
本文选取CNKI中国期刊全文数据库作为数据来源,以“主题”为检索项,“中国数字鸿沟”为检索词,时间跨度选取2007-2017年共10年的数据,期刊范围选取“全部期刊”,以提高检全率;并设定“精确”以提高检准率。最终检索出符合条件的论文共257篇。
2.处理方法
主要借助于EXCEL作为数据分析处理工具,利用其统计及绘图功能,录入数据,得出近10年来我国数字鸿沟研究论文的发展规律。
二、论文的年代分布
我们以时间为变量,通过统计分析国内数字鸿沟研究领域的发文情况,按照论文发表年代,得出了其对应的变化趋势图,见图1。
国内数字鸿沟研究的起步较晚,2000年我国数字鸿沟的研究才正式开始,发展比较缓慢。
通过图1我们可作如下分析:
1.从2007~2011年有关我国数字鸿沟的发文量一直处于上下不断波动状态,在25篇左右浮动。原因主要有两个方面:一是我国数字鸿沟研究领域在这段时期内发展并不成熟,属于探索阶段;二是我国数字鸿沟问题并没有引起人们的重视,当时并未发展成一个热点话题。
2.从2011~2013年有关我国数字鸿沟的发文量一直处于下降趋势,在2013年发文量最少。出现这种情况,一方面,随着数字鸿沟问题的深化,研究难度增大,影响了学者的研究热情和信心;另一方面,因学科交叉问题,一些理論概念模糊不清,界定不严,该领域的研究呈阶段性下降趋势。
3.从2013~2017年有关我国数字鸿沟的发文量也是处于上下不断波动的状态,但发文量都是大于2013年的,2017年的发文量达到最高30篇。出现这种情况,主要是随着网络化的不断普及,同时我国的数字鸿沟现象愈发严重,再加上政府的重视,众多学者对于国内数字鸿沟问题的研究也逐渐深入。
三、作者分布规律分析
1.信息生产者洛特卡分布规律
美国统计学家洛特卡经过研究发现,科学家的生产能力存在一定的规律,他于1926年首先提出了反映作者生产能力的洛特卡定律,即平方反比定律[2]。这里,我们依据这一原理对数字鸿沟的研究论文进行了分析。
洛特卡定律的一般表达式,即:
其中,f(x)为发表x篇论文的作者数占作者总数的比例。在洛特卡的计算过程中排除了高产作者,所以,在这里我们依据洛特卡的原理,只统计发文量小于等于10篇的作者数(见表1),而大于10篇的作者数在所有作者中的比例不到3%,对结果不会造成影响。
我们利用最小二乘法对n 值进行计算,
即:
其中,N为全部作者总数,这里应为186,经计算得出n=2.365618 ,这与洛特卡的结果是基本一致的,符合洛特卡定律。
又因为,x取值为1~∞,但x超过20则忽略不计,所以x最大取20,得出C的值为0.522551。我们经过分析得出我国数字鸿沟领域的洛特卡公式为
为了说明理论计算与实际统计分布的一致性,我们还需进行检验。被统计
作者数为186位,经过检验,基本符合洛特卡定律。
2.高产作者分析
科学论文的发表是目前评价科技人员创造性劳动的重要指标,科技人员也将发表科学论文作为他们自我表现和确认自己在科学社会中的地位的一种手段。而高产作者和核心作者又是一特定领域的开导者和推进者,因此对高产作者和核心作者的分析非常重要[3]。这里我们用洛特卡定律,以及普赖斯定律对 2007-2017年数字鸿沟研究论文进行分析,以期得出此领域的高产作者和核心作者的分布。首先我们对作者的发文情况进行统计(如表2)
根据普赖斯的研究,我们得知在文献分布领域内有75%的科学家一生只发表一篇论文[3],根据表1的统计结果,我们得出在数字鸿沟领域写一篇论文的作者占83.87%。
考虑到多个作者合著一篇论文的情况,我们只统计第一作者,故结果会产生一些偏差,但基本与普赖斯的统计结果一致,
洛特卡在分析作者的生产能力时排除了高产作者,而普赖斯却注意到了高产作者对学科的推动作用,由此提出了著名的普赖斯高产作者计算公式,其数学表达式为:
其中为最高产作者论文数,M为该学科规定时间内高产作者的论文数。
根据这一定律,我们分析得出在数字鸿沟领域,现在的186位作者中前6位(,M取临近最大整数3,)作者应该为高产作者,他们的发文量都在三篇以上,如表2所示。可以看出以薛伟贤,刘骏等为首的高产作者群体已经诞生。通过计算他们的H指数发现高产作者的H指数大多在4以上,其中薛伟贤H指数最高,由此可见薛伟贤的论文在该领域影响力最高。
四、期刊分析
我们统计了2007-2017年国内数字鸿沟研究论文期刊共计167种,表7中我们列出了该主题论文的期刊分布情况。
从期刊分布表中可以看出,22种核心期刊中,有12个期刊属于图情期刊,占核心期刊的54.56%。说明国内关于数字鸿沟的研究,大部分集中于图书情报界,其余部分分布在各个领域,范围较广。
五、关键词分析
1.关键词的确定和筛选
对来自各期刊的257篇文献进行统计,共计出现2823个关键词,从中选取高频关键词39个(词频≥4)。由于论文库中主题词“数字鸿沟”出现次数很多,不利于统计分析该领域研究热点,因此本文筛选和整理去掉“数字鸿沟”,对同义关键词进行合并。经过筛选整理,确定了共有39种关键词。
2.高频关键词的年度统计及分析
为了消除不同年份论文篇数波动造成的影响,以某年度每个关键词出现的次数占当年文章总篇数的百分比作为该年度该关键词的词频值。列出了2007-2017的中国数字鸿沟关键词词频分布。由表中看出2007-2017年研究中国数字鸿沟问题的论文的高频关键词主要有“信息化”、“互联网”、“城乡数字鸿沟”、“图书馆”等,因此它们也是数字鸿沟研究的热点问题。
“信息化”、“互联网”在2007-2017这11年基本上一直是高频关键词,这与社会背景这一事实是密不可分的,当今时代是一个信息时代、大数据时代,一个问题的出现必然与社会环境密切相关。专家学者分析数字鸿沟这一问题时与时代背景相结合,说明人们对网络时代有了更普遍、更深入的认识,这表明“信息化”、“互联网”的出现可能是引发数字鸿沟话题日渐攀升的关键之处。通过观察,自2012年起“城乡数字鸿沟”多次成为研究我国数字鸿沟这一问题的高频关键词,是专家学者研究的热点问题。城乡发展不平衡,是我国的国情所致,由此看出,专家学者对于数字鸿沟问题进行了更深层次的研究,由时代问题转向了本国国情。另外,从2007年“图书馆”一直作为高频关键词,说明可能是在“图书馆”中数字信息资源的使用中学者们发现了数字鸿沟这样的问题,由此,展开了深入研究。由研究中数据我们可以看出,“信息公平”、“数字不平等”、“和谐社会”等逐渐成为专家学者更深入的研究方向,这也充分表现了我国数字鸿沟问题带来的影响的深远性,人们开始逐渐关注数字鸿沟这一问题的出现可能会带来的不好的影响。
虽然在研究中国数字鸿沟这一方面我们并没有十分成熟,但具有很强的研究潜力,从纵向和横向两方面进一步深化与拓展我国数字鸿沟研究空间,并结合本國国情使研究成果真正具有指导实践的现实意义,将是数字鸿沟研究未来发展的方向与目标[4]。
综上所述,可以得知2007-2017年中国数字鸿沟研究热点包括:信息化、互联网、城乡数字鸿沟、图书馆。
六、结束语
本文通过采取文献计量法,对2007-2017年中国数字鸿沟的研究现状进行了探析,描述了中国数字鸿沟研究论文分布的期刊研究、作者分布情况、关键词等,发现国内数字鸿沟问题研究目前发展还未成熟,有很大的研究空间,希望本文能为国内研究中国数字鸿沟的学者的进一步深入提供参考。
本次研究最大的不足之处,由于国内对数字鸿沟的研究起步较晚,所以在2007-2017年期间发表的论文数不多。但在未来几年,中国数字鸿沟研究的领域,我国学者的研究形势将会越来越好。
参考文献
[1]胡延平.跨越数字鸿沟:面对第二次现代化的危机与挑战[M].北京:社会科学文献出版社,2002.
[2]刘婧.文献作者分布规律研究:对近十五年来国内洛特卡定律、普赖斯定律研究成果综述[J].情报科学,2004(1):123-128.
[3]邱均平,王明芝.1999~2008年国内数字图书馆研究论文的计量分析[J].情报杂志,2010,29(2):1-5.
[4]杨凯源,张启人.数字鸿沟的系统反思[J].系统工程理论与实践,2002,22(2):1-9.