基于文献计量学的中国软科学发展研究

2012-09-18 11:05祁家能
大学图书情报学刊 2012年2期
关键词:计量学词频文献

祁家能

(合肥工业大学,230009)

1 引言

文献计量学是借助文献各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术现状与发展趋势的图书情报学分支学科。这一术语最早是1969年由英国人A·普里查德提出的。文献在数量和内容等方面的特征可以说是学科发展的一个主要外部特征。近年来,文献计量学越来越多地被应用在追踪某一个学科的产生、发展、分化、相互渗透及其动向上。

软科学于20世纪70年代末从日本传入,在中国已经有了近30年的发展历史。随着自主创新这一基本国策在我国的确立,软科学在我国的经济社会发展中正扮演着越来越重要的角色。由于软科学的发展同中国经济社会发展密切相关,研究中国软科学的发展历程、发展特点、重点领域、内部结构,分析软科学发展中存在的问题、制约因素以及前景的预测,绝不仅仅只具有科学学上的意义。利用文献计量学的方法对软科学在中国的发展特点和动向进行客观考察,学术界尚未有类似的工作,是为本文的创新点。

2 软科学的相关概念

“软科学”(Soft Science)是由电子计算机“软件”概念引申出来的一个学术术语。据考证,日本国科学技术厅于1971年发表的《科学技术白皮书(昭和四十六年)》首次使用“软科学”这一词组:“用自然科学的方法来研究包括人和社会现象在内的一个广泛的学科领域。”之后又经历了几次修改,其定义却由简到繁,越来越模糊。20世纪70年代末,软科学的概念传入中国,很快成为学术界和政界的热门话题。80年代至90年代初我国出版了一大批相关的专著和工具书。在中国,人们对软科学的理解同样是多种多样的。表1按时间顺序罗列了国内几个重要的软科学定义。由于篇幅原因,表1中所列引文不列入参考文献。

软科学定义的差异,必然导致其研究领域、知识范围的差异,致使从整体角度对软科学的研究对象及范围进行确定成为一件十分困难的事情,在当前软科学研究中普遍缺少的也正是这种较有事实依据和说服力的研究。本文采用文献计量学的方法分析软科学研究的文献集合,以期从客观上揭示我国软科学研究的特点、内部结构和趋势。

表1 国内几个重要的软科学定义

3 中国软科学发展的文献计量学研究

3.1 对象文献的选择

由于软科学学科领域的不确定性,对文献计量学对象文献的选取就显得格外的重要和困难。经过反复衡量,本文选取CNKI(中国知网)学术文献总库收录的文献中题目、关键词、摘要、主题或者正文全文中含有“软科学”词组,且引用数大于等于1的中文期刊文献组成文献集合A;选取学界公认档次较高的十种软科学期刊(《中国软科学》、《软科学》、《科学学研究》、《科学学与科学技术管理》、《科研管理》、《中国科技论坛》、《科学管理研究》、《科技管理研究》、《研究与发展管理》、《科技进步与对策》)所收录的文章,且引用数大于等于1的中文期刊文献组成文献集合B。由于文献集合A和文献集合B都有某种程度上的缺陷,本文将两者的统计结果相互对照,相互补充使用。经过搜索和统计,文献集合A共计31350篇,文献集合B共计28991篇①。

3.2 分析过程及结果

3.2.1 文献集合A的时间分布

1979年-2008年间,文献集合A数量随时间变化情况如下图1所示:

图1 文献集合A数量随时间变化情况

可以检索到的第一篇国内软科学相关论文是发表在《自然辩证法通讯》1979年04期上的《从领导艺术到软科学》,作者是王寿云、柴本良、陈宝庭。从数量的起伏来看,1986年的发表数量形成一个高峰,从1985年的23篇迅速提高到1986年的58篇,随后的1987年发表108篇。之后文章发表数的增速趋于平缓,直到1994年又出现另一个发表的高潮,1997年后增速再次趋于平缓。进入2000年之后,2003-2004年间文献数量有个较为明显的增长。

1978年之前未检索到文献,这验证了中国软科学研究是伴随着1978年全国科技大会召开而起步的。1986年和1994年出现了两个文献发表的高峰,与此同时,1986年7月和1994年12月分别召开了两次全国软科学工作会议。这两次会议对于中国软科学的发展有着重要的指导和促进作用,也充分印证了本文样本的选择是有一定说服力的。

3.2.2 文献集合B的时间分布

1979年-2008年间,文献集合B数量随时间变化情况如下图2所示:

图2 文献集合B数量随时间变化情况

可以很直观地看到,文献集合B数量与文献集合A数量随时间的变化情况大体上是一致的,在数量上发生激增的年份也基本一致,如1994年,2003年②。

综合来看,软科学研究文献在1979-2008年间呈现明显的增长趋势,其中1986年、1994年和2003年是研究文献数量发生激增的年份。

3.2.3 文献集合B的关键词词频分布研究

3.2.3.1 关键词词频分析

学术论文的关键词是论文内容的提示符,是作者学术思想及学术观点的凝炼,也是文献计量学研究的重要指标。本文将文献集合B按时间分为11个阶段,由于前期文献较少,关键词变化较慢,因此以5年为界,之后以2年为界。经过统计,各个时间文献关键词出现频率排在前十位(除去关键词“软科学”,下文做同样处理)如表2所示:表中关键词依词频由高到低排列。总计列中关键词后括号内为该词的词频。从表2可以看出:(1)软科学研究的热点基本上为此时间段国家经济社会发展的热点。如1986-1990年的“市场经济”和“体制改革”;1999-2000年的“西部大开发”、“21世纪”;2007-2008年的“自主创新”和“知识产权”等,都与当时国家的提倡息息相关。(2)1993年之后,“技术创新”始终排在第一位,同时“可持续发展”也一直排进前十位,是软科学研究中不变的热点,为其重点领域。(3)1993-1994年,“软科学产业化”第一次出现并排到第二位,1995-1996年排到第四位,1997-1998年排到第九位,之后就没能进入前十位。这说明1994年前后开始,中国软科学进入一个推进软科学产业化的发展阶段。(4)2003-2004年之后,“战略”一直排入前十位。同时,“规划”、“指标体系”、“可持续发展”等宏观性的关键词出现的几率相比之前大大增加。这说明2003年之后,中国软科学开始侧重于关注国家宏观层面的战略研究,但同时也有“企业”、“中小企业”等层面的微观研究。

表2 文献集合B的关键词词频随时间的变化情况

1999-2000 2001-2002 2003-2004 2005-2006 2007-2008 总计1 技术创新 技术创新 技术创新 技术创新 技术创新 技术创新(1240)2 知识经济 对策 对策 战略 自主创新 对策(640)3 对策 企业 创新 可持续发展 产业集群 创新(485)4 风险投资 可持续发展 战略 风险投资 创新 可持续发展(383)5 高校 可持续发展 知识经济 战略 企业(377))6 创新 创新 WTO 企业 知识管理 战略(331)7 可持续发展 风险投资 企业 规划 知识产权 产业集群(331)8 21世纪 WTO 指标体系 知识产权 产业集群 中小企业(311)9 西部大开发 知识经济 核心竞争力 自主创新 中小企业 自主创新(301)10 高新技术产业 中小企业管理 科技创新 创新 指标体系 知识产权(298)

3.2.3.2 论文关键词共现分析

两个或更多关键词在同一篇文献中同时出现成为关键词共现。关键词共现分析通过描述关键词与关键词之间的关联和结合,解释某一领域学术研究内容的内在相关性和学科领域的微观结构。关键词共现分析中通常采用关键词共现的观察值矩阵来记录和展示关键词之间的共现频次。本文接着对30年来总频次前10位的关键词做共现展示。经统计,文献集合中词频居前十位的关键词共现的观察值矩阵如表3所示,表中关键词依词频由高到低排列。

从该观察值矩阵中不难看出,哪些词对共现频次较高,哪些词对共现频次较低。直观地看,“技术创新”与另外9个关键词均有共现关系,并且共现的程度也是最高的,因此,可以认为“技术创新”是软科学研究的一个核心领域。同时,除了“企业”和“中小企业”两者不存在共现现象,其余所有关键词两两之间均存在共现现象,这充分说明软科学并不像想象中的那么松散,它具有非常聚合的内部结构。

表3列出的是排序前10位的关键词两两共现频次的观察值矩阵,反映的是一种表象,因为两个关键词共现频次的多少直接受两个关键词各自词频大小的影响。为了真正揭示关键词之间的共现关系,揭示文献集合的整体聚合关系,本文还需引入表示关键词共现相对强度的指标。在文献计量学里,常用的表示关键词之间关联强度的统计指数有两种:Salton指数和 Jaccard指数(Van Raan AF1993)。

本文选用两者较为灵敏的Salton指数,Salton指数的计算公式为:

式中Ni,Nj分别表示关键词i和j频次,Nij表示关键词i和j的共现的频次。

词频居前10位关键词共现的Salton指数矩阵词频如表4所示。为了便于观察,本表中采用的是百分比值。求出该Salton矩阵每行向量的元素的总和,如表5所示。

表3 词频居前十位的关键词共现的观察值矩阵(1979-2008)

表4 词频居前十位关键词共现的Salton指数矩阵(1979-2009)(%)

表5 Salton矩阵每行向量的元素的总和(%)

可见,关键词“技术创新”在出现频次上排在第一位,从相对共现频次上看,仍然是第一位。另外,“企业”、“中小企业”、“自主创新”三个关键词的相对共现频次是较高的,可视其为软科学研究的中心领域。该Salton矩阵的元素的总和为465.3%。这一数值是相对较大的,可见软科学研究并不是一盘散沙,它的内部总体聚合程度甚至某种程度上高于自然科学类的纳米科学研究③。由此本文推论,软科学是一门由若干个相互之间有联系的研究领域组成的、内部聚合程度很高的综合性学科群。

4 对于我国软科学发展的几点看法

4.1 中国软科学发展的四个阶段

从文献计量学的统计结果来看,软科学发展可以分为四个发展阶段。第一阶段:1979年-1985年,起步阶段,这一阶段软科学概念刚刚引入,软科学的研究机构、研究刊物刚刚建立。第二阶段:1986年-1993年,快速发展阶段,这一阶段以1986年第一次全国软科学工作会议为起始,软科学研究会建立,软科学文献快速增加,大量的软科学成果在该阶段受到奖励。第三阶段:1994-2002年,该阶段以1994年的软科学工作会议为起始,以软科学产业化的研究为特点。第四个阶段:2003年至今,该阶段以2003年前后开始的《国家中长期科技发展规划》的研究启动为起始,特点是软科学研究的工作重心又开始向国家宏观层面倾斜。

4.2 软科学研究是国家政策的晴雨表

软科学研究是国家政策的晴雨表,未来会持续关注中国政策的热点问题。

软科学从一开始被引入中国,就是为了促进我国决策的民主化和科学化,带有非常明显的面向应用的特点。软科学的研究热点,从“决策的科学化民主化”,到“经济体制改革”,到“西部开发”,到“可持续发展”,再到“自主创新”,都是我国经济社会发展各个阶段中的热点和难点问题。几十年来软科学研究的这个特点一直没有改变,将来也不会变,其对于中央政策导向的敏感性和依赖性都是非常强的,可以视之为国家政策的晴雨表,这一点是软科学发展的一个突出特点。

4.3 软科学未来的研究内容

软科学具有综合性学科的内部结构,从未来趋势上看,“自主创新”和“知识产权”将是软科学研究新的学术热点。

由于软科学涵盖的范围过于广泛,其内部结构相对松散,但是这并不代表其学科内部没有微观结构。对软科学研究关键词词频分析得出的结论:“技术创新”、“可持续发展”是我国软科学研究的重点领域。“技术创新”是软科学研究的核心领域。“企业”、“中小企业”、“自主创新”是软科学研究的中心领域。对于软科学本身的研究是软科学研究的弱点。“自主创新”和“知识产权”是软科学研究新的学术热点和突破口,将成为未来软科学研究的重点内容。

4.4 软科学的定义应更为广义化

对于软科学的定义应该更为广义化,这样更有利于软科学的进一步发展。

在统计工作中我们发现,存在大量的应属于软科学研究的文献,但是文献题目、关键词、主题、摘要中均没有“软科学”词组的文献。这说明很多软科学研究者对于软科学的概念认识仍然是模糊的。显然,软科学研究面向引用的特点,使得软科学的学科范畴非常不清楚。它几乎囊括了除艺术外的所有社会科学领域,其中,经济、管理、政策、金融、社会学都是其重点内容。软科学研究的方法也是多种多样,几乎所有学科的研究方法都被不同程度地使用过。

文献的统计结果表明,对于软科学本身的研究,一直以来并没有得到充分的重视。软科学的边界在科学学范畴内仍然是难以界定的。虽然对于学术术语似乎应慎取广义,因为各个广义概念之间很难找到本来应该有的界限,难以做出相应的区分。但是,如果非要给软科学下一个狭义的定义,确定一个明确的界限,反而会阻碍软科学的发展。本文试图从软科学的功效上对软科学进行一个释义:软科学是一类面向实际应用的,既提高自然科学学科社会效能,又放大社会科学学科本身效能的学科的统称。改革开放之后,在我国每一个大政方针制定的背后,在每一个关系国计民生的大型工程论证的背后,都有着软科学研究的贡献。在这样一个更广义、更宽松的语境中,软科学在未来一定可以得到更快、更好的发展,发挥更大的作用。

5 方法局限性分析

本文是把文献计量学方法用在一个概念和范围较模糊的学科上的一种尝试。这种方法是有局限性的,现分析如下:

5.1 对象文献选择上的局限

本文选择的对象文献集合A和文献集合B都存在不同程度的缺陷。如:由于软科学的概念比较模糊,很多软科学研究者可能全文中都不会出现“软科学”字样,致使很多文章无法被文献集合A统计在内。虽然文献集合B选择的是学界公认的十份软科学类杂志收录的文章,较好地解决了文献集合A的问题,相当程度上可以代表中国软科学的研究文献集合。但是,由于大多数软科学类杂志是在1985年前后创刊,在中国软科学发展的早期阶段还不是软科学研究的主战场。当时的软科学类文献主要集中发表在《自然辩证法通讯》、《自然辩证法研究》等杂志,但这几类杂志在中后期又很难被认为是软科学杂志。这使文献集合的选择陷入了两难。

本文在刻画文献集合数量随时间变化关系时采用了文献集合A和文献集合B同时使用、相互印证的方法,较好地解决了上述问题,同时,由于本文在其他的统计工作中主要想讨论的是软科学发展中后期的情况,因此选择使用了文献范围更为妥当的文献集合B作为对象文献集合,使得整个的统计结果和结论更具有可信性。

尽管做了上述工作,但是文献集合仍然有很多问题没有解决。如:由于加入了被引用数这个门槛,使得最近几年的文献统计结果有些失真。因为被引用情况是一个动态的情况,尤其是最近几年的文献数需要若干年沉淀后才能表现出其最真实的情况。本文只能在讨论中尽量避开最近几年的统计结果,使这种影响降到最低。另外,由于软科学的特殊性,国务院研究中心、中国科技战略研究院等机构有相当多的研究报告都没有,或者没有办法公开发表。这一部分“内部资料”没有被统计,不能不说是本文文献集合选择的一个巨大缺陷。

5.2 本文的有关结论尚需其它方法印证

虽然文献计量学方法是一个较为成熟的方法,但面对复杂的学科问题时,仍然需要其它方法的印证。例如,本文原本试图通过统计结果确定中国软科学的核心作者群,但为了解决作者的同名问题,只能设定同一单位的同一作者为一个作者。但这样统计却使一些软科学研究的大家,如成思危、冯之浚等,他们每人有很多种身份,在结果中就被当成了不同的研究者,因此排不进核心作者群。同时更有一些研究者,如钱学森,他确实并未发表很多软科学类文章,却是软科学研究中系统方法的创始者。类似这些作者没有被排入核心作者群,本文只能放弃这部分的工作。同样,本文的其他结论也需要其它方法的印证,如:文献内容分析法、专家访谈法等,这是作者下一步研究的方向。

注释:

① 本文选取文献集合时设立了被引用数大于等于1的门槛,是为了去除那些研究质量相对较低的文献以及征稿或者杂志介绍等无关文章,同时也可以使文献集合B随时间的变化关系可以更大程度上反映软科学研究的发展情况,而不是只和杂志的篇幅变化相关。

② 图2中1986年并没有文献数量上的激增,其原因是由于软科学杂志大多是1985年前后创刊,当时尚未成为中国软科学研究的主阵地。因此文献集合A的统计结果更能反映早期的文献发展情况。

③ 参见参考文献8:梁立明,谢彩霞.词频分析法用于我国纳米科技研究动向分析[J],科学学研究,2003,21(2),138-142.

[1]赵 刚,孙相东,王志清.发展中的中国软科学——中国软科学发展的回顾和展望[J].中国软科学,2005,(2):96-104.

[2]张登义.邓小平同志与中国软科学[J].中国软科学,2004,(8):20 -21.

[3]王续琨.交叉学科结构论[M].大连:大连理工大学出版社,2003,29-33.

[4]成思危.在第五届中国软科学年会上的讲话[J].中国软科学,2006,(1):1 -6.

[5]刘 娜,张士靖.1997-2006年我国知识管理研究论文文献计量学分析[J],中华医学图书情报杂志,2008,17(1):68 -71.

[6]方 勇.科学计量学的发展及局限[J].自然辩证法研究,1998,14(1):34 -38.

[7]梁立明,武夷山.科学计量学:理论探索与案例研究[M].北京:科学出版社,2006,54-72.

[8]梁立明,谢彩霞.词频分析法用于我国纳米科技研究动向分析[J].科学学研究,2003,21(2),138 -142.

[9]Braam R R,Moed H F,Raan A F J.Mapping of Science by Combined Co-citation and Co-word Analysis[J].Journal of the American Society for Information Science,1991,42(4):233 -250.

[10]谭 萍.国内软科学由热转冷之原因探析[J].科学管理研究,2005,23(4):60 -63.

[11]潜 伟,牛 强,李士琦.关于“软科学”与“硬科学”界定的思考[J].中国软科学,2003,(3):147 -150.

[12]徐晓林,刘 勇,赵 刚.软科学研究机构在政府决策中的功效、困境及对策研究[J].中国软科学,2006,(5):21 -28.

[13]张占仓.我国软科学研究的发展与创新[J].河南科学,2003,21(1):113 -117.?

猜你喜欢
计量学词频文献
基于CiteSpace的医药语料库文献计量学分析
Hostile takeovers in China and Japan
针刺治疗失眠症的文献计量学分析
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
基于科学计量学的公安院校科研与评价
词频,一部隐秘的历史
儒法两家经典的共词分析与研究*
2004-2013年中医药治疗性早熟的文献计量学分析