韩兵兵 王 君
(江苏大学科技信息研究所 镇江 212013)
我国Triz研究论文统计及可视化分析
韩兵兵 王 君
(江苏大学科技信息研究所 镇江 212013)
采用文献计量学方法,分析1999至2009年我国Triz研究论文的年代分布、来源期刊及核心作者。并采取共词分析方法和可视化技术,对我国Triz研究论文高频关键词进行统计分析,客观描述了Triz理论的研究现状与热点。
Triz 文献计量法 共词分析 可视化
Triz(发明问题解决理论)诞生于1946年,由苏联科学家根里奇·阿奇舒勒(G.S.Altshuller)通过分析苏联及世界250万份专利后提出的创新发明理论,其主要目的是研究人类进行发明创造、解决技术难题过程中所遵循的科学原理和法则。将之归纳总结,形成能指导实际新产品开发的理论方法体系,运用这一理论,可大大加快人们创造发明的进程并且能得到高质量的创新产品。随着苏联解体,一直处于保密状态的Triz理论也扩散到全球,并引起西方国家重视,我国这方面的研究论文从1999年开始逐年增多。
利用中国知网(CNKI)的中国期刊全文数据库,以“主题”作为检索途径,“Triz、发明问题解决理论、创新问题解决理论、萃思、萃智”分别为检索词,采用“精确”检索方式,去除无关及重复论文,检索得到1999年-2009年间Triz研究相关论文570篇。
1.1 论文年代分布
对570篇相关论文进行整理,以时间为横轴论文数量为纵轴绘制条形图,如图1。由图1可见,11年间Triz研究论文数量呈不断上升趋势,Triz研究从无到有,研究内容从基本的介绍到理论研究、实际应用。2008年的绝对增长量更是超过以往,2008年4月科学技术部、发展改革委等印发的《关于加强创新方法工作的若干意见》中,提到“推进Triz等国际先进技术创新方法与中国本土需求融合”、“推动Triz中成熟方法的培训”,政府加大了创新方法推动力度,促进Triz研究发展。
年增长率也是衡量论文年代分布的一个指标,但是由于Triz研究在我国还处于萌芽、发展阶段。处于萌芽阶段年增长率起伏很大,从分析研究成果的变化趋势来看,不宜于做严谨分析,但可作为一种参考。2000年相比1999年增长了200%,2003年比2002年增长了180%,2009年比2008年增长了20%,然而事实上它们的绝对数量相差不是很大。
图1 论文年代分布图
1.2 来源期刊分布
1999年-2009年的570篇Triz相关文章分布在245种期刊上,平均每种期刊发文2.33篇。根据布拉德福定律,核心期刊区所载论文量占论文总量的1/3。通过观察可以发现载文数量大于6的期刊共有16种,载文189篇,占论文总量的33.15%,可以认为这16种期刊是研究Triz的核心来源期刊,如表1。
表1 核心来源刊统计
在这16种期刊中有11种是北大2008版中文核心期刊,可以说Triz研究论文的质量比较高。16种期刊中机械工程方向有9种,计算机信息化方向有3种,科技理论方向2种,可以发现,Triz作为一种系统的创新方法,研究主要集中于机械应用领域,Triz与CAI结合的计算机辅助创新研究,以及作为一种以提炼工程解决方法为基础的理论。
1.3 核心作者的统计分析
经统计,1999年-2009年11年间所发表的570篇Triz相关论文作者总数为377人(第一作者),发表1篇论文的作者有289人,占作者总数的76.66%。根据普赖斯定律,核心作者的论文下限为:N=0.749(ηmax)1/2,其中ηmax为发表论文最多的作者所发表的论文数,由于发文最多作者(第一作者)共有14篇,从而得到Triz研究核心作者发表的论文数量至少应为:N=0.749(14)1/2=2.8≈3,即经过统计,发表3篇及3篇以上的作者有38人,如表1所示,占作者总数的10%,共发表了176篇文章,占文章总数的30.88%。
总体来说核心作者集中于高校,并且集中于机械、工程等工科学院,文科学院相对比较少,此外还有部分作者来自地方政府的推广部门,例如黑龙江科协。虽然Triz直接应用于企业实际工作,但是这种应用很少在期刊文章中体现,从表2的统计数据中也可以发现这种情况。表中只有两个咨询类公司和一个工程机械类公司:亿维讯科技有限公司、杭州枫惠科技咨询有限公司、杭州和达机电工程有限公司,相对来说所占比重较小。
表2 核心作者统计
共词分析法利用文献集中词汇对或名词短语共同出现的情况,来确定该文献集所代表学科中各主题之间的关系。一般认为词汇对在同一篇文献中出现的次数越多,则代表这两个主题的关系越紧密。由此,统计一组文献的主题词两两之间在同一篇文献出现的频率,便可形成一个由这些词对关联所组成的共词网络。网络节点之间的远近可以反映主题内容的亲疏关系。共词分析就是以此为原理,将文献主题词作为分析对象,利用包容系数、聚类分析等多种统计分析方法,把众多分析对象之间错综复杂的共词网状关系简化为以数值、图形直观地表示出来的过程。
2.1 高频关键词的确定
关键词是能够最大程度概括文章所包含主要方向、内容信息的字或者词,因此采用对关键词统计分析的方式。使用Excel2003对收集的570篇文章的数据进行统计,去除对分析主题意义没有直接关系的关键词,例如Triz、发明问题解决理论、创新问题解决理论,将部分意思相同或者相近的关键词进行合并,例如:Ariz与发明问题解决算法,BP网络与神经网络等,得到有效关键词750个,共出现1 423次。将所得关键词按出现次数排列并取其中出现次数大于5次的关键词,共有36个,出现411次,占总次数的28.88%。由于这些关键词在Triz相关论文中出现频次相对较高,在一定程度上可以体现Triz研究现象和规律。高频关键词统计如表3所示。
表3 高频关键词表
2.2 构造共词矩阵
对前部分所提取的36个高频关键词,两两进行检索,统计其在570篇论文关键词中同时出现的频率,从而形成一个36X36的共词矩阵表(表4)。对角线上的数据为该关键词在所有论文中出现的频次(例如表4中左上角的67,它对应的横向、纵向均为“创新设计”,表示关键词“创新设计”在论文关键词中共出现67次),非对角线上的数据为其对应的横向、纵向序号所代表的关键词同时在一篇论文关键词中出现的次数(例如表4中横向“概念设计”与纵向“质量功能设计”所交叉位置的数据5即体现这两个关键词同时在一篇论文关键词中出现5次)。
表4 共词矩阵(部分)
表4所表示的共词矩阵为共词统计的绝对次数,由于在实际的计量化分析中,词对频率是绝对值,难以反映词与词之间真正的相互依赖程度,包容化处理的结果能反映出两词间的联系紧密程度,因此有必要对词频率进行包容化处理。本文采用Ochiia系数法对共词矩阵进行处理,将共词矩阵转化为相关矩阵。将共词矩阵中的每个数都除以与之相关两个词的词频数乘积的开方,计算公式为:Ochiia系数=A词、B词两个词同时出现的次数/(A词出现的总频次的开方*B词出现总频数的开方)。经过计算可将表4转化为表5。
表5 包容化处理后共词矩阵(部分)
包容化处理之后形成的相关矩阵表5中的数据,每个数据都表示对应的两个关键词的亲疏程度即相关度,数值越大则表明关键词之间的距离越近,相关度越强;反之,数值越小则表明关键词之间的距离越远,相关度越差。由于相关矩阵表5数据中的0值较多,不容易说明程度,可以用1分别减去相关矩阵中所有的数据,即可得到表示两词之间相异程度的相异矩阵。与相关矩阵正相反,相异矩阵中的数据表示不相关的程度,即数值越大表明对应两个关键词的距离越远,相关度越差;而数据越小则表示关键词之间的距离越近,相关度越高。
2.3 可视化分析
2.3.1 因子分析 因子分析(factor analysis)的目标是用尽可能少的因子去描述众多指标间的联系,其基本思想是把研究对象的变量分组,使同组内的变量相关性较高,不同组的变量相关性较低。每组变量称为一个公共因子,这样几个公共因子可以反映原资料大部分信息。将相关矩阵表5数据导入Spss14.0采用主成分法(Principal Component Analysis)进行因子分析,可以得到各个因子的特征根及其方差贡献率表,结果表明有15个因子被提取出来,其对应的累积方差贡献率达到了75.84%,可以认为这些因子在某种程度上把36个关键词分为15类,Spss碎石图如图2所示。
图2 因子分析碎石图
2.3.2 聚类分析 聚类分析(cluster analysis)基本思想是把相似程度较大的变量聚合为一类,把另外一些彼此之间相似程度较大的变量聚合为另一类,关系密切的聚合到一个小的分类单位,关系疏远的聚合到一个大的分类单位,直到把所有的变量都聚合完毕,最后再把整个分类系统画成一张谱系图,用它把所有变量间的亲疏关系表示出来。
把表5相关矩阵导入Spss14.0,采用系统聚类、组间连接法(Between-groups Linkage)并参考因子分析的结果将聚类类别指定10-15类,通过比较集中分类方法对结果进行分类,如图3所示。
图3 聚类结果树状图
图3上端0-25的标度代表各类之间的距离,聚类原则是越早被聚为一类的关键词之间的距离最近、关联越紧密。根据聚类过程同时参考因子分析结果,我国Triz研究热点可分为以下12类:
(1)Triz主要理论内容。Triz理论具有三个大的理论体系:39个通用工程参数和40个发明原理;物场模型和76个标准解;效应原理。Triz虽然已经有几十年的历史,但是由于一直处于保密状态,苏联解体以后才开始在全球扩散,所以当前对Triz理论的认识和应用均不够深入,此类主要是对Triz理论的介绍,在可预见的一段时间里,Triz理论的介绍和阐述,仍将是一个热点。
(2)进化。不同领域中技术进化过程的规律相同,都存在产生、成长、成熟、衰老、灭亡的过程[3]。在一个工程领域中总结出来的进化模式和进化路线可在另一个工程领域实现, 即技术进化模式和进化路线具有传递性[4]。所以针对技术进化路线及路线的通用程度的研究成为一个热点。
(3)开放应用。Triz不是一个封闭的系统,它虽然在发明创新过程系统全面,但却短于企业应用中的实际操作。而以质量屋为核心的质量功能展开与田口方法补充了这一缺陷,使得实际操作形成了体系。
(4)机械产品创新设计。此类直接体现了Triz的主要应用范围和目的,即针对机械工程进行发明创造。
(5)冲突。G.S.Altshuller 将冲突分为三类:管理冲突、物理冲突、技术冲突。其中技术冲突是设计中经常出现的冲突[5],应用冲突矩阵,冲突解决原理,使实际问题分析得到的冲突消融,是Triz理论的一个应用方向。
(6)理想解。理想解是采用与技术及实现无关的语言对需要创新的原因进行描述,创新的重要进展往往在该阶段通过对问题的深入理解所取得。确认哪些使系统不能处于理想化的元件是使创新成功的关键[6]。设计过程中从分析技术矛盾向理想解过渡的过程称为理想化过程,也是提出有效解决方式的过程。
(7)物场分析和76个标准解。物场分析是Triz的一项工具,可用来分析并改进技术系统的功能。技术系统的目的是执行某一“功能”。任一功能都由两个物质(Substance)一个场(Field)组成。76个标准解是通过抽象的技术系统模型实现的,利用物场分析很容易建立技术系统模型。
(8)公理设计与Triz。公理设计和Triz具有内在的联系和共同点,二者可以互相补充和借鉴。公理理论为设计活动构造一个完整的实用性框架,独立性公理和信息公理为设计的合理性、优劣以及方案的选择提供了有效的判断标准。而Triz以技术系统的演化规律为纲,应用具体的工具算法解决设计中的矛盾,使创新设计变得有规律可循,2种理论具有很强的优势互补性。
(9)产品设计技术问题。约束理论并不针对技术创新,不能提供解决问题的方法,而Triz的矛盾分析法能通过创新原理对矛盾进行创造性的解决来实现技术创新。通过约束理论与Triz的集成,能够有效的解决产品设计中的技术问题,实现完整的新产品开发过程。
(10)矛盾、进化、创新。从Triz理论讲,一种新的想法是否有效,就要分析其是不是在它的进化方向上;当有问题需要解决的时候,要分析根本矛盾,根据矛盾矩阵及创新原理分析解决的方法;这两种研究的结果就是创新。
(11)计算机辅助创新。不可否认Triz理论庞大而复杂,如果用人工去计算费时费力,现代科技的发展解决了这个问题,就是计算机辅助创新(CAI)与Triz的有效结合,促进了Triz理论的发展的同时也加快了创新的速度。
(12)技术预测。技术进化理论是Triz理论的一个核心,可以分析技术及产品的前进方向,对于它的开发和利用也会是一个热点。
2.3.3 多维尺度分析 多维尺度分析通过低维空间 (本文是二维空间)展现关键词之间的联系,并利用平面距离来反映关键词之间的关联程度及中心词。把表5相关矩阵数据导入Spss14.0进行多维尺度分析(Multidimensional Scaling),然后加以整理可以做出多维尺度图(图4),来分析Triz研究发展趋势。图中,有高度相似性的点聚集到一起,形成科学共同体。
图4 多维尺度分析图
如图4所示,可以发现点与中心的距离都比较远,说明Triz研究比较分散并没有某一特别核心的主题,在每部分的内部,点与点之间的距离相对集中形成了大的研究趋势,将36个高频关键词比较清晰的分为三大部分。可以发现在右上圈部分,应用技术进化及产品技术成熟度理论,对系统中主要矛盾进行分析,进而进行产品的创新设计成为了一个研究趋势;在左方圈内,X轴上的5个关键词形成了这个区域的核心,这部分主要是计算机辅助创新(CAI)与Triz相结合,为Triz理论和应用研究打开了道路,其中技术矛盾、工程参数、物场模型等Triz核心理论都有涉及;在中下方圈内,主要是Triz的应用,对机械产品的分析(技术预测、进化理论、过程模型)和解决(冲突解决原理、方案设计、理想解等),另外这个区域内的“质量功能展开”与中心相对集中较远,可以认为此类研究比较少,但并不能认为它的发展趋势,因为它也可能是一个较新的研究主题,需要更多的数据进行对比分析才能确切说明问题。
通过对1999年-2009年我国Triz研究论文进行了分析提炼,对论文的年代分布、来源期刊、核心作者三个方面进行了统计分析,并且采用共词分析的方法进行因子、聚类、多维尺度分析,在分析客观数据的基础上,比较直观地展示了一段时间内Triz研究的结构、热点和趋势。
但研究的过程中也存在一些不足:采集数据过程中只采用了中国知网(CNKI)的期刊全文数据库,没有同时检索其他数据库资源;确定高频关键词主要采用的是主观经验判断某阙值以上的关键词为高频关键词;对原始矩阵进行包容化处理有多种方法例如spearman法,而采用Ochiia法是多数中国研究者的做法;聚类分析及多维尺度分析结果图是客观数据的一种形象表达,但在对图的说明解释上也不可避免的带有作者对相关理论主观理解和认识,可能对分析结果产生部分影响。
[1] Trizor. TRIZ——让普通工程师成为发明家[EB/OL]. [2010-4-2]. http://hi.baidu.com/Trizor/ blog/item /0fb4d0e6ade6d729b93820fd.html.
[2] 陈 光. 中国大陆TRIZ研究与推广:现状与问题[EB/OL]. [2010-4-2]. http://hi.baidu.com/Trizor/blog/item/33483d1308eed8c6c3fd7810.html.
[3] Altshuller G S. Creativity as an Exact Science: the Theory of the Solution of Inventive Problems [M]. London: Gordon and Breach Science Publishers Inc. , 1984.
[4] 檀润华. 创新设计——TRIZ: 发明问题解决理论[M ]. 北京: 机械工业出版社, 2002.
[5] 张瑞红,马建红,檀润华,等. 技术冲突解决原理及其软件实现[J]. 河北科技大学学报, 2001(4): 8-12.
[6] 孙连英,张德政,钮文良. 创新理论原理及其扩展应用[J]. 北京联合大学学报,2005(2): 11-14.
StatisticAnalysisandVisualizationofTrizResearchArticlesinChina
Han Bingbing, Wang Jun
Institute of Science & Technology Information, Jiangsu University, Zhenjiang 212013, China
Using the bibliometric method, this paper analyzes the annual distribution, the source journals, and the core authors of Triz research articles during the 1999-2009 period. And it also makes a statistical analysis of the high-frequency key words of the Triz research articles by means of co-word analysis and visualization and presents an objective picture of the current situation and the hot issues of Triz research.
Triz; bibliometrics; co-word analysis; visualization
G353.1
韩兵兵,男,1981年生,硕士,研究方向为竞争情报、专利情报,发表论文1篇;王 君,女,1985年生,硕士,研究方向为竞争情报、专利情报,发表论文3篇。