基于数据挖掘技术的隐性知识挖掘综述

2012-04-29 22:15丁书彦
时代金融 2012年21期
关键词:知识库隐性数据挖掘

【摘要】组织需要使用各种方式和途径来挖掘组织中所存在的隐性知识,基于数据挖掘技术的隐性知识挖掘成为学术界和企业所共同探讨的热点领域。本文回顾了数据挖掘以及隐性知识的基础知识,陈述了文献和企业中现有的隐性知识挖掘方法并对其分类,旨在使今后的学者能够在此基础上开发出新的、更优的隐性知识挖掘方法。

【关键词】隐性知识数据挖掘隐性知识挖掘方法

一、引言

隐性知识是指人们无法清楚地传达出来的知识,这些知识存在于其头脑中,只能通过具体的行动来表示。在对隐性知识管理的研究中,如何使得隐性知识显性化是知识管理的重要研究内容之一。本文对数据挖掘、隐性知识的基础知识进行了梳理,同时陈述了现有文献和企业中的隐性知识挖掘方法,旨在使以后的学者能够在此基础上开发出新的、更优的隐性知识挖掘途径与方法。

二、隐性知识的转换

著名的英国学者波兰尼于20世纪60年代,在其代表作——《个人知识》中,首次对知识进行分类,分为明晰和默会知识,著名的日本学者——野中郁次郎(Ikujiro Nonaka)在其书——《创造知识的公司》中,借鉴并发展了波兰尼所提出的知识分类方法,将知识分类为隐性知识和显性知识。

Nonaka提出隐性知识的两个要素是认知和技术,认知是指个人对外部状态的模拟和理解,如信仰、范式、价值观,技术是有关具体如何操作的知识,指对具体问题的解决方案等。Nonaka从知识相互转化的角度阐述了隐性知识与显性知识转化的动态过程,提出了著名的SECI模型(隐性与显性知识转化过程:社会化、外在化、组合化、内隐化),为后续的研究提供了一个崭新的视角。

三、基于数据挖掘的隐性知识挖掘

(一)数据挖掘及其应用

数据挖掘(Data Mining)是从大量的随机、不完全、模糊的数据中提取出隐含在其中的、事先不为人知但是具有潜在价值的知识和信息的过程。数据挖掘技术可以应用在许多领域,诸如金融服务、电力供应业(负荷预测)以及市场营销和销售,同时也能够应用于以产品发展为目的的领域, KDD还可用于工业、交通、电信、市场营销、保险等其他行业。

对数据挖掘技术的使用可以在大量未经筛选的数据中提取出可供学习的、有价值的知识和信息。在构建知识管理系统时,普遍采用的数据挖掘方法如:分类、聚类、Web页挖掘和关联规则等。分类、聚类以及关联规则方法都是使用某种挖掘算法对企业内部知识归类,方便员工进行搜索和文件管理;而Web挖掘技术则是通过对Web日志的挖掘总结出企业员工在工作过程中进行知识搜索的相关内容,主要是有关哪个方面以及企业知识库中是否需要添加新知识和新信息以满足员工需求。

(二)知识管理

为了适应市场竞争力的不断变化,企业需要不断提高企业客户知识、加强企业员工对于知识的获取、创新以及共享,随之便产生了基于IT技术的对数据和信息的管理,即知识管理(KM )。有学者提出,知识的处理以及利用主要包括如下三个阶段:第一,知识库阶段;第二,知识共享阶段;第三,知识发现阶段。

在知识库阶段,经过手工处理的知识进入到预先被定义的知识库中,知识库阶段的技术主要是单机数据库和文件系统。数据共享阶段,人们意识到自己需要哪种知识但没有该知识,因此开始搜索知识。知识发现阶段出现了求知欲,也产生了知识发现的希望,这也许正是文本挖掘出现的内因。由上述三个阶段我们也可以得到如下结论:知识管理的整个进程都是与数据库技术密不可分的。

(三)隐性知识挖掘方法列举

由于隐性知识对于企业的重要性,学术界和企业都采用了许多不同的方法来进行隐性知识的挖掘。本文对隐性知识挖掘方法列举如下:

1.基于案例的隐性知识挖掘方法

当前许多企业运用建立案例库的形式来留存在具体工作过程中处理事件所运用的隐性知识,在新案例的处理过程中使用人工智能的案例推理取得了不错的效果,该方法通过搜集大量的案例(在实际工作过程中专家如何解决问题),采用建立映射关系(专家解决问题到实际的知识领域)以构成相对应的知识结构图,或者通过关联分析的方法从案例中挖掘出隐性知识。

2.基于Microsoft三种算法的隐性知识挖掘方法

基于Microsoft的隐性知识挖掘方法包括如下三种:基于Microsoft决策树算法的隐性知识挖掘方法、基于Microsoft线性回归算法的隐性知识挖掘方法、基于Microsoft神经网络算法的隐性知识挖掘方法。

Microsoft决策树算法是通过在树中创建一系列拆分来生成数据挖掘模型。Microsoft线性回归算法是Microsoft决策树算法的一种变体,更加易于计算独立变量和依赖变量间的线性关系,并使用该线性关系进行预测。Microsoft神经网络算法对输入属性的所有可能状态以及可预测属性的所有可能状态进行组合,并通过使用定型数据来计算概率。

3.基于其他算法的隐性知识挖掘方法

通过数据挖掘的其他算法,如遗传算法、FP算法、Pairwise analysis等途径都能够实现对隐性知识进行挖掘。

4.基于web的隐性知识挖掘方法

企业通常也直接针对企业员工的隐性知识共享与挖掘,设计、开发或直接购买基于web平台的知识挖掘系统。目前应用尤为广泛的是基于e-learning的隐性知识外化方法,隐形知识外化方法能够将知识持有者的知识外部化到知识库中,企业中的知识组织者和教学设计者对知识进行组织,进而使得知识探寻者能够学习知识库中的知识,同时对学习效果进行反馈,形成操作型的知识数据库。该方法能够很好地发挥e-learning和知识管理的优势,有效地提升企业的学习能力和工作效率。

四、讨论与展望

在企业的知识构成中,隐性知识占很大一部分,对隐性知识的挖掘就显得尤为重要。本文梳理并讨论了基于数据挖掘技术的隐性知识挖掘的背景知识和现有文献以及企业中的隐性知识挖掘方法。企业应根据其自身状况,针对不同种类的隐性知识并结合实际情况,利用知识挖掘算法以及其他的分析途径,开发企业内的知识挖掘系统或建立相应的平台,同时加强员工分享知识的积极性。

参考文献

[1]张喜征,陈博.基于案例的隐性知识挖掘研究[J].情报杂志,2006,25(07):8-9.

[2]芦昆.基于Web2.0的隐性知识外化研究[J].情报科学,2008(002):247-251.

[3]严宁,张翔,张永忠.基于e-learning的企业知识管理模型[J].计算机应用与软件,2010(05).

作者简介:丁书彦(1989-),女,硕士研究生,研究方向:知识管理、E-learning和企业信息化。

(责任编辑:刘晶晶)

猜你喜欢
知识库隐性数据挖掘
探讨人工智能与数据挖掘发展趋势
隐性就业歧视的司法认定
基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用
基于并行计算的大数据挖掘在电网中的应用
高速公路信息系统维护知识库的建立和应用
一种基于Hadoop的大数据挖掘云服务及应用
基于Drupal发布学者知识库关联数据的研究
刍议隐性采访
新闻报道隐性失实的四种表现
隐性但可预防的危险