/中国运载火箭技术研究院研究发展中心
章雯 /中国运载火箭技术研究院
当代社会已进入知识经济时代,知识正逐渐成为企业取得竞争优势的关键因素。越来越多的企业管理者意识到知识挖掘、知识共享等知识管理活动对企业发展的重大意义。在知识管理中,根据描述知识的难易程度可以将知识分为显性知识和隐性知识,显性知识是指可以通过语言和文字进行传播、表达、确知、编码输入计算机的知识;隐性知识是指难以清晰表达、传播、共享的知识,如组织成员的技能、经验、诀窍、沟通能力等。显性知识与隐性知识的区分是人类对知识的更深层次的理解,对人脑中内隐的知识进行了发现和定义,知识管理界常常用冰山的结构来形容显性知识和隐性知识,如果将显性知识视为冰山露出水面的尖端,那么隐性知识就是隐藏在水下的大部分。由此可见,隐性知识比显性知识更难发掘,但它却是组织财富的重要源泉。因此,在知识管理过程中,隐性知识挖掘是知识管理的重要组成部分。
航天企业是典型的知识型企业,在航天产品的研制过程中应用和产生了大量的知识。其中,显性知识可以很好地通过文字、数据、模型的方式固化下来,进行共享和复用,而隐性知识由于其隐蔽性、独占性,往往难以挖掘。针对该问题,笔者首先控讨了传统隐性知识挖掘手段在航天企业应用中的效果和存在的不足,进而对基于本体的航天企业隐性知识挖掘技术进行了研究。
隐性知识挖掘的目的是通过一系列手段,使内隐的、难以表达和复用的信息转化为外显的、有价值的、可应用的知识。隐性知识挖掘方法的研究有很多,如基于Web2.0的隐性知识外化、基于案例的隐性知识挖掘、专家型隐性知识地图的构建等,上述文献对隐性知识挖掘提出了不同的方法。隐性知识是企业知识资产的重要组成部分,为挖掘该部分财富,中国运载火箭技术研究院开展了相关工作。具体内容如下:
老带新。在新员工入职时,为每位新员工指定一名经验丰富的老员工作为导师,指导其快速掌握业务知识并提升工作技能。在老员工与新员工“一对一”的帮扶过程中,老员工的隐性知识,如积累的经验、技巧、思维模式等,会潜移默化地影响到新员工,进而实现挖掘、共享和复用。
专家访谈。研究院具有60多年的历史,成功研制了大量航天器,也培养了大批的技术专家。为将这些技术专家大脑里的隐性知识固化下来,研究院成立了多个技术领域专家访谈小组,对相应领域的专家进行面对面的访谈,了解专家的成长历程,主要是在技术攻关、科研管理等方面的经验和想法,最后整理出访谈记录,在单位内进行共享。
技术沙龙(交流会)。为便于挖掘普通员工的隐性知识,研究院定期开展各类技术沙龙,员工可借此机会展示自己的研究成果,共享自己的经验,也可以就遇到的问题和困惑与他人进行交流,在无形中实现隐性知识的挖掘与共享。
从文献中提出的隐性知识挖掘方法到研究院开展的隐性知识挖掘实践,其大体上符合图1所示的步骤。
目标决策。目标决策阶段工作主要内容是通过调研和梳理,确定知识挖掘目标,定义隐性知识挖掘的对象和范围,制定知识提取的规则和约束。该部分工作是否有人来完成,目标决策是否合理,影响隐性知识挖掘的最终成效。因此,往往需要由学科领域内具有权威的专家来主导该阶段工作。
知识挖掘。知识挖掘阶段主要工作是依据专家制定的挖掘规则和约束,对目标知识进行检索、判断、提取和存储。该部分工作主要依靠机器完成,如果知识挖掘结果不符合预期,也要专家通过修改目标决策来进行改进。
知识共享。知识共享阶段主要是将挖掘的结果提供给需要的人,为用户提供知识服务,同时收集用户的反馈,据此来支撑和优化隐性知识挖掘目标决策。
上述传统的隐性知识挖掘手段虽然具有一定的效果,但由于其主要依赖于人的决策,在知识共享和传播方面具有一定的局限性,主要体现在:
容易出现歧义。由于每个人的文化背景、描述能力或理解能力不同,不同人对同一概念的理解和描述会有所差异,导致隐性知识难以准确表达,容易出现歧义。
缺乏统一的概念描述。在知识的应用过程中,不同部门可能对同一领域内的知识描述和定义不同。有些是由相关领域专家或知识管理人员建立,有些是从权威性专著中获得,导致知识描述体系相对独立,给知识共享和传播带来一定障碍。
图1 传统隐性知识挖掘手段
缺乏统一的知识资源格式。部门之间各自定义自己构建的知识描述体系,导致各个知识描述体系的存储格式不同,给知识转移与集成造成很大障碍,不利于知识的二次传播。
本体最早是从哲学领域发展而来的概念,它的含义是对客观事物存在本质的客观描述。近年来,随着信息科学的迅速发展和计算机与网络的普遍应用,本体也逐渐用于人工智能和知识工程等领域,但是对于本体的定义尚缺乏一种统一的规定。R.Studer提出的本体定义包含概念化、显性化、形式化和共享4层含义。
概念化。本体是客观世界现象的抽象,独立于具体的客观事物和实际环境。
显性化。本体中概念和概念之间的约束都有明确的定义,并且它们的定义没有歧义,是确定的、可理解的。
形式化。通过规范的形式对领域内的概念和概念之间的关系进行表示,使得机器可理解,并且可以进行相应的分析处理。
共享。根据领域内规范的标准对知识进行表示,而且知识是使用者共同认可的,可以相互共享。
领域本体的构建是利用领域专家所提取的相关概念及对象建立概念或对象之间的关系,从而得到相应的概念模型,然后使用形式化的描述语言将概念模型表示成计算机可以理解的本体模型,从而实现知识的共享。本体从语义和知识的表示层次上对知识的存储发生了根本性的变化,将领域内复杂的知识通过关系及层次结构组织成了一个庞大的知识网。因此,本体所表示的知识信息更丰富,知识之间关联程度更高,从而可以更为精确地检索和获取知识,并且还可以挖掘出隐性知识。
本体作为一种共享概念模型的形式化、规范说明,可以实现对领域内的知识进行明确的定义,并对知识间的关联关系予以明确的描述。通过构建领域本体,可以实现语义层面的文本分析,使机器在处理文本过程中具有一定的推理能力。在隐性知识挖掘中引入本体,将有效地解决传统隐性知识挖掘中概念不统一、格式不统一、易产生歧义等问题,提高隐性知识挖掘结果的质量。
通过对传统隐性知识挖掘手段的控讨和实践,结合对本体的分析,笔者提出了基于本体的隐性知识挖掘模型,主要包括目标决策、约束抽取、知识挖掘和知识服务4个模块,如图2所示。
目标决策。目标决策主要定义隐性知识挖掘主题,确定隐性知识挖掘范围。基于本体的隐性知识挖掘目标的制定不再由领域专家完成,而是使用本体对用户需求进行挖掘,将用户真正的需求和潜在的需求进行显性化处理,该工作一般由机器完成。
约束抽取。基于本体的隐性知识挖掘中的约束抽取是依据挖掘主题,通过提取本体的概念和概念实例得到挖掘约束,也就是知识检索中的关键词。该过程不再依赖专家,从而避免了由于个体的主观性和表达差异导致的挖掘结果质量低。
知识挖掘。知识挖掘是以目标决策提出的挖掘主题为目标,依据约束抽取所定义的约束规则进行知识检索、提炼和存储的过程。基于本体的知识检索,是以本体概念及概念实例为关键词进行的检索,保证了检索的准确率和高覆盖率。基于本体的知识存储不是简单地将知识以数据的格式存储于数据库中,而是依据明确的规范和约束对数据进行标注和分类存储。
知识服务。知识服务是指以需求为导向,为用户提供所需知识,涵盖用户需求调研、知识共享、知识交易、用户反馈等。同时,用户反馈也是丰富完善领域本体的有效支撑。
将本体引入隐性知识挖掘中,借助本体对知识定义的唯一性及确定性为隐性知识挖掘赋予了新的特征。
知识提取准确。采用本体提取语义概念,通过本体实例可以实现对文本中同一语义不同描述的知识提取,提高了隐性知识挖掘过程中知识提取的可靠性。
知识检索覆盖率提高。通过引入本体,实现了在语义层面对文本信息进行理解。因此,通过上下文分析能提供给用户与检索表达式高关联度的检索结果,检索结果的查全率和查准率都能得到有效提升。
图2 基于本体的隐性知识挖掘模型
知识共享畅通。通过本体提供的概念定义和关联描述,消除人们对同一语义的知识表达差异,增强人们对知识的共同理解,可以实现知识的无障碍交流,使知识共享和传播更加便利。
关于领域本体的构建方法和实践有许多学者研究,被广泛认可的是T.R.Gruber提出的构建本体的5条原则,即明晰完整性、一致性、可扩展性、最小本体约束和最小编码偏好。
叙词表是特定学科领域内表达事物概念的词汇集合,基于叙词表构建领域本体的方法满足上述5条原则。笔者基于航天科学技术叙词表开发了航天领域本体自动生成系统(见图3)。该系统由解析模块、术语及关系映射模块、术语及关系重构模块、规范性自检模块、本体文件更新模块、本体解析模块、本体推演模块和术语图谱构建模块8个模块组成,可实现由叙词表到本体文件的自动转换。航天叙词表共收录25168条叙词,建有3种参照系统,即用代关系(等同关系,优选关系)、属分关系(属种关系,等级关系)和相关关系(参见关系)。航天领域本体自动生成系统通过航天叙词间的参照系统将叙词联结成语义网,构建了航天领域本体库,并以术语地图的形式进行展示,用户可在术语地图中进行术语关联知识检索。
图3 本体自动生成系统框架
本体库的构建很好的支撑了航天领域概念的一致性和规范化,将本体库嵌入知识管理系统为知识无障碍交流与共享打下了良好基础。
目标决策。有了航天领域本体库的支撑,隐性知识挖掘主题不再由领域专家决策。用户在知识管理系统中的行为,如浏览、点击、检索等,会被系统记录下来,并将浏览、点击、检索的内容与本体库中的术语进行匹配。匹配量越高,说明用户对该术语相关知识的需求越强烈,系统会据此决策出隐性知识挖掘主题。
约束抽取。根据隐性知识挖掘主题,确定关键术语作为挖掘约束,为了保证挖掘知识的准确性和效率,一般限定挖掘约束为3~5个关键术语。
知识挖掘。根据确定的隐性知识挖掘约束,知识管理系统会在主页生成热点话题,鼓励用户就该话题进行在线讨论,激发用户表达出隐性知识。依据挖掘约束,系统对线上讨论的内容进行提炼,并将相关知识与航天领域本体术语进行关联和存储,支撑基于本体术语的关联知识检索。
在航天产品设计过程中,会产生大量的中间过程文档,而大家关注的焦点一般是最终方案和设计结果,过程文档作为隐性知识的重要来源往往被隐藏。在知识管理系统中,会根据隐性知识挖掘主题对该类文档进行重点挖掘,提炼和存储知识点,以支撑后续相关产品研制过程中的知识复用。
知识服务。用户可根据需求在知识地图中通过检索本体术语查看关联知识,也可在系统中进行知识的一站式检索。系统还可以根据用户的行为对用户需求进行挖掘,进而在用户个人中心为用户提供知识推送服务。用户对系统推送知识的点击、浏览或下载行为,会作为判断推送知识是否准确的依据反馈给系统,以便于知识挖掘主题和约束的改进。
笔者控讨了隐性知识挖掘的传统手段,分析了其存在的问题,结合本体特征,提出了基于本体的隐性知识挖掘模型。依托该模型,开展了航天领域本体的构建,对航天企业的隐性知识挖掘进行了研究。该研究可有效促进隐性知识挖掘效率,对提升航天企业快速设计能力及创新能力具有重要意义。▲