工程知识引擎的构成研究

2017-02-05 12:53王宏君陈建江董正卫于红艳
航天制造技术 2017年6期
关键词:术语引擎使用者

王宏君 陈建江 董正卫 于红艳



工程知识引擎的构成研究

王宏君1陈建江2董正卫2于红艳2

(1. 北京神舟航天软件技术有限公司,北京 100094;2. 北京机电工程研究所,北京 100074)

根据企业对知识管理智能化服务的需求,引出工程知识引擎,它由知识标注、知识分类、知识关联、知识评价、知识规划和知识供应组成,主要处理领域知识、用户行为和使用场景。讲述了某企业知识管理从资产化到场景化,再到智能化的发展过程,以及利用知识引擎实现“合适的人,在合适的场景,获取并利用到合适的知识”的智能化应用。最后,展望了随着人工智能发展,工程知识引擎将会成为工作助手远景。

知识引擎;知识标注;知识关联;知识评价;知识规划;知识供应

1 引言

随着搜索引擎技术普及,搜索引擎走进企业已经成为趋势,承担起全企业信息搜索的业务功能。企业各业务系统都在积极地引入搜索引擎,处理信息搜索的业务。企业的工程知识管理业务也不例外,引入搜索引擎技术,用于工程知识的全文检索。知识管理通过多年的发展,经历了:开发专家系统,固化成熟业务中知识;建立知识库,汇集日常工作中产生和常用的知识资产;构建知识引擎,解决知识的来源问题和知识的应用问题[1]。目前,以知识引擎为核心的知识管理已经成为企业的知识管理的主流。在与企业客户的交流过程中,企业经常问到“知识引擎是搜索引擎吗”、“知识引擎是什么”等问题。

2 知识引擎构成

知识引擎(knowledge engine),通过知识标注、知识分类、知识关联、知识评价、知识规划和知识供应,将分散在企业各部门乃至各位员工脑中的知识、技能、诀窍、规则、经验等各类信息组合成一个体现本企业专业特点的知识产品。

2.1 知识标注[2]

在知识管理的实践中,大多数时间在回答这样的问题,“知识怎么来”,“如何自动获取知识”。在企业中,知识有两个主要来源,一个是专家的头脑,另一个是蕴含知识的文档和三维模型。专家头脑中的知识利用知识模板整理成工程经验禁忌,收集在知识库中;蕴含在文档和三维模型中的工程知识,利用领域术语[3]以及术语之间的关系进行标注,并且对标注结果形成知识片段。知识片段[4]经过企业领域专家的评估,提升为企业工程知识。在这个过程中,自动获取知识的手段显得不可或缺。

知识标注是利用领域术语及术语关系对工程知识进行自动化的标记,见图1。领域术语提供了该领域或者行业专业视角下的关注的重点。利用领域术语进行标注能够揭示专业视角下文档的语义,而多个领域术语能够从多个专业联合揭示和挖掘文档的语义。在企业中,知识标注的主要对象是文档和三维模型[5]。对文档和三维模型的知识标注过程如下。

图1 语义标注过程

文档的文件格式主要有doc、docx、xls、xlsx、pdf、ppt、pptx等;文档的内容主要以文字的信息为主。对于文档的知识标注采用归一化技术,将各种文件格式的文档归一化为文本形式,再利用领域术语分解文本内容,标识领域术语的位置,抽取含领域术语的语句,统计领域术语出现的频率,关联相关领域术语,并且形成标识记录。标识记录是知识标注的结果。

三维模型绘制的工具主要有Proe、UG等,图纸的文件格式主要有prt、asm等,图纸的内容主要以线框、属性、材质、标注等信息为主。对于图纸的知识标注采用step标准协议进行归一化,再利用step原语分解归一化的结果,标识出现的step原语的位置,并且关联领域术语,最终生成标识结果。

2.2 知识分类

在知识管理的实践中,企业用户提到一个共同的话题——知识分类问题。“企业的知识框架如何建立”、“企业的知识脉络如何梳理[6]”。在企业中,知识分类有两种,一种是按照使用习惯组织知识[7],形成约定俗成的知识分类;另一种是对领域术语分成不同的意群,利于领域术语的所在意群,形成具有语义的知识分类。在知识引擎中领域术语意群是知识分类的基础。

知识分类是根据企业的领域术语的标准或者词典,把企业的全部知识按照相同、相异、相关等领域术语意群划分成为不同类别的知识体系,以此显示知识在知识体系中的位置和相互关系。

在知识引擎中,知识分类是以知识标注为基础的。在知识标注生成的标识文件中,标识了领域术语之间的关联关系,使知识按照领域术语意群分类成为可能。知识引擎在进行知识分类时,参照领域术语的意群划分,按照领域术语关联关系完成知识分类。

2.3 知识关联[8]

在知识管理实践中,寻找知识关联、标识知识关联贯穿知识活动的始终。企业用户经常提到,“如何找到其他人完成这类工作的经验禁忌”,“别人是这么做的”。在企业中,知识关联主要有两种形式,一种是关键词关联,通过领域术语建立知识之间关联;另一种是知识应用场景关联,在相同、相似的工作中,完成工作用到的关联知识。在知识引擎中,两种关联方式都被采用,或者单独应用,或者组合应用。

知识关联是知识与知识之间以领域术语、应用场景为纽带,建立起来的具备参考价值的关联关系;也是领域术语标识的文献知识载体、领域术语之间存在的各种关系的总和[9]。

在知识引擎中,关键词关联基于知识分类,以知识内容中的领域术语为关联纽带,对含有相同领域术语的知识建立关联关系。场景关联以知识评价为基础,通过对知识使用者的行为记录、分析,发现用户行为之间的关联性、连续性,从而推测出用户所运用的知识间的关联性。

2.4 知识评价[10]

用户使用知识的行为是用户寻找知识解决工程问题的轨迹记录,充分体现用户的知识需求,所以用户行为数据也属于一种知识,是与业务知识并存的另一类知识,记录用户行为也属于知识管理的范畴。在知识管理的实践中,总是有人询问“一条知识的使用率是多少”,“知识的有效性怎么表达”。知识评价依据来源于对用户行为的分析结果。用户访问数量体现一条知识的有效性,用户访问数量大的知识比用户访问数量小的知识有效性高。

评价通常是指对一件事或人物进行判断、分析后得出指导性的结论。知识评价是对用户行为进行记录、分析、综合后,形成对知识项价值大小的结论,也形成对用户知识需求的预测性结论。基本方法是通过多个方面,选择多个指标,并根据各个指标的不同权重,进行综合评价。一般的,不同的指标执行不同的标准或者算法。

在知识引擎中,知识评价实现用户行为数据记录、分析和综合,也要实现业务系统日志数据同步、筛选、补充、分析和综合。在业务系统日志记录的基础上,通过知识引擎的评价算法筛选、补充、分析和综合,定时增量处理数据,生成知识、人员的评价指标数值。这些指标数值是知识规划的依据。

2.5 知识规划

在知识管理实践中,总是有人问,“我能在这个场景下获得合适的知识帮助吗”,“在这个场景中能够帮我找到别人做过的案例吗”。在企业中,计划人员在编制工作计划或者审批任务,研发人员在研制新产品或者沟通产品中问题,生产人员在编写工艺规程或者处理生产故障等。这些场景有关联的制度、流程、模板、以往的类似任务、相关专家等。知识规划是利用规划算法将使用场景与领域知识、评价指标连接起来。

知识规划是知识场景化和智能化的处理过程,即“合适的人,在合适的场景,获取并利用到合适的知识”的过程[13]。知识规划是一条连接输入条件与输出结果的知识路径,利用一套策略贯穿从输入到输出的领域知识,并且参照知识、人员的评价指标,给出一套或者多套符合工作场景的参考知识和评价数据,供知识使用者选择使用。

图2 知识规划过程

在知识引擎中,知识规划把知识使用者的兴趣需求信息和知识的特征信息匹配,同时使用相应的规划算法进行计算筛选,找到知识使用者可能感兴趣的知识对象。知识规划从工作场景中获取上下文信息,确定输入条件与输出结果;根据预先设定的策略,建立输入与输出之间的路径;以预置的工作场景知识为基础,再叠加根据预设逻辑自动从知识仓库中筛选到相关知识;再参考知识和知识使用者的评价指标,对工作场景的关联知识筛选过滤,挑选出评级前三名或者前十名的知识规划方案,与评价数据整合缓存到数据库中。如图2所示。

2.6 知识供应[11]

在知识管理实践中,有人问“能否供应知识到工作桌面”,“能否按照规范、工具和实例等形式供应知识”。企业工作人员在工作中,大量的时间在查找资料、实例等参考资料,寻找解决问题的途径和完成工作的资源。企业员工需要,能够供应知识到工作桌面,并且按照要求分类的知识产品,指导工作人员顺利、快捷地完成工作。

知识供应(knowledge supply)是以满足知识使用者需求为导向,为知识使用者提供知识化产品的过程。知识使用者在任何时间任何地方能够得到所需要的任何知识化产品(或者知识包)。

在知识引擎中,知识供应是将知识规划的知识点和知识使用者的匹配信息,封装为知识产品,供应给最终知识使用者[12],满足知识使用者的需求,解决面临的问题。知识产品是知识使用者日常工作中经常熟悉的知识载体,例如规范、标准、案例等。

3 知识引擎实践

通过知识管理的实践,对知识引擎的认识逐步加深。刚开始对工程知识构成认识不清晰,对知识引擎与搜索引擎的界线认识模糊,混淆两个引擎之间的关联与差异。当认识到工程知识包括领域知识、用户行为和使用场景时,知识引擎与搜索引擎的关系也逐渐明确了。知识引擎与搜索引擎既有关联又有差异,搜索引擎是知识引擎的基础,为知识引擎提供输入数据的功能;知识引擎与领域知识、用户行为、使用场景有关。紧接着遇到知识在哪里、用户行为在哪里、使用场景在哪里的问题。领域知识、用户行为和使用场景知识引擎处理对象。领域知识蕴含在企业构建的业务平台的数据库和电子仓库中;用户行为存储在业务平台的日志数据库中;使用场景发生在业务平台的使用过程中。最后需要解决知识引擎从业务系统获取领域知识、用户行为和使用场景。通过搜索引擎将业务平台中领域知识内容、用户行为归一化,输入知识引擎。知识引擎对领域知识内容进行知识标注、知识分类、知识关联;对用户行为利用评价算法,通过筛选、分析和综合等方式生成评价指标。知识引擎通过使用场景采集器,分析使用场景信息,规划使用场景中使用的领域知识,以及这些领域知识曾经发生过哪些用户行为。知识引擎将规划完成的知识产品供应给应用场景下的使用者。如图3所示。还有,知识引擎需要考虑大数据量的处理效率,例如通过集群提升知识引擎的使用效率等。

图3 知识引擎实践

航天某企业工程知识管理项目规划了三个目标:建立知识库,实现知识资产管理;梳理作业指导书,实现知识应用场景管理;通过工程知识引擎,实现知识智能化应用。目前,某企业已经实现知识资产化、知识场景化,正在构建工程知识引擎实现知识智能化应用。企业需要工程知识引擎为具体的工作场景推送知识,帮助工程师迅速、便捷的完成作业任务。由于工程知识引擎在知识库、知识场景和用户行为的信息基础上运行,因此企业首先建立领域知识库、知识场景信息库和用户行为信息库。企业完成知识资产化、场景化建设工作后或者建设到一定程度,就会具备开展知识智能化应用的基础条件。在某企业,建立工程知识库,容纳知识13000多条;接入外部知识库7个,数据容量10TB左右,数据流动性优良。建立了知识场景库,管理作业流程、交流信息、专家网络等场景。建立用户行为信息库,记录业务系统中用户行为。在此基础上,某企业正在建设工程知识引擎,开展知识智能化应用的工作。

4 结束语

在人工智能飞速发展的今天,知识管理的智能化应用会飞速发展,充分发挥机器的数据处理能力,利用机器学习技术分析全企业产品研发过程中产生的数据和信息,提取知识片段,梳理知识分类,建立知识关联,增强知识智能化应用。智能化的知识引擎将会普遍应用到全部信息化软件系统中,为工程师提供知识支持,帮助工程师自动完成作业任务,或者部分作业任务。

1 王宏君,余旭,敬石开. 统一面向产品全生命周期的知识应用体系研究[J]. 信息技术,2014(9):29~32

2 李鹏. 多领域视角下的知识标注研究与实践[J]. 情报工程,2016(1):103~108

3 张继东. 基于本体的数字档案馆动态知识与相对知识标注研究[J]. 情报科学,2011(9):1331~1334

4 郭喜跃,何婷婷. 信息抽取研究综述[J]. 计算机科学,2015(2):14~17

5 胡旭洁,侯永柱,刘继红. 三维模型知识标注技术研究与实现[J]. 计算机集成制造系统,2017(4):695~700

6 张晓玲,宋娟,马文敏,等. 企业职能部门业务工作知识梳理实践[J]. 航天工业管理,2017(4):58~60

7 陈洪澜.论知识分类的十大方式[EB/OL]. [2012-08-08]. http://blog.sina.com.cn/s/blog_49f7ab1801018m9d.html

8 文庭孝,龚蛟腾,张蕊,等. 知识关联:内涵、特征与类型[J]. 图书馆,2011(4):32~35

9 360百科.知识关联[EB/OL].[2015-01-27]. https://baike.so.com/doc/8168090-8485078.html.

10 王晓东,张巍,刘洋,等. 中国运载火箭技术研究院知识管理实践与思考[J]. 航天工业管理,2017(4):4~10

11 智库百科.知识供应链模型[EB/OL].[2009-02-11]. http://wiki.mbalib.com/wiki/%E7%9F%A5%E8%AF%86%E4%BE%9B%E5%BA%94%E9%93%BE%E6%A8%A1%E5%9E%8B

12 王宏君,蔺娜,鬲玲,等. 工程知识管理系统模型研究[J]. 航天制造技术,2015(3):56~59

13 杨晓玲.个性化知识推荐实现知识“找”人[EB/OL]. [2014-02-27]. http://software.it168.com/a2014/0227/1597/000001597415.shtml

Research on the Composition of Engineering Knowledge Engine

Wang Hongjun1Chen Jianjiang2Dong Zhengwei2Yu Hongyan2

(1. Beijing Shenzhou Aerospace Software Technology Co. Ltd, Beijing 100094; 2.Beijing Institute of Mechanical and Electrical Engineering, Beijing 100074)

According to the demand of enterprises for intelligent service of knowledge management, this paper leads to engineering knowledge engine, which consists of knowledge annotation, knowledge classification, knowledge association, knowledge evaluation, knowledge planning and knowledge supply. It mainly deals with domain knowledge, user behavior and usage scenarios. Then, it tells the development process of an enterprise's knowledge management from asset-based to scene-oriented to intelligent, as well as the intelligent application of using knowledge engine to realize "the right people, get and use the right knowledge in appropriate scenarios" . Finally, it is envisioned that with the development of artificial intelligence, engineering knowledge engine will become our work assistant.

knowledge engine;knowledge labeling;knowledge association;knowledge evaluation;knowledge planning;knowledge supply

航天重大装备创新研制工程知识管理技术研究与应用(2015BAF18B01);面向全生命周期的飞航武器系统数字化综合集成及协同应用(A0420131501)。

王宏君(1972),硕士,信息处理专业;研究方向:知识管理、可制造性分析、故障预测。

2017-07-12

猜你喜欢
术语引擎使用者
设计让您在喜爱的虚拟世界中自由奔跑
新海珠,新引擎,新活力!
车坛往事4:引擎进化之屡次失败的蒸汽机车
新型拼插休闲椅,让人与人的距离更近
蓝谷: “涉蓝”新引擎
抓拍神器
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势
梦乡床
One Engine Left只剩下一个引擎