面向复杂产品研发的多源异构知识获取技术研究

2018-03-14 03:44
制造业自动化 2018年2期
关键词:采集器隐性网页

(北京机电工程研究所,北京 100074)

0 引言

复杂产品研制过程技术含量高,多专业耦合复杂,蕴涵着大量的基础科学和前沿技术,研制过程中的每个业务活动都贯穿着设计经验、原理、规范等知识的处理、应用与创新,是典型的技术密集、知识密集的复杂产品研制过程。在研制过程中,沉淀和积累了大量的研制案例、成功经验、设计方法等知识资源,这些知识以文档、报告、模型或结构化数据等方式广泛存在于研发使用的各类信息系统中或富有经验的各领域专家头脑中,知识来源不同,结构各异。如何从各种系统中采集知识、从专家的头脑中获取知识并持续积累与更新,提高知识的重复利用率,是推动技术创新,提升产品研制效率与水平的关键。在此背景下,本文对复杂产品研发过程中的多源异构知识获取技术进行了深入研究与探讨。

1 国内外研究现状

国外先进的航空航天企业较早开展了知识获取、管理与应用的研究实践,从人员、过程和技术的角度出发,以网络、数据库等信息技术作为手段,对产品研发知识进行了有效采集和统一管理,并在产品的创新设计、制造、维护等环节进行了应用,从而提高产品研发创新程度、提高研发效率、降低研制成本。波音公司通过构建实践社区(Community of Practice)、知识管理Wiki等方式实现员工隐性知识的传递和共享,并征聘退休专家作为知识提供者,向波音提供人才培训、技术咨询、第三方分析等知识服务;同时,波音公司推出了知识管理平台,以数字化方式为航空公司客户提供产品研发、制造、维修、运营等方面的综合数据查询知识服务,将历史知识经验有效管理起来用于新产品的设计过程,在此支持下开发的波音777创造了波音公司历史上最成功、无差错的开发记录[1]。NASA面向分布在全国的相关机构和合作伙伴,推出研究和工程网(NREN,Research and Engineering Network),使得这些专家、工程师和研究人员能在一起协作,获取到相关的工程资源,并重点记录了不同型号任务、不同机构和不同年份的相关经验教训,方便工程师学习和借鉴,降低了知识的流失风险,为保持MSFC火箭推进系统设计的世界领先地位发挥了重要作用[2,3]。

知识管理已经成为国内各大军工集团竞相发展的领域,经过二十多年的发展国内军工企业也取得了相当的成绩。其中航空601推出知识管理平台,采集了老一辈科研人员的技术工作体会和经验及专业技术文件指南,收集了世界上各个国家三代以上战斗机的有关设计资料,有效的积累了研发知识,促进了技术创新[4,5]。航天科工二院23所将近10个信息系统中的数据、信息资源处理整合成统一的索引格式,实现了跨系统知识采集与统一检索,提升了技术人员知识获取的快速性和准确性,为支撑复杂产品研发发挥了重要作用。

2 知识获取技术研究

面向复杂产品研发的知识管理过程中,知识获取是将存在于信息系统中的信息和存在于人脑中的知识转化为可复用、可检索的知识资源。知识获取技术的研究可以分为显性知识获取和隐性知识获取两种,显性知识获取是对已有信息系统中存在的知识进行采集,即基于索引的跨系统知识采集;隐性知识是对专家经验等未进行管理的知识进行采集,即基于模板的隐性知识采集。

2.1 基于索引的跨系统知识采集技术

2.1.1 采集架构

在复杂产品研发过程中,显性知识主存储在PDM、TDM等产品全生命周期管理系统、标准规范系统及其他系统各类信息系统中,以技术报告、三维模型、工艺文件、结构化字段等多种类型存在。为实现知识资源的统一管理与应用,需要在不改变各异构信息系统的基础上,对各信息系统中的异构知识资源进行采集并处理成统一的格式。本文提出了一种基于索引的跨系统知识采集技术,如图1所示,采用分层架构的思想,通过构建适用于不同类型数据源的数据采集器对数据资源层的各类知识进行统一处理与整合,最终形成可统一应用的知识索引库。

采集架构分为数据资源层、数据处理层和信息系统索引层,具体如下:

1)数据资源层:数据资源层包括PDM、TDM、标准规范等信息系统,根据信息系统中数据的存储方式,归集为关系型数据库、文件服务器、html网页、其他类型数据源四种类型的异构资源。

2)数据处理层:针对四种异构资源,建立不同的知识采集器,主要包括关系型数据库类知识采集器、html网页类知识采集器、文件服务器类知识采集器及其他类知识采集器,通过采集器配置各信息系统服务器或数据库地址、数据采集方式、采集字段、索引存储地址、更新机制等。

3)信息系统索引层:通过索引数据生成服务,对采集的知识进行封装,形成统一格式的索引库。

2.1.2 采集机制

1)关系型数据库类知识采集机制

关系型数据类知识采集器在不改变源数据库的数据结构、数据内容和工作方式的情况下,获取数据库中的属性信息,采集过程如图2所示。首先,确认各信息系统知识采集范围和内容,根据各信息系统的表结构,利用SQL创建包含知识采集内容的数据库视图,其中数据库视图中应包含的基本信息如表1所示;然后,通过关系型数据库知识采集器接入数据库视图,配置提取的字段、标注的特征与权限并进行格式处理后,形成统一的索引格式存储到索引库中。

图1 基于索引的跨系统知识采集架构

图2 关系型数据库知识采集机制

表1 数据库视图结构

2)文件服务器类知识采集机制

文件服务器类知识采集器对文件服务器目录进行自动扫描,按照目录形式或者列表形式对文档进行分类组织,将目录作为文档分类标引项自动提取。然后,依据文件后缀名对文件的种类进行确定(如word、xls、ppt、pdf、htm、txt、zip,rar,tar等),针对每一类型文档通过相应的数据读取接口提取文件的特征内容,如标题、作者、单位、摘要等,最终对文档全文内容进行自动扫描与抓取,与特征内容合并生成索引文件进行存储,采集机制如图3所示所示。

图3 文件服务器类知识采集机制

3)html网页类知识采集机制

html网页类知识采集器通过http请求方式,访问与获取网页中的知识资源,采集机制如图4所示。首先,需确认与配置要抓取的网页地址及抓取深度,抓取深度是影响抓取的一个重要因素,设置深度越大,那么抓取的网页数量越多。若设置深度为1且当前网页的深度为0,则从当前网页可直接到达的网页的深度为1,依此类推。然后,通过html网页类知识采集器获取所有网页并保存到本地,再解析网页中的URL转换成纯文本内容,按照索引文件结构存储到索引库中。

图4 HTML网页类知识采集机制

4)其他类型知识采集机制

针对特殊类型的知识资源,如即包含关系型数据库又包含文件服务器的知识资源,可在关系型数据库类知识采集器、文件服务器类知识采集器或html网页类知识采集器的基础上定制开发特殊的知识采集器,接入统一的数据库视图读取结构化数据,利用文件读取接口读取文件服务器中的文档,并通过文档唯一标识与文件服务器文件路径的对应关系实现结构化数据与文档的关联,最终处理成统一的索引格式存储到索引库中。

2.2 基于模板的隐性知识采集技术

在复杂产品研发过程中,隐性知识采集的过程也就是将隐性知识显性化的过程。本文提出了一种基于模板的隐性知识采集技术,通过配置不同类型的知识录入模板,实现隐性知识的录入与管理。

隐性知识录入模板应包括基本属性、业务属性和扩展属性,属性说明如表2所示。其中基本属性用于描述知识的物理特征,业务属性用于描述知识的分类,扩展属性用户描述知识的特征内容,是某类知识的特有属性。隐性知识采集时,首先应定义知识基本属性库、业务属性库和扩展属性库,通过组合基本属性库、业务属性库和扩展属性库中的属性创建指定类型知识的录入模板,然后在通过知识录入模板将专家头脑中的研制经验、设计方法、计算工具等知识录入系统中,形成可查找、可应用的显性知识。

表2 隐性知识模录入模板属性说明

3 应用示例

在面向复杂产品研发的工程知识管理系统中,部署了关系型数据库类知识采集器、文件服务器类知识采集器和HTML网页类知识采集器,对PDM、标准规范管理系统中的显性知识进行采集;建立了隐性知识录入模板,对设计经验类知识进行采集。

1)显性知识采集示例

在工程知识管理系统中,采集PDM系统中显性知识的过程如下:

用户通过工程知识管理系统的左侧导航栏点击“应用系统配置”下的“索引服务器配置”,展示出右侧的索引服务器配置页面;在索引服务器配置点击“新增”按钮,创建PDM系统的索引服务器,填写配置ID、名称、采集端口、IP地址等信息;信息填写完成并点击“确定”后,系统会依据配置信息自动对PDM系统中的知识进行采集,如图5所示;同时,在索引库中可查看通过知识采集器采集到的全部知识索引,如图6所示。

图5 配置PDM知识采集器

图6 查看采集的知识索引

2)隐性知识录入示例

在工程知识管理系统中,通过经验规则类知识模板,录入隐性知识的过程如下:

用户通过工程知识管理系统的左侧导航栏点击“知识创建”下的“经验规则库”,展示出右侧的知识录入页面;在知识录入页面中点击“新增”按钮,打开经验规格类知识录入模板;填写名称、专业、类别、所属产品、阶段、业务活动等信息,如图7所示,填写完成并点击“保存”后,系统中新增一条经验规则类隐性知识。

图7 经验规则类知识录入界面

【】【】

4 结束语

本文以军工企业的需求为背景,以国家科技支撑计划课题(课题编号2015BAF18B01)为支撑,紧密围绕复杂产品的研制特点和需求,提出了一种面向复杂产品研发的多源异构知识获取技术,并通过工程知识管理系统对知识采集过程进行了分析与示例,为复杂产品研发企业的知识获取与应用提供了很好的解决思路。多源异构知识获取技术通过基于索引的跨系统知识采集技术和基于模板的隐性知识采集技术,实现企业内部大量产品数据资源及专家经验知识的管理与应用,对提升产品研发效率与研制水平,促进企业可持续发展具有重要意义。

[1]Strategic Plan for Knowledge Management[R].NASA Knowledge Management Team,2002.

[2]Coogan J.Boeing Knowledge Management[R].Boeing Management Company,2008.

[3]刘征,鲁娜,孙凌云.面向概念设计过程的隐性知识获取方法[J].机械工程学报,2011.

[4]高大成.知识管理-中国航空工业企业面向未来的战略选择[M].中国经济出版社,2006.

[5]施荣明,赵敏,孙聪.知识工程与创新[M].航空工业出版社,2009.

猜你喜欢
采集器隐性网页
让“隐性课程”会说话
COVID-19大便标本采集器的设计及应用
浅析书籍设计中的“隐性”表现
基于HTML5与CSS3的网页设计技术研究
论高中语文隐性知识教学策略
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于Cortex-M4的油气管道微功耗数据采集器软件设计应用
多传感器通道多点数据并行高速采集器设计
降雨径流采集器的无功损耗分析及节能电路设计