郝冀斌,郝利剑,梁 巍
(中国北方发动机研究所,大同 037036)
面向产品数字化研发的知识资源集成检索研究
郝冀斌,郝利剑,梁 巍
(中国北方发动机研究所,大同 037036)
近年来,数字化设计技术已在制造企业中广泛应用,产品研发的数字化水平已成为衡量企业核心竞争力的重要因素。随着经济形势复杂多变,以及企业间竞争的日趋激烈,传统的产品设计方法已经很难满足企业当前生存和发展的需要。为了能在竞争中处于有利位置,实现产品设计数字化势在必行。
产品数字化研发实施旨在应用信息技术手段,构建数字化设计平台,改变原有落后的设计方式,通过设计仿真过程管理,搭建协同设计环境,提供工程设计方法导航,推送设计知识资源,进一步推动核心技术突破,从而提升技术创新能力。
知识管理作为数字化研发协同创新过程中的重要一环,是开展产品数字化研发的重要支撑,其中知识资源的有效管理、异构数据集成、精/准确检索、合理推送等具体应用,为企业资源挖掘、资源整合、数据关联等业务环节提供了很好的技术平台。
中国北方发动机研究所是兵器工业高功率柴油机研发设计单位,开展信息化建设多年,具有完备的软、硬件设计环境,已实施多项信息化管理系统,并在数字化研发、现代设计方法、设计集成环境搭建、知识工程等方面不断深入研究,在信息化应用方面取得了显著成果。
随着企业数字化、信息化工作的不断深入开展,在企业产品的设计、研制和销售过程中积累了大量的只是数据。然而长期以来由于“重硬件轻软件、重系统轻应用”等倾向,导致企业信息系统中的知识资源利用不佳,企业员工知识管理和知识挖掘不足等状况的产生。在应对新的发展机遇与挑战的同时,逐步显现出企业在知识管理方面存在的各种问题与困难。
从上图所罗列出的企业知识管理存在的问题不难看出,普遍存在企业知识分散、缺乏有效的组织和管理、企业内部各系统积累了大量的知识无法共享应用、缺乏有效的信息资源采集管理工具、企业知识库建立缓慢及内容匮乏、员工获取知识途径单一并检索困难等方面的问题。面对以上问题与现状,结合企业数字化研发体系建设需求,为实现企业显性知识资源和隐形知识的共享与推送,针对研发知识资源采集、异构数据管理、资源检索与推送等关键技术开展了具体技术研究,并进行了一些模式探索。
面对企业知识管理存在的问题,针对企业显性知识资源,结合企业自身特点,有目标的开展知识资源采集、异构数据管理、资源检索与推送等关键技术研究,主要研究内容如下。
图1 企业知识管理存在的问题
知识资源从广义上分为元数据与关系型数据,元数据包括企业(行业)内部的公共资源,具体包括:企业内部分散存储的纸质、电子数据;互联网存在的设计知识资源;企业内部无法有效共享的情报、标准、文献、期刊等信息资源等。关系型数据包括企业内部信息系中管理的处于孤立状态的产品设计数据。
元数据的采集可通过采用物理文件导入、OCR识别、互联网数据抓取等手段,将离散、非结构化、不可编辑的数据,抽取进数据仓库,从而可对这些数据进行整合发布。关系型数据的采集通过异构数据集成方式处理。
采用数据抓取+数据仓库存储模式,通过大量的数据分析,利用已有的产品信息分类编码,建立各类信息系统中异构数据间的关联关系,在数据仓库中建立关联数据库,针对不同信息系统中的数据应用建立映射数据表,实时抽取信息系统中的数据信息,通过一系列的集成整合技术手段,将各个不同的系统(现有系统及在建系统)的前端访问、数据展现以及信息发布进行有效的数据管理。同时提供现有应用系统中的数据备份。对未来开发数据挖掘应用做好数据源的准备。
在数据集成管理基础上,针对各种知识资源的应用特点,应用全文检索技术开发检索系统,使之具备跨不同数据库系统的能力,具备解析异构数据库的能力,同时也要具备基本的快速、模糊查询、精确定位的技术和能力。主要功能应包含:数据检索词库管理;提供多样化的检索方式,提供用户按需自定义查询条件检索数据;具备与其他管理系统集成的嵌入式查询功能,即用户可从其他系统智能检索所需信息;查询结果管理功能。具备跨库级别的统计、分析、对比等处理的功能,并且能够以多种方式生成查询结果报告;实时统计数据查询率、点击率,具有资源推荐功能;具备数据查询结果的内容整合功能,能够导出并形成包含文字、表格、图片、动画、状态信息(时间、版本、技术状态、提取信息源等)等数据的知识性报告,以便能够为知识库提供内容。
从图2中的总体技术框架中可以看出,知识资源集成检索平台以知识积累、存储、共享、应用、创新的基本过程提供相关的知识管理系统、工具和服务。企业的主要模块和功能包括:知识信息门户、智能检索、知识积累、知识交流、知识导入工具、企业信息化系统数据集成、互联网信息采集工具、知识加工处理、知识应用服务接口、和系统管理等。整个体系主要针对各种资源信息进行采集整合,在采集整合过程中,要根据该数据资源对应的服务内容,调整数据的存储内容和格式,使之能符合搜索服务的需求。此外,需要采用相应的采集策略,实现信息的及时、准确获取,对于应用系统经常新增数据的情况,要实现增量更新采集。
图2 知识资源集成检索总体功能框架
知识资源集成检索包括知识资源管理与展示、通用数据库管理、互联网信息采集与管理、信息综合查询等四个主要功能模块。
知识资源管理与展示可针对每一组用户或者每个用户,展示不同的系统资源。用户或者用户组可以定制不同的资源,从而使系统能够展示给用户更有价值的数据,减少用户查询特定数据所浪费的时间。个性化资源展示还可以展示由用户推送过来的或者由系统采集过来的互联网数据。
通用数据库管理针对元数据、关系型数据进行管理,元数据管理是使用内容管理软件的元数据选件,根据不同的数据类型创建不同的元数据类型,并且为每个类型创建一个栏目,将数据保存到对应的栏目当中。关系型数据的管理是通过采集+管理进行的。数据网关负责抽取数据,数据仓库负责接收并存储数据。数据的展示是通过开发接口结合二次开发,在基于资源展示平台上将数据进行展示。通用数据库通过数据集成接口从现有的应用系统中转换、抽取、加载数据,通过一系列的集成整合技术手段,将各个不同的系统(现有系统及在建系统)的前端访问、数据展现以及信息发布进行有效的数据管理。同时提供现有应用系统中的数据备份。对未来开发数据挖掘应用做好数据源的准备。
互联网信息采集与管理针对研发设计人员关注的互联网数据,通过设置相应的检索条件,在指定的网站、论坛、博客等互联网资源中精确抓取所需要的知识、情报,并通过内容分发在资源展示平台上进行数据展示。互联网检索支持多语言检索,支持检索内容的自动分类,检索结果可以自动归类到不同的分类中。
图3 系统功能框架
信息综合查询可提供普通检索、高级检索、分类检索、关联检索等检索方式,可根据个人检索记录,整理出整个系统的检索记录资料,并根据检索词的检索频率对检索词进行统计。可进行检索结果收藏与推荐,个性化资源定制推送等互动。
知识资源集成检索采用B/S及C/S结合的系统架构。前台数据展示、数据检索等功能采取B/S结构和Web 服务技术,后台管理系统采用C/S结构,通过开发系统内部及外部数据接口,实现数据的采集管理与传递。主要功能页面如图5~图8所示。
图5 综合数据检索
图6 数据查询结果
图7 知识资源展示
本文对产品数字化设计研发体系中的知识资源集成检索应用技术进行了深入研究,结合企业自身需求,分析了各类知识资源管理及集成过程,包括知识数据在管理检索过程中的传递过程。通过集成检索系统的初步实现,大量的知识资源得以有效管理与共享,应用全文检索技术使知识资源的查询检索精准快捷。
图8 互联网资源检索结果管理
[1]张晓星,唐朝晖.企业多源异构数据库数据集成的研究[J].可编程控制器与工厂自动化,2007,03,66.
[2]Jiawei Han,Michiline Kamber,著.范明,盂小峰,等译.数据挖掘概念与技术[M].北京:高等教育出版社,2001.
[3]杨平,等.数字化设计制造技术概论[M].北京:国防工业出版社,2005.
[4]赵东,王丁柱,孔惠敏,等.数字化造船系统中的关键技术介绍[J].船海工程,2006,20(3):110-112.
[5]王新玉.数字化设计[M].北京:机械工业出版社,2003.
[6]张维鹏,任云鹏,卢崇绍.基于理论的产品创新设计[J].重型机械科技,2006(1):4-8.
[7]李贺,季桂琳.企业知识管理系统构建研究[J].情报科学,2005,23(1):114-1 17.
[8]潘立武,王保保,李绪成.企业知识管理及其知识仓库的解决方案[J].计算机工程与设计,2002,(11):18-20.
Research on the integration and searches of the knowledge resource for digital product development
HAO Ji-bin, HAO Li-jian, LIANG Wei
本文针对科研院所、制造企业中基于知识管理的数字化设计研发问题,结合企业知识工程的实施应用情况,简要分析了各类知识资源管理及集成过程,通过对各类知识数据的分析与解构,提出了创新研发体系下知识资源集成检索与知识推送的框架模型,及具体实现方案,并提出了个人的理解和建议。
数字化研发;知识管理;数据检索;数据仓库
郝冀斌(1980 -),男,助理研究员,主要从事企业信息化和数据库应用开发。
TP274
B
1009-0134(2011)4(上)-0061-05
10.3969/j.issn.1009-0134.2011.4(上).20
2010-10-09