王晓红
(中国飞机强度研究所,陕西 西安 710065)
通过统一检索平台提升知识管理水平
王晓红
(中国飞机强度研究所,陕西 西安 710065)
随着科技信息的电子化发展,企业内部已建成包括科技期刊、标准库和数字图书馆等在内的多元化知识平台,数据量也从几十万到上百万不等。而用户在查找信息或文件时,往往需要在多个系统之间进行转换,既浪费时间且效果也不理想。如何找到一个快速、有效的知识获取机制,来统一集成和提升知识管理水平,成为当前很多企业的迫切需求。本文通过介绍在企业内部搭建统一信息检索平台,实现对分布在各个应用系统中的信息进行多维度的检索,提高查询效率,为知识的分类和管理水平的提升提供强有力的支持。
统一检索;知识管理;集成;效率
当今企业对信息化的重视程度越来越高,纷纷投入大量的时间、人力和物力建设OA、ERP、PDM、 CRM等信息化系统,期望通过信息化的手段提升管理水平、管理效率和市场竞争力。但是在信息化建设的过程中,常常出现这样的现象,一方面IT应用系统在不断改善和提升企业管理水平,另一方面,由于各应用系统在不同时期建设、相对独立,形成了越来越多、大大小的信息“孤岛”。各个信息系统之间相互缺乏关联,信息资源难以共享,不利于知识的积累和再利用。
为了摆脱这一困境,搭建起统一高效的信息平台,我们在Autonomy IDOL平台基础上定制开发了“统一检索平台”该平台具备强大的精确信息获取功能,与内部信息化平台无缝集成,对知识进行自动采集、提取、分类和聚合,将分散在各个IT应用系统中的信息进行有效的搜集与加工整理,使用户可以一站式查找存储在各个应用系统上的资料,便捷地获取科技信息、经验信息和技术文档等感兴趣的知识,建立科学、公平和可持续的知识共享机制。
统一检索平台的总体架构设计如图1所示,可分为数据采集、数据处理和数据访问三个层次。
2.1 数据采集层
数据采集层是整个系统的最底层,它利用各种数据抓取工具,如ODB C Connector、Http Connector、FileSystem Connector等,实现对多种来源数据(如数据库、网站和文档等)内容进行采集和聚合。同时,它利用“原址管理”技术建立所有格式数据的索引,将信息保留于其原始位置,消除了数据复制需求,降低了硬件存储成本。
2.2 数据处理层
数据处理层是整个系统的核心层,主要包括数据的存储、数据的分类和数据的关联。
图1 总体架构
经过数据采集层进入系统的结构化数据和非结构化数据会按照内容的关联关系建立索引,并在此基础上进行数据的分类和聚合。系统把每条数据的相关信息(如分类、来源、日期等)存储到数据库表中,以方便进行查询和分析。
2.3 数据访问层
数据访问层位于系统最上层,面向最终用户,给用户提供各种信息处理和沟通方法,帮助用户进行信息的搜索、分析和统计。同时系统根据不同的用户访问权限,展示不同的数据,保证了数据的安全性。
系统以Autonomy智能化数据操作平台(IDOL)为技术核心,其工作原理如图2所示。
图2 智能化数据操作平台原理图
智能化数据操作平台(IDOL)通过对内容的理解,整合来自多个存储库的非结构化、半结构化和结构化信息,为跨应用程序和内容自动运行操作提供了一个实时平台。它包含5个组件:AgentStore、 Category、 Community、 Content和View。
AgentStore是用户服务器,主要负责存储用户信息的全部信息,如用户名、密码、用户聚焦等。
Category是分类服务器,主要负责将IDOL中的所有数据按照用户指定的逻辑进行分类,并按照指定的标准训练分类,将所有的数据文档归类存储。
Community是用户和内容交互服务器,用来生成交互信息,如安全字符串、专家定位等。
Content是内容服务器,是整个IDOL平台的核心部件,所有的文档内容都是以索引结构存储在 Content组件中的, Content组件是一个数据容器,同时又是一个简单、高效、功能健全的搜索服务器。
View是显示模板,将返回的xml格式查询结果嵌套在模板中显示。
这几个组件将整个IDOL平台整合为一个功能强大的搜索利器,为企业的信息化查询提供强有力的支持。
我们依托智能化数据操作平台(IDOL)技术,整合内网多个网站及OA、公文、科技信息等应用系统,搭建了一个统一的信息检索平台,真正实现了一站式的搜索目标,使用户更加快捷、方便地搜索和访问分散在内部各种信息系统中的信息。
整个系统实施模型如图3所示。
4.1 信息应用提升
由于系统中大量的信息都是非结构化的,因此,将非结构化的信息以比较清晰的视角和方便的方式呈现给用户,是系统需要解决的问题。借助IDOL的智能搜索引擎技术,采用discover模式,帮助用户实现从“搜索”到“发现”的提升。
检索方式,既可以按照关键字,也可以按照自然语言的描述进行检索。搜索引擎对非结构化的数据采用了聚类处理,通过深入挖掘信息内部的关联关系,使用户搜索到的信息更加准确;同时搜索引擎可以对搜索结果按照内容匹配的程度做降序排列,从而有效地提高了信息使用效率。
图3 系统实施模型
4.2 知识管理提升
在当前知识经济时代,知识管理是企业发展的关键所在,能够为企业带来更大的经济效益。
通过强大的统一检索平台,不但加快了信息的搜集与整理速度,更为重要的是搭建和完善了知识交流的平台,实现了知识的流动和共享,增强了企业的应变能力和创新能力。
本系统以IDOL关键技术为基础构建统一检索平台,运用知识管理思想,通过处理结构化和非结构化数据,为构建知识管理平台起到搜集、加工、传递和发布的作用,实现了资源共享,加速了情报信息在企业内部的流动,对提升企业的知识管理能力和竞争力有重要意义。
[1]邹小筑,缪红梅.信息检索技术在网络数据库中的应用研究[M].图书情报工作出版社,2007,02.
[2]王泽胤.全文信息检索的快速索引文件结构及系统的设计与实现[M].长春:吉林大学出版社,2009.
Research on the Power Factor Compensation Controller Based on Single-chip
Jiang Kefen
(Xi'an Petroleum University,Xi'an 710000,Shaanxi)
In order to reduce the power loss caused by inductive loads,based on the analysis of the effectiveness of existing power factor compensation controller,this paper designs a power factor compensation controller using four capacitors controlled by single-chip to compensate automatically.
power factor;single-chip;power compensation
王晓红,女,甘肃靖远人,本科,高级工程师,研究方向:计算机网络技术。