基于知识图谱的煤层气档案管理系统建设

2024-05-27 20:40张月李宇新梁学敏
科技资讯 2024年1期
关键词:知识图谱煤层气档案管理

张月 李宇新 梁学敏

关键词: 油田工程技术 煤层气 知识图谱 智能检索 档案管理

中图分类号: G273.5;F276.1 文献标识码: A 文章编号: 1672-3791(2024)01-0253-04

多年来,各油气田公司在勘探开发研究与生产过程中积累了海量数据和研究成果,但仍面临“有数据找不到、找到后无法用、知识经验难共享、知识创新应用难”等业务痛点[1]。随着传统油田企业档案管理在数据利用方面的弊端日益凸显,基于知识图谱的勘探开发领域档案管理系统构建,将以更具逻辑性、强关联性的方式,以更数据化、颗粒化的形式,更图形化、可视化的状态,呈现数据之间的关系,为业务人员在勘探开发方案编制、油气藏动态建模、地质工程一体化研究、数字孪生体建设等方面,提供高效快捷、隨时调用的数据信息,有助于节省业务人员搜集资料时间,提高勘探开发研究的精细度与符合率[2]。

1 煤层气档案知识库建设方案

1.1 关键需求

1.1.1 档案数据处理技术研究

对历史档案按照不同的业务维度进行多维管理,构建档案知识图谱库,对结构化数据实现相关结构化数据映射导入;对档案数据实现加工处理和知识充填,实现档案资源信息的多维聚合。

1.1.2 档案智能检索技术研究

搭建统一搜索门户,实现对档案成果及相关数据信息的综合查询和融合搜索,支持搜索信息的关联推荐。

1.1.3 档案分析洞察技术研究

建立面向业务场景的可视化分析维度,优选档案资料全,数据质量好的档案成果,构建面向业务应用的标签体系和多维分析模型,支撑针对若干特定应用场景的多维度业务数据分析需求[3]。

1.2 功能设计与建设内容

1.2.1 总体思路

煤层气公司勘探开发档案知识库建设,按照“建、搜、用”总体思路,整体规划、分步实施,持续迭代。依托煤层气公司海量档案知识资源,充分利用知识图谱、自然语言处理、大数据、机器学习等技术,通过知识成果汇总、知识体系构建、知识加工处理、知识图谱构建、知识融合,最终形成煤层气勘探开发档案智能管理系统。档案知识支撑该系统能够为各类业务场景提供智能应用[4],实现档案知识的有效支撑总体设计思路如图1 所示。

1.2.2 总体架构与数据架构

本系统搜索功能的核心技术ES 和知识图谱均采用源技术进行二次自主开发,并没有采用国外商业软件,实现产品、技术自主可控,从根本上避免卡脖子技术,防止技术断供。总体上分为数据层、平台层以及应用层3 个层面,通过“数据处理与管理—AI 赋能—数据应用”的全链路打通,实现知识图谱技术在勘探开发档案管理领域创新性的落地化应用[5],总体架构与数据架构如图2 所示。

1.2.3 知识体系构建思路

从对象域、业务域展开知识分级分类;基于企业数据模型(如EPDM 等),参考国内外工业界和学术界的标准,构建形成统一的综合知识属性分类标准;梳理知识与知识、知识与对象、知识与业务之间的关联关系,形成关系网络[6]。知识体系构建思路如图3 所示。

档案文档构建关系是围绕核心管理目标的对象知识体系。在明确构建范围的基础上,选取相关对象构建对象知识体系。本项目中属性来源于数据湖的表结构,数据从数据湖接入。

业务知识体系是按照业务所属关系,针对业务管理流程进行体系梳理,对勘探开发档案按照业务维度进行分类,对象与业务知识体系构建思路如图4 所示。

1.2.4 档案分析研究思路

整合煤层气公司勘探开发各类资料形成知识图谱,建立面向业务场景的可视化分析维度,优选档案资料全,数据质量好的档案成果,构建面向业务应用的标签体系和多维分析模型,支撑针对特定应用场景的多维度业务数据分析。档案分析研究思路如图5 所示。

1.2.5 主要功能

(1)实现煤层气勘探开发档案数据治理工作,探索出勘探开发档案的数据治理方法。实现对历史档案数据按照不同的业务维度建立标签分类体系;实现对档案数据按照标签体系进行多标签分类;实现对档案文件的主题分类、档案名称、密级、保密时间、组织机构、归档时间、编写责任人等信息进行抽取,支持对档案文件元数据的快速查询;实现结构化数据库的建立,支持Excel 等格式的半结构化数据入库,并对接现有结构化数据库,支持相关结构化数据映射导入;基于档案分类管理及知识标签体系,实现档案知识图谱库的构建、档案数据加工处理与知识充填,档案资源信息的多维聚合。

(2)搭建勘探开发主干知识图谱库,形成一站式档案检索平台。搭建统一搜索门户,实现对档案成果及相关数据信息的综合查询和融合搜索;实现基于关键词、语义理解等多种方式的档案信息的统一搜索和图谱查询,支持搜索信息的关联推荐;按照不同的用户权限、组织机构等实现对档案信息的授权管理。

(3)建设相似井知识推荐、致密气开发特征指标预测分析两个典型应用场景。

1.3 建设效果

从技术沉淀视角,为人工智能技术创新应用建立坚实基础。初步实现煤层气勘探开发档案数据治理工作,探索出勘探开发档案的数据治理方法;基于模块化、服务化、组件化建设理念,平台上沉淀形成一系列智能化知识管理共享应用组件;在知识加工处理和应用场景建设中,沉淀形成了一系列知识抽取、融合推荐及智能预测模型算法[7];提高了档案知识应用人员的检索效率,提供多维一站式检索能力;通过平台建设积累经验,整合融合各类业务、技术及知识资源,为更大范围创新研发建立基础。

从系统建设视角,在公司智能化知识共享领域取得系列实质性成果。在公司范围首次研发形成“建、搜、用”三大类知识管理共享应用平台,探索煤层气勘探开发知识体系,完成了27 万+档案及结构化相关数据接入,创新形成了主干图谱库;在公司范围构建了一站式智能搜索引擎,通过知识关联分析形成了煤层气公司勘探开发领域专属的“石油百度”;融合多种推荐逻辑,创新性地打造基于其 相似关系的知识推荐体系;融合知识图谱和人工智能技术创新,落地形成了一系列可示范、可推广的典型业务应用场景。

从资源共建视角,为各类知识资源共享共建搭建平台环境。提升煤层气公司的档案数据管理能力,提供更加灵活多维的知识管理能力;通过对档案知识的深度挖掘,实现知识再利用,利用已沉淀的知识服务新业务场景[8]。

2 结语

煤层气公司通过开展基于知识图谱的档案管理系统建设,提升了档案数据管理能力,为档案知识资源的共享共建搭建了平台环境。系统的体系架构符合云原生、微服务发展方向,具有先进性;通过系统对档案知识的深度挖掘,实现知识再利用,提供更加灵活多维的知识管理和服务能力,为业务改革和技术创新提供有效支撑。

猜你喜欢
知识图谱煤层气档案管理
2019年《中国煤层气》征订单
煤层气吸附-解吸机理再认识
档案管理中的电子档案管理
档案管理与企业内部控制关系的思考
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
DFS-C02V煤层气井高产因素简析
健康档案管理的“云”前景