勘探开发数据库的数据应用新需求

2015-12-20 05:17尹大庆
西部探矿工程 2015年7期
关键词:数据服务数据表子集

尹大庆

(大庆油田有限责任公司勘探开发研究院,黑龙江大庆163712)

勘探开发数据库的数据应用新需求

尹大庆*

(大庆油田有限责任公司勘探开发研究院,黑龙江大庆163712)

数据是石油勘探中科研生产的基础,随着勘探程度的提高,科研生产中对数据库应用的水平也要求提高。分析了目前油田勘探开发数据库的应用情况,对勘探开发数据库应用系统之一的《勘探开发数据服务系统》功能做了介绍,并总结了勘探科研生产工作中常用的对数据进行查询统计的方法,建议在《勘探开发数据服务系统》中增加多表联合查询下载功能、不同类别数据表之间的指标统计、用项目研究中产生的中间数据作为统计条件进行的勘探数据库数据统计等新的数据查询统计方法,来满足不断发展的石油勘探中科研和生产对数据处理统计的需求。

勘探开发数据库;勘探项目库;数据查询;数据统计;数据下载

油田勘探信息化建设[1]的成功,推动了勘探事业的发展。作为勘探信息化建设核心数据内容之一的勘探开发数据库[2],已经成为油气勘探科研生产中主要的数据来源,它以数据的形式记录了整个油田的发展历史,是油田勘探科研生产最重要的科学依据,因此,如何方便灵活地将勘探开发数据库的数据应用到科研生产中,是搞好科学勘探的关键和基础。

1 当前数据库使用现状

对于勘探开发数据库的应用系统,在数据库发展建设的历程中,已经伴随发展了诸多版本,大庆油田勘探开发数据中心研发的《勘探开发数据服务系统》,以其稳定的性能和方便的数据查询下载功能,被科研生产项目组广泛地使用。它能够实现对勘探类、开发类等不同数据源数据的查询与下载。同时根据科研人员数据获取方式的不同,系统可按照地质对象、专业、GIS等方式对数据进行查询检索。按照勘探开发科研、生产业务人员的专业特点,定制数据查询,实现用户个性化的数据查询获取方式。数据应用人员只需使用一个用户、登录一个平台即可查询下载勘探类、开发类等相关专业数据到本地计算机上。

但是,对下载到本地计算机上的数据是某个地区或者每口井最原始的数据,对于某个勘探地区的研究来讲,这些原始数据大多数是不能直接产生科研结果或者用于地质绘图的,还需要经过科研人员对这些原始数据进行数据分析及综合研究。这种数据分析就是对查询后得到的原始数据,按照科研生产目的不同要求,用多种方式方法进行运算处理,产生想要达到的结论或效果。数据处理方法很多,工作量也很大,有些数据分析方法在目前的《勘探开发数据服务系统》里还没有实现。

在《勘探开发数据服务系统》投入使用之前,对勘探数据库[3]的数据应用是通过“勘探项目库[4-5]”系统来完成的。“勘探项目库”系统,根据应用范围划分为“松辽盆地中浅层勘探项目库”、“外围盆地勘探项目库”、“松辽盆地深层天然气勘探项目库”3个应用系统。其数据管理分为3层:根据项目组需要,从勘探数据库查询下载相关的原始数据,由项目组对这些原始数据分析处理,产生中间数据[4],再用中间数据绘制地质图件。“勘探项目库”系统已经具备基本的GIS导航查询功能、基本的数据统计功能、常规统计图绘制功能等。但是,对于目前对油气勘探生产的要求,这些常规的、初级的统计功能已经无法满足项目组科研生产的需要了。在当前的科研生产中所产生的新思路、新方法,非常需要有一套更新的、更强大的数据统计和处理功能来实现。

2 科研生产中常用的数据统计处理方法

2.1多表联合查询下载功能

类似于数据库的Link功能,把2个数据表用1个或多个连接起来,将2个数据表中实际需要的字段形成一个新的数据表,然后下载到本地计算机使用。图1以有效孔隙度为例,在科研生产中,经常绘制有效孔隙度图。绘图就要有坐标,但是坐标数据(数据表a)和有效孔隙度数据(数据表b)不是存在于勘探开发数据库的同一个表中,要分别被提取出来,被提取之后就会产生2个数据表。目前做法是将这2个数据表分别下载后,用其它工具(如EXCEL等)再进行坐标和有效孔隙度数据的连接,产生一个新的带坐标的有效孔隙度表(数据表c),这个过程每次绘图都需要做一遍。所以,类似上述这种多表联合查询下载功能是数据查询下载中最常用的一种功能。

2.2不同类别数据表之间的指标统计

就是以一个数据表为基础表(数据表a),在另一个数据表(数据表b)里查询一些数据项,并对这些数据项进行统计,形成一个新的统计结果数据表(数据表c)。如图2,是一种砂岩平均厚度数据处理流程,由现场分层数据表(az17)按井号、层位为条件,在测井解释数据表(ac01)里检索并统计出该井该层位的平均砂岩厚度数据,以一个新数据表的形式下载到本地计算机。

图1 有效孔隙度数据处理流程

2.3用项目研究中产生的中间数据作为统计条件,进行的勘探数据库数据统计

图2 砂岩平均厚度数据处理流程

图3显示了项目组的一种数据处理流程,项目组先从数据库里提取了子集A(综合解释等数据),经过地质研究,产生了中间数据(地层细分层等数据),这是,以这些中间数据为查询条件,再回到勘探数据库中提取子集B(试油结果等数据),再用EXCEL等工具,按照研究要求,经过复杂的运算,得到计算结果数据。这种也是常用的数据统计方式,目前还没有数据查询系统实现过。

图3 中间数据查询处理流程

这个流程中,项目组最终要得到的数据,是对子集B再计算后的结果,这个计算才是难度最大的,目前的实现方法是:得到子集B之后,根据项目需求,由软件专业人员即时编写程序来完成对子集B数据的人工分析处理[6],这种处理需要许多步骤,里面包含多种思想,还需要根据处理结果实时地调整处理方法,交互性非常强,用常规的数据处理工具是无法完成的。而且,不同的项目,不同的阶段,都会产生不同的处理方法,这都得有针对性地编写程序来完成。

举个具体的例子,某项目组是对一个较大地区进行地质研究,所需要的数据量很大,先将钻井基础数据、地层分层数据、岩芯数据和测井曲线等下载到本地计算机后(子集A),由项目组进行地层细分层,把目的层细分为5层(F11,F12,F13,F21,F22),根据这个分层,数据库专业人员再到勘探数据库里把试油数据等提取出来也下载到本地计算机(子集B),然后由计算机专业人员编写程序,按照5分层,把每口井对应层的孔隙度渗透率、产量、有效厚度、孔隙度、原始含油饱和度等,分别以不同方法统计到这5层里,用这5分层的数据来绘图。绘出的图发现不是很理想,达不到设计要求,又把5分层改为12分层,上述的数据(子集B)提取和统计计算过程又得再做一遍,重新绘制了12分层的图件。

这样的数据统计方式在以前来说是人工统计不可能完成的,只有借助于当前计算机强大的数据处理能力,才得以实现。这种应用形式已经使用了许多年,而且每次编写的程序是不固定的,数据处理需要反复编写程序,工作量很大,效率相对较低。这种类似的统计方式也是常用的,也需要有一个系统能够实现。

3 结论

(1)在项目组的科研生产中,存在许多实用性非常强的数据统计方法,这些统计方法目前是零散地分布在项目组中,没有系统化的被程序实现,可以能将这些数据统计方法集成到《勘探开发数据服务系统》中,将会提高数据处理的效率,增强勘探开发数据库的应用效果,也会给数据使用者提供非常方便的数据查询统计工具。

(2)许多新的数据查询统计方式将随着新的石油勘探的需求而不断产生,所以需要程序开发者不断地搜集整理,使数据库查询系统更加完善,给科研生产项目组提供更方便实用的数据查询处理工具。

[1]常冠华,陈树民,熊华平,等.大庆油田油气勘探信息化建设的成果与特色[J].中国石油勘探,2009(5):33-40.

[2] 王洪礼,催国林.勘探开发数据库、数据银行与数据仓库技术浅析[J].石油工业计算机应用,2002(2):35-36.

[3]闫海燕,常冠华,王洪礼,等.大庆勘探数据库的建立与发展[J].油气田地面工程,2004,23(8):50.

[4]熊华平,常冠华,刘万伟.勘探开发数据管理中心建设设想[J].大庆石油地质与开发,2004,23(5):42-44.

[5]熊华平,陈付平,王洪礼.面向综合研究的石油数据管理与应用[J].大庆石油地质与开发,2008,27(5):43-44.

TE38

B

1004-5716(2015)07-0037-03

2014-11-28

尹大庆(1964-),男(汉族),黑龙江哈尔滨人,工程师,现从事地质勘探及数据库应用研究工作。

猜你喜欢
数据服务数据表子集
地理空间大数据服务自然资源调查监测的方向分析
拓扑空间中紧致子集的性质研究
基于数据中台的数据服务建设规范研究
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
关于奇数阶二元子集的分离序列
基于列控工程数据表建立线路拓扑关系的研究
完全二部图K6,n(6≤n≤38)的点可区别E-全染色
数据服务依赖图模型及自动组合方法研究
如何运用税收大数据服务供给侧结构性改革