胡敏清
(中国石油青海油田公司信息服务中心,敦煌 736202)
在油田采集范围不断扩大的过程中,企业数据库容量在此过程中得到了较大的增加,容量从GB级已经向着TB级发展。在此过程当中,其在数据的存储、查询、提取以及管理方面也发生了一定的变化。在该种情况下,即可以通过大数据技术的应用对海量的数据集进行访问,在从中对具有价值信息进行抽取的基础上分析未来趋势,具有较好的应用价值。
对于油田大数据处理,即是在油田的数据范围以内对非结构、结构化数据的混合处理。具体处理过程有离线数据以及在线数据这两种处理方式。在具体处理技术方面,在统一管理计算模型的基础上实现迭代、批处理以及流计算模型管理,在支持应用的基础上使其能够对具有穿透、跨越特征的经营、成果、人力资源以及天气数据等进行采集,以此对油田大数据的应用模式进行实现。
在线数据处理方式来说,其能够以实时的方式对油田的生产情况进行处理、预测以及感知,如油区当中不同接口、业务以及设备的运行状态,以此对秒级监控告警目标进行实现。同批量处理方式不同,流处理方式具有着全内存计算的特点,能够对整个过程当中的速度问题进行有效的解决与处理,在对实时数据流等进行处理时,在可靠、灵活性以及性能方面具有较好的体现。对此,该模型则是实际大数据处理当中的有效方式。
离线处理方面,其较多的应用在OLAP分析工作当中,在具体多维分析工作当中,需要具有大量的表间关联以及数据分组工作,并因此对维度多性能产生影响。通过Spark并行化处理能力方式的应用,无论其中具有多少维度的增加,在实际开销方面却并没有增长。通过其应用,即能够实现巨大Cube的支持,具有着较多的维度。且在每一次多维分析当中,都能够对更多的维度提供支持,并不会因此对分析性能产生影响。
在油田数据当中,具有着地质对象发展规律、趋势以及动态变化等情况,根据油田行业知识以及大数据技术对这部分动态变化、趋势情况进行揭示,则可以说是建设智能油田的一项重点工作内容。
对于传统数据查询方式来说,其通常通过事物数据库现场数据的采集对目标进行实现,在实际处理当中,需要以逐层的方式查询分析,在具体查询路线方面具有较为固定的特点,并因此出现查询维度较少且多表查询较弱的情况。在该方式具体应用当中,无法对复杂的综合查询目标进行实现,需要在以逐层方式查询分级之后再进行整理下载。通过传统数据查询实现对仓库多维数据模型的转换,则能够帮助决策人员在实际工作当中具有能够实现数据源跨越的整合视图,对任意维度组合的查询提供支持。
通过大数据技术的应用,则能够在不同数据类型当中交叉分析的基础上对数据价值进行获得,以此对智能油田的建设进行推进。在具体建设智能油田的过程中,对灵活、具有多角度特征的数据分析能力具有较高的要求。从决策角度来看,决策者所希望的即是对多角度分析结果进行获得。从开发形势情况变化来看,其不仅需要掌握不同开发单位、油田的开发形势变化,且需要获得具有不同采出程度以及不同类型油藏情况的变化分析,且同时包括有自然因素以及社会因素的影响因素分析。
在大数据技术具体应用当中,数据挖掘算法是其中的核心内容,对于不同算法来说,其以不同的格式与数据类型为基础,以此才能够以更为科学的方式对数据本身特点进行呈现。对于该种情况,则需要积极做好适合油田勘探开发的数据挖掘算法研究,如从全局角度对含水、耗电以及采油量的统计,对耗电同产量、季节同生产用电等关系进行评估,即以分析方式的应用提前对一个时间段的用电量进行估计,在此基础上实现生产的安排。此外,需要对不同因素导致的停产损失进行统计,并针对可控停产做好预防与针对性的治理。
在建设智能油田当中,需要以实时的方式做好变化数据预测。在具体工作中,油田需要由发生后预警实现对超前预警方式的改变,在对未来勘探开发工作提供指导的基础上使数据能够充分实现自身价值的发挥。在此过程中,通过大数据挖掘技术的应用,即能够以多种方式对开发规律进行分析,在对多维度储量评价模型进行建立的基础上实现油田整体预警能力的提升,在对产量波动风险有效降低的基础上提升生产效率、控制管理成本,以此为油田在新市场环境下稳定持续发现提供重要的动力。
在现今油田发展当中,对于数据的处理已经成为了非常重要的一项工作内容。对此,即需要油田管理者能够对该项工作引起重视,通过对大数据技术的科学运用为油田的稳定持续发展提供动力。
[1] 王世杰.大数据环境下石油企业信息化的建设[J].信息系统工程.2017(07).
[2] 江南.建立广东供销合作经济信息大数据应用平台探讨[J].广东合作经济.2013(04).
[3] 朱正德.大数据时代检测技术功能的拓展和演化及其对现代制造业的深远影响[J].四川工程职业技术学院学报.2016(01).