大数据时代智能化煤田地质勘查报告的实现
——以煤层煤质为例

2022-01-11 01:11斌,孙岩,罗
韩山师范学院学报 2021年6期
关键词:煤田煤质数据表

李 斌,孙 岩,罗 群

(1.韩山师范学院 地理科学与旅游学院·潮菜学院,广东 潮州 521041;2.北京联合大学 特殊教育学院,北京 100075;3.中国石油大学(北京)非常规油气科学技术研究院,北京 100049)

继互联网、云计算等发展之后,大数据技术再次在各行各业掀起了信息技术应用的重大变革[1-2].大数据是通过对大量数据的深入挖掘,分析问题、解决问题并做出正确决策的一种研究方法[3-4].2012年,美国发布了“大数据研发计划”,将数据定义为“未来社会的新石油”,“大数据”(big data)一词成为国际社会技术探讨的热点[5].我国于2015年印发了《促进大数据发展行动纲要》,国土资源部、农业部、环保部、北京市等纷纷研讨并印发了大数据发展的实施意见[1,6].

中国地质调查局特别重视地质大数据的建设与研究[7-8].因为地质资料大数据,是国家投入巨大的财力、物力获得的科技成果,是国家建设、发展的基础资源,若能科学管理各类地质大数据,并深入挖掘、研究其科学价值,为全社会提供信息共享服务,具有重要意义.中国地质调查局于2017年11月发布了“地质云1.0”服务,实现了75个国家核心地质数据库的网络共享,提出了智能地质调查新模式;2018年国家地质大数据共享服务平台“地质云”2.0正式上线服务,构建了基础地质、区域地质、矿产地质等12类信息数据库,集中管理了10万个钻孔地质数据[8].服务平台的实现为地质类行业提供了大数据构建的初步模式,并引领地质调查向现代化方向发展.但该系统构建主要针对地质大数据的优化科学管理和信息联通共享的建设与服务模式,其深层次的数据挖掘与智能处理还处于起步阶段[9-10],目前国内外还未有地质大数据深层次服务典型案例的研究与相关报道.

笔者长期从事煤田地质勘探工作,发现逐年增加的煤田地质资料在数据管理和应用方面存在诸多问题.如,地质数据孤岛问题依然突出,大部分煤田勘探数据仍然以分散式封闭管理为主,数据格式主要以文本和电子表格或单机数据库的形式保存,数据归档以文件夹结构模式保存,数据开放性、共享程度不足,地质信息的查询、检索、传阅等效率较低,远远不能满足科研、生产的迫切需求.特别是在煤田地质勘探报告的编制过程中,需要应用矿区内所有煤田勘探历史资料,其收集、分析、统计、计算等重复工作量巨大,常发生数据的准确性和可靠性问题,有时纠正、修改一条煤层或煤质数据,需要反复检索所有的报告文字和相关图件,以保持报告前后内容的一致性.尤其是开采规模较大的煤矿,每隔3~5年就要进行一次储量核实,向国土部资源中心、省或自治区国土资源厅备案,提交新的储量核实报告,就要重复整理、统计矿区内所有煤田地质钻孔数据,重新评估矿区煤炭资源储量.查找、厘清历史地质钻孔资料是一项困难极大而繁杂的工作,耗费大量的人力、物力,令地质工作者苦不堪言.如何减轻繁琐的重复性劳动,是所有地质工作者迫切关心的问题[11-13],若能通过数据挖掘与深度开发应用,实现煤田地质勘查数据自动化整理,辅助编写地质报告,最终实现人工智能地质报告的编制,是一种工作方法的革新,对地质工作者是一次彻底的劳动解放,必将产生巨大的效益[14].

本文通过对煤田勘探大数据的深入分析,以实例介绍使用关系型数据库技术,将煤田勘探中煤层、煤质等结构化数据进行科学管理与自动化整理;使用ASP网页数据库技术,对煤层、煤质等数据进行自动分析、计算、统计,并用网页的方式动态表格展示煤层、煤质统计数据,实现计算机技术辅助编写地质报告.

1 煤田勘探地质大数据分析

煤田勘探后,需要提交的最终成果主要有煤田勘探地质报告、相应的附图及附表.煤田勘探地质报告是在勘探项目施工结束后,应用附图、附表以及区域地质资料、历年地质报告等多来源大数据基础上,充分挖掘、处理、分析后得到的综合性研究成果.

经过多年煤田勘探发展,目前煤碳系统的勘探地质报告基本上已经形成了统一固定格式.一般其章节固定为:绪论(概况、周边矿井与小窑、以往地质工作、矿山设计开采与利用情况)、核实区地质(区域地区和矿区地质,内容主要为地层、构造、岩浆岩)、煤层与煤质(含煤地层、可采煤层、不可采煤层、煤层对比、煤质物理性质、煤质化学性质、煤质工艺性能、煤质可选性、煤质煤类、煤的工业用途)、煤层气及其他矿产、其他地质条件、资源储量计算和结论七大部分.其中前五章节内容丰富、信息量巨大,是煤田勘探成果的基础资料;后两章节为煤田地质勘探的总结性成果,是前四章的信息浓缩和总结.其中绪论、核实区地质和资源储量计算三章内容主要为定性描述,应用的资料多为非结构性文件和图件,如历年勘探文字报告以及地质地形图、地层综合柱状图、煤岩层对比图、地质剖面图、资源估算图、采掘工程平面图、钻孔综合柱状图等;而煤层煤质、煤层气及其他矿产和其他地质条件三章主要内容为勘探基础数据的统计分析,其应用的参考资料主要为煤田地质勘探过程中整理的附表资料以及应用附表数据绘制的插图,如:钻孔综合成果表、煤质化验测试成果表、储量计算表、岩石力学实验表以及煤层、煤质等值线图、煤层对比图以及储量计算图等.

其中附表资料是煤田勘探报告中最直接的证据,具有历史悠久、数据量巨大、更新速度快、数据关联性高,且数据繁杂,极易出现数据错误等特点.但该部分数据常以结构化电子表格形式或数据库方式存储管理,规律性明显,是最容易实现计算机自动化处理的部分.应用计算机技术分析附表资料,自动寻找海量地质数据中隐含的地质规律以及各种地质信息间的逻辑关系,以规范化的格式自动整理相关煤田地质数据,辅助编写地质报告,将会从根本上提高工作效率,解放生产力,是未来煤田地质勘探技术研究的重要方向.

2 煤田地质勘查数据自动整理的实现

2.1 设计思路

大数据时代煤田地质勘探具有海量数据增加、数据高度共享的特点,实现数据的快速统计、分析,精确快速挖掘信息价值,将分析结果及时沟通、讨论尤为重要.以计算机网络为平台,通过网络数据库的方式可以解决煤田地质勘探基础数据的科学管理问题,实现数据高度共享以及数据的无阻化传输,智能化统计分析煤田地质数据,为地质人员跨越时空协同式工作创造条件.

本文的思路为,以网络终端将煤田地质勘探基础数据(附表资料)按照统一的标准格式上传至数据库服务器,在服务器端自动实现数据的管理、统计、计算、整理,并形成一系列主题数据表格及文字描述,用户在客户端通过网页浏览的方式直接获取分析后的阶段性成果(图1).

图1 煤田地质勘查数据自动整理的实现思路

2.2 实现流程

首先,制定数据标准化格式模板,并整理煤田勘探地质数据,形成电子表格格式文件.主要任务为野外勘探任务结束后,整理勘探区所有地质钻孔的物理数据以及实验室分析化验数据,形成固定格式的附表.如测量成果表、煤层综合成果表、煤质化验成果表、岩石力学成果表、储量计算成果表、水文地质成果表、工程地质成果表等.

工作人员在任意一台电脑终端将Excel格式的附表通过网页方式提交到数据库服务器,服务器自动检查数据格式,若数据格式错误,ASP程序自动修改数据格式或报错,需要修改后提交;若数据格式无误,ASP程序则将附表按指定条件要求导入到指定数据库.如,将钻孔综合成果表(Excel格式)导入到钻孔岩层数据表(数据库表)和钻孔煤层数据表(数据库表)中,将煤质化验成果表(Excel格式)导入到钻孔煤质数据表(数据库表)中,并在下一个网页中用表格显示每个数据表内容.

在网页浏览器中点击下一步,ASP程序自动调用数据库存储过程,计算机语言自动计算复杂数据,如煤层结构中夹矸厚度、采用厚度和自然厚度等,并优化数据存储结构,完善数据标准体系,为数据统计提供科学的数据格式.ASP程序再按照单个钻孔统计测量、煤层、煤质、水文地质、工程地质中各种数据的平均值,如单孔煤层厚度均值,单孔煤层煤质中灰分、挥发分、硫分均值等,最后针对所有钻孔单个煤层分别统计各种需求信息,如煤层厚度最小值、最大值、平均值、统计个数,煤层间距的最小值、最大值、平均值、统计个数,煤质中工业分析、元素组成、发热量等所有数据的最小值、最大值、平均值、统计个数,以及测量、水文地质、工程地质、煤层储量计算等各种数据的统计值.

ASP程序统计完后,自动跳转下一页,在网页上分别以表格和文字方式展示统计后各种结果和相关信息(图2).

图2 煤田地质勘查数据自动整理的实现流程

2.3 数据库设计

煤田地质勘探地质数据入库后,计算机程序自动分析其数据特征,并在数据库服务器端用主、外键标识关键字段,设定约束条件,建立数据库索引,建立各种数据库之间的关系,理清地质数据之间的内在联系,以便于数据之间复杂查询、统计、分析.如钻孔基础信息表、钻孔岩层数据表、钻孔煤层数据表、钻孔测量数据表、钻孔煤质数据表、钻孔工程地质表、钻孔水文地质表之间通过共有字段“钻孔编号”的主、外键建立逻辑关系;而煤层信息表、钻孔煤层数据表和钻孔煤质数据表通过共有字段“煤层编号”主、外键,建立了数据库之间的内在逻辑联系(图3).

图3 煤层煤质数据库关系图

2.4 数据计算、统计等核心技术

2.4.1 计算煤层结构中的自然厚度

在煤层综合成果表中,最重要的一项数据是“煤层结构”,是通过钻孔地质编录和地球物理测井综合分析得到的结果,是煤矿开采最直接的证据.煤层结构均按照特定的格式表述,以便把煤层中的矸石区分出来.如五虎山煤矿10号钻孔中9煤的结构为“0.61(0.20)0.55(0.50)0.77(0.05)0.20(0.05)0.17(0.03)0.47(0.20)1.18”,其中括号内为矸石厚度,括号外为纯煤厚度,所有数据相加为自然厚度,扩号外数据相加为采用厚度,括号内数据相加则为矸石厚度.如麦垛山2分区补充勘探需要分析180个钻孔,每个钻孔有28层煤层,煤层均为复杂组合结构,人工计算其自然厚度或采用厚度将要花费大量的时间,而且极容易出错.通过以下SQL语句,可一次性计算完所有钻孔煤层结构中自然厚度、采用厚度等,且数据准确可靠.其编程思路为:按照数据表中编号顺序取出一条记录中综合结构内容中的字符串,判断该字符串中是否存在“(”:若不包含“(”,则将该字符串转化为数值,赋值给某一个变量(用于记录自然厚度记录),直接替换该记录中自然厚度字段的数值;若包含“(”,则将字符串中“(”之前的数值取出,赋值于该变量(用于记录自然厚度值),再取出字符串中括号内的数值,与之前定义并赋值过的变量相加后再赋值于该变量;然后再判断“)”后的字符内是否包含“(”,若不包含“(”,则将“)”后的字符串取出并转化为数值类型,并与之前赋值的变量相加后再赋值于该变量,若包含“(”,则重复取值、计算、再赋值,直至到达字符串的结尾,用相加后的变量替换该记录中自然厚度字段的记录数值.一条记录操作完成后,循环取出下一条记录,直至记录结束,其过程如以下程序所示.煤层的采用厚度与矸石厚度也可通过类似的程序语言思路来实现.

2.4.2 统计煤层间距

煤层间距也是煤田勘探中的重要数据,是煤层能否开采的决定性因素.人工计算矿区每口井煤层间距工作量巨大,效率低下.通过以下程序快速实现计算33个钻孔590条煤层记录内所有钻孔的9煤层与10煤层的煤层间距.

该程序的思路为:将可采煤层数据库中所有记录按照顶深排序,并在数据库字段中增加一个唯一的标识字段“ID”字段,按照“ID”值的大小顺序取出相邻的两条记录数据,用下一条数据的底深减去上一条记录的底深再减去上一条记录的自然厚度即为两个煤层之间的间距.将所有钻孔中每2个煤层间距计算出结果后并赋值给相邻两条记录中的下一条记录的煤层间距字段记录;再统计所有钻孔间所有9煤与10煤间距离的数值,如最大值、最小值、平均值等.

2.4.3 统计极值与均值

在煤田地质勘探中,需要统计各种地质数据的最大值、最小值、平均值、钻孔统计数等,分析其空间分布规律.特别是煤质分析中,统计项目较多,如原煤和洗煤中灰分、挥发分、硫分、碳含量、氢含量、氧含量、发热量等,各类数据统计工作量巨大.以下程序为所有钻孔中各煤层中原煤灰分统计SQL语句.

select煤层号,min(灰分)as灰分最小值,max(灰分)as灰分最大值,avg(灰分)as灰分平均值,count(*)as灰分总数into原煤灰分统计表from可采煤质数据库where煤层号is not null and灰分is not null and洗选情况=‘原’group by煤层号;

2.4.4 统计数据的表格化、个性化展示及文字报告的形成

在煤田地质勘探报告中,一般会用较大的篇幅用于对勘探数据统计成果的展示和描述.如煤层、煤质统计数据的表格化表示和文字描述,过去通常以人工方式绘制表格,填写表格数据,书写各种统计数字,消耗大量的时间和精力,容易因人为录入出现错误,且数据中错误不易发现.

以ASP语言编写如下程序,自动形成统计表格和文字描述,可以通过网络化实时共享统计成果.编程思路为:在统计各类属性数据的最小值、最大值、平均值后,按照煤层顺序存储在可采煤层钻孔统计表中,再将可采煤层统计表中所有记录按照煤层埋深的最小值排序后取出,并按照固定的格式输出到表格中.一般统计属性数据至少有5条,即煤层编号、最小值、最大值、平均值、统计个数,而属性数据间每3个为1组:即最小值、最大值、平均值,所以编程时,设定可采煤层钻孔统计表中最少有5个字段,每3个字段为一次循环,循环步长值为3,从左向右依次取出字段名称,再循环嵌套取出每条记录中字段的数值或内容,其核心程序如下所示.

<%

set conn=server.CreateObject(“adodb.connection”)

DBPath=Server.MapPath(“五虎山煤矿.mdb”)

sql=“select煤层,min(钻孔煤层自然厚度)as最小钻孔煤层自然厚度,max(钻孔煤层自然厚度)as最大钻孔煤层自然厚度,round(avg(钻孔煤层自然厚度),2)as平均钻孔煤层自然厚度,min(钻孔煤层埋深)as最小钻孔煤层埋深,max(钻孔煤层埋深)as最大钻孔煤层埋深,round(avg(钻孔煤层埋深),2)as平均钻孔煤层埋深,min(钻孔煤层底板标高)as最小标高,max(钻孔煤层底板标高)as最大标高,round(avg(钻孔煤层底板标高),2)as平均标高,round(min(钻孔煤层间距),2)as最小钻孔煤层间距,round(max(钻孔煤层间距),2)as最大钻孔煤层间距,round(avg(钻孔煤层间距),2)as平均钻孔煤层间距,count(煤层)as统计个数into可采煤层统计from可采煤层钻孔统计group by煤层”

2.4.5 成果展示

通过网页数据库方式,在用户客户端网页选择相应的附表文件,如煤层综合成果表、煤质化验成果表、岩石力学成果表(图4)点击上传按钮,将附表文件(Excel形式)上传至数据库服务器中,上传后系统将excel表格文件传输到数据库服务器系统,形成数据库文件,存储于数据表中.在下一个网页选择需要展示统计的附表,网页中点击“统计”按钮(图5),ASP文件自动调用数据库系统中的存储过程,统计各类信息,形成各种统计数据表,在网页中显示统计后的数据表及相关文字内容,如煤层特征统计网页显示(图6)和原煤煤质工业分析网页显示(图7),其他地质数据统计成果也可用类似的方法顺利实现,并可通过互联网实时共享.

图4 附表上传网页界面

图5 附表统计网页界面

图6 煤层特征统计结果显示网页界面

图7 原煤煤质工业分析显示网页界面

3 结论与展望

(1)通过大数据分析,提出了大数据时代智能化煤田地质勘查报告的实现思路和主要工作流程,为辅助煤田地质勘探报告编写提供了创新性的工作思路,可以推广使用.

(2)分析了煤田地质勘探报告中数据计算、统计的核心技术,并用计算机语言得以实现,解决了地质人员长期困惑的繁琐问题,并在实践中应用和验证,提高了工作效率,是一种技术方法的提高.

(3)通过网页数据库的方式,展示了煤田地质勘查数据自动整理的实现模式.该模式解决了地质报告编写中有关数据统计的表格填写和文字描述的复杂问题,解放了地质人员的繁杂劳动,提高了数据的准确性,并实现了数据统计结果的及时共享功能.

(4)本文实现煤田地质勘探对结构化数据的自动整理,但对于非结构化地质数据,如各种等值线图件自动绘制、资源储量的自动计算等问题还需要进一步深入研究,掌握空间数据特征,用计算机实现所有地质信息的描述和展示,将全面实现人工智能地质报告的编制,推动煤田地质勘探、开采工作跨越式发展.

猜你喜欢
煤田煤质数据表
多煤层复杂煤质配煤入选方案的研究
不同分选工段瘦精煤煤质分析与配伍性研究
湖北省新冠肺炎疫情数据表(2.26-3.25)
湖北省新冠肺炎疫情数据表
湖北省新冠肺炎疫情数据表
新疆库拜煤田煤层气多层合采特征煤层探索
声发射监测裂缝技术在沈北煤田煤层气开发的应用分析
煤田地质钻探施工钻机的安全生产管理
煤田地质勘查的危险因素及对策探究
三家企业煤质超标各被罚3万