刘润虎
(神东煤炭集团大柳塔煤矿,陕西 榆林 719315)
传统简单粗犷的勘探和开采方法已经不能满足新形势的要求。从矿业开发公司的需求开始,迫切需要一种新的有效的矿业勘探和开发方法。在激烈竞争的矿业环境中,更加重视数据挖掘技术在矿山勘探和开采中的应用。国家所需的矿产资源无论是数量还是种类都大大增加,促进了中国矿业公司的快速发展。在矿业公司快速发展的过程中,如何提高矿山的生产效率和改善矿山生产环境的安全性能是当前各勘采公司重点研究的课题。在解决矿山安全问题的过程中,矿业公司引进了大量先进设备和技术人才,不仅提高了矿山的生产效率,而且有效减少了煤矿安全事故的发生。但是,对于他们来说,引进先进的设备和技术人才还不够,需要有一种数据技术作为强有力的分析手段。
首先,数据挖掘技术在矿勘探业是一个新的概念。数据挖掘技术的基础和核心是从大量数据资源中挖掘关键有效数据,从而为决策提供准确的数据基础。数据挖掘技术基本上是数据分析技术或数据库管理技术。它具有广泛的应用范围,并且可以在几乎任何行业的不同层次上应用,我们专注于数据挖掘技术在采矿勘探和开采中的应用。挖掘勘探和挖掘过程会生成大量物理数据,这些数据包括来自采矿各个方面的数据,包括地质,蓄水,矿山岩性特征等。这些数据构成了一个巨大的采矿勘探数据库,这对矿山勘探和采前安全性评估计算很有用,以便制定各种勘探和采矿计划的依据。严格的采矿勘探和采矿决策过程应基于这个庞大的数据库,但是如何在该数据库的海量信息中找到最重要的数据,或者如何在此数据管理中找到最有效的管理,这也可以确保高效,准确的决策。数据挖掘技术实际上是为满足这些环境要求而生产的,尤其是矿山勘探和采矿应用。例如,在矿山勘探项目的过程中,难以做出正确的决定,因为各种勘探数据非常复杂,决策者难以一一分析和计数这些数据。对于采矿勘探和采矿人员而言,执行此类数据分析也是一项艰巨的任务,如果某些关键数据未正确识别,或是收集到的数据不够准确导致整个勘探和采矿计划失效甚至出现安全问题,导致重大的人员和经济损失。在这种情况下,使用数据挖掘技术是一个很好的选择,借助数据挖掘技术,可以从这些海量数据中找到关键数据。决策者可以根据这些关键数据做出决策,也可以根据这些关键数据创建完整的勘探和开采计划。
信息收集:根据确定的数据分析对象,汇总数据分析所需的特征信息,然后选择适当的信息收集方法,并将收集的信息存储在数据库中。对于大数据,选择合适的数据仓库进行数据存储和管理至关重要。数据集成:逻辑上或物理上集中来自不同来源,格式和特征的数据,以为公司提供全面的数据交换。数据规范:即使是少量数据,大多数数据挖掘算法也需要很长时间才能运行,并且在挖掘业务运营数据时,数据量通常非常大。可以使用数据缩减技术来获取数据集的规范表示,该数据集虽然要小得多,但仍接近保持原始数据的完整性,并且可以将数据挖掘后的数据挖掘出来,规格与之前的结果相同或几乎相同。数据清理:数据库中的某些缺少属性值造成数据不完整和不一致,因此,必须进行数据清理以在数据仓库中存储完整,正确和一致的数据信息。数据转换:通过无缝的数据聚合,泛化和标准化,将数据转换为适合数据挖掘的格式[1]。对于某些实数数据,通过分层概念和数据离散化转换数据也是重要的一步。数据挖掘过程:根据数据仓库中的数据信息,选择适当的分析工具,应用统计方法,基于案例的推理,决策树,基于规则的推理,遗传算法来处理信息并获得有用的信息分析。模型评估:从业务角度来看,行业专家验证数据挖掘结果的准确性。
遗传算法:遗传算法是一种基于自然生物学选择和遗传机制的随机搜索算法。具有隐式并行性,与其他模型的轻松集成以及遗传算法的其他特性使它可用于数据挖掘。国外基于遗传算法的数据挖掘工具,利用该工具对两次空难的实际数据库进行了数据挖掘实验,结果表明,遗传算法是一种有效的方法用于数据信息挖掘。遗传算法的应用还体现在与神经网络,近似集成等技术的结合中。例如,遗传算法用于优化神经网络的结构,并在不增加错误率的情况下删除了冗余连接和隐藏驱动器,利用遗传算法对神经网络进行训练,然后从网络中提取规则。然而,遗传算法的算法较为复杂,尚未解决局部极小值的早期收敛问题。决策树方法:决策树是预测建模中常用的算法,可以通过有意对大量数据进行分类来找到有价值的潜在信息。它的主要优点是描述简单,排序速度快,特别适合于大规模数据处理。最早,最有影响力的决策树方法是quinlan 提出的众所周知的基于信息的id3算法。它的主要问题是非增量学习算法;决策树id3 是单变量决策树,很难表达复杂的概念。同性之间的关系不够重视。针对上述问题,出现了许多改进的算法。统计分析方法:在数据库字段项目之间具有两种关系:可以由函数公式表示的确定性功能关系和不能由公式的公式表示关联关系函数,但仍然是相关的确定性关系。可以使用统计方法进行分析,即使用统计原理来分析数据库中的信息。常用统计量在大量数据中查找最大值,最小值,和,平均值等,回归分析使用回归方程式表示变量之间的定量关系,相关分析使用相关系数进行度量变量之间的相关性,差异分析从样本统计值确定通用参数之间是否存在差异等。
(1)建立数据模型。在数据挖掘技术的采矿勘探和应用过程中,要做的第一件事是对采矿勘探准备和采矿过程中的各种数据进行统计汇总,然后根据数据挖掘技术的数据处理方法将这些数据构建为采矿数据模型,该模型成为整个矿山勘探和开发的重要指南。在数据模型中,可以找到来自采矿勘探和采矿过程的关键数据,例如地质结构,水流走向,土质和岩石特性。还可以分析和处理这些关键数据,并对其他挖掘数据模型以找到相关数据并进行模型预测。这个预测也是采矿勘探和采矿中非常重要的部分,挖掘数据模型的构建不仅必不可少,而且对于勘探团队来说是迫切需要的。必须总结过去采矿勘探和采矿过程中生成的数据,建立相应的数据模型,并为主要矿山建立相应的模型,将这些挖掘数据模型组合到资源数据库中进行分析和管理可以为将来的挖掘探索和开发提供重要的数据库,尤其是在数据模型预测方面,这些数据模型起着重要作用[2]。例如,矿床的结构和矿物的相关特性,对这些数据的分析和预测主要依靠历史勘探和采矿数据。分析这些数据的最直观,有效和准确的方法是建立该数据模型。从某种意义上讲,可以说采矿数据模型的质量与采矿勘探和采矿业务直接相关。
(2)优化并利用数据挖掘技术指导勘采。在矿山勘探和开采中的重要应用角色是优化目标并指导勘探和采矿工作,这也是数据挖掘技术在矿山勘探和采矿应用中的价值的体现。数据挖掘技术可以为矿山勘探和开采过程提供关键的数据指导。该数据指南嵌入在很多方面,并在整个矿山勘探和采矿过程中实施。因为矿山勘探和开采中的数据不是静态的,而是随着时间的变化而动态变化的,例如天气,水流量和其他变化因素,并且随着勘探和开采过程中变动。采矿中,一些新的地质数据会不断更新。在这类数据的动态变化中,如果按照既定的勘探和开采计划进行勘探和开采工作,无疑是跟不上节奏,引入岔路。因此,使用数据挖掘技术来优化整个勘探和采矿过程尤为重要。同样,在此优化过程中,动态数据模型可以发挥非常重要的作用。数据挖掘技术最优化和指导矿物勘探与开采过程最重要的是如何充分利用现有的矿山数据库。该数据库的数据源是在矿物勘探和开采过程中获得的,并且正在逐步跟随变化因素通过计算机采集并不断更新实时状态,该数据库也来自其他相关矿山的数据库。使用数据挖掘技术来管理和分析这些数据库并制定最佳目标计划,对于确保顺利进行矿山勘探和开采具有重要作用。
作为一种全新的数据管理和分析技术,数据挖掘技术已广泛应用于金融,审计和其他高度依赖数据的行业,但它仍然是矿产勘探领域的新兴者。矿山勘探与开发是传统的资源领域,缺乏对数据挖掘技术的重视是阻碍数据挖掘技术在勘探与开发中应用的最重要因素。从一些调查数据中我们还可以知道,在当前的中国采矿和矿物勘探领域中,数据挖掘技术的应用凤毛麟角。主要原因是人们没有认识到数据挖掘技术在矿物勘探和采矿领域带来的应用价值,没有足够的关注。为了提高矿物勘探和采矿中的数据挖掘技术的应用,采矿和矿物勘探公司必须自觉地增加对新技术的了解和关注。这项新技术绝不仅仅指机械设备中的新技术,作为一种高效的数据管理和分析新技术,数据挖掘技术可以在采矿勘探和采矿数据管理中发挥至关重要的作用,并且对于确保对勘探的顺利进行至关重要。矿业勘探和开采公司应建立独立的数据管理部门,促进数据挖掘技术的应用,并与相应的由专职人员组成的部门一起确保数据挖掘技术的实施,制定数据挖掘技术导向计划。决策者还必须仔细采用数据挖掘技术提供的数据建议,以做出正确的决策。
在现代勘探和采矿中,多种学科和技术的应用被集成在一起,不仅是设备中的新技术,还包括数据挖掘等其他方面的新技术。矿山勘探和开采是另一个将进行大量数据分析工作的领域。这些数据管理和分析工作将极大地影响矿山勘探和采矿工程的运营。另一方面,在我国采矿资源日益紧张的情况下,数据挖掘技术的应用对于确保高效合理的开采和保护采矿资源也具有重要意义。尽管中国当前的采矿勘探和采矿领域对数据挖掘技术还没有给予足够的重视,但在不久的将来,这种现象肯定会得到改善,数据挖掘技术也将在勘探和采矿中得到更广泛的应用。