李晓敏,李晶河北省地质调查院
浅析地质数据仓库的特点及数据组织
李晓敏,李晶
河北省地质调查院
摘要:在我国地质行业的不断发展中,研究人员获得了大量有价值的地质数据。有效地对海量数据进行存储、管理和利用,是提升地质行业发展速度和水平的关键。因此,有必要建立强大的数据仓库管理系统,来更好地对地质数据进行管理。本文对地质数据仓库的特点以及数据组织进行了具体分析,希望对我国地质行业的快速发展有所帮助。
关键词:地质数据仓库;特点;数据组织
数据仓库指的是集成的、面向主题的、反映历史变化的数据集合,是一种对海量数据进行管理和分析的技术,具有能方便研究人员存取相关数据信息以及对当下问题作出科学决策的作用。从类型上,数据仓库可分为属性数据库、多媒体数据库以及空间数据库等三种。地质数据仓库的建立,极大地方便了地质工作者对地质资料的管理,它通过友好的界面和便捷的操作流程为广大行业人员的研究工作提供了有力支持。
2.1空间性特点
根据目前的地质资料所建立的地质数据仓库,具有较为明显的空间性的特点。在数据信息的收集过程中,工作人员通常选取的都是静态的、描述性的数据信息,这些信息在一段时间内可被认为是不随时间变化的。同时,这些数据信息所构造的整体在整个空间都有分布,通过立体三维方式来展现地质情况。因此,地质数据仓库在构建时,要注意考虑空间方面的特点,从而更好的展现数据信息的内在联系,从而构造清晰明了的数据体系。
2.2非永久性特点
地质数据并不像大多数据那样具有永久不变的特点。地质情况随着时间的累积,处在不断变化之中,变化速度也有长有短。一般情况下,实际数据信息的变化速度较慢,往往几年或几十年才会发生显著改变,且质变发生时其特征不容易被人们捕获,因此,有必要在一定期限内对数据进行重新调查和录入,及时用新信息替代已失效信息,从而保证相关人员在使用数据库时得到真实有效的数据。
2.3类型复杂的特点
地质仓库数据由于包含声音、图像、原始信号以及其他各种类型的信息,只是用整型、实型、字符型等简单的数据类型已无法对所有地质资料数据进行描述,个别情况下甚至需要设立专门的表示方法和手段,包括使用技术上的处理等方式。面对海量的数据再加上其种类繁多复杂,使得地质数据仓库的建设人员有必要采用跨学科跨行业的新技术手段来完成这一棘手的工作。唯有创新数据的管理方式,根据数据类型及使用特点有针对性的建立地质数据仓库,才能使其真正地发挥作用。
2.4集成性特点
地质数据仓库在结构上采用的是集成的方式,与一般数据库类似,该种方式可极大地提升数据的管理和存取效率,将分散的数据进行集成管理,从而使工作更加系统和科学。同时,这种方式还能将数据内部的联系显露出来,方便研究人员对数据的控制和存取。总而言之,集成性特点大大简化了地质数据仓库的结构,而且很好地解决了地质资料数量众多和种类繁杂的特点,对数据库作用的发挥具有很大意义。
2.5多源性特点
地质数据仓库中的数据来源十分广泛,主要包括了工程地质、水文地质、地震地质、地质灾害、地质环境以及地质资源等众多类别。数据库的多源性给数据系统的建设和管理带来很大挑战,又由于数据的离散性较大,造成了数据异构的现象,形成了较多的信息“孤岛”,为数据信息的管理者带来不小麻烦,也对研究人员进行信息提取和分发共享等工作带来困扰。因此,有必要建立一定的行业标准,对各种数据源进行合理规范,使其成为标准、统一的数据源,从而使地质数据仓库更加方便的被使用和管理。
2.6多层次特点
一个结构完整功能完善的地质数据仓库其框架必然至少包括以下几个层次:1、存储层。该层的作用主要是对海量的地质资料数据进行存储,采用面向主题的方式进行分类,而这一层次又可细分为三部分:元数据、公用库和数据集市。数据集市是以某一内容作为主题的部分数据的集合,它是数据存储的主体;公用库由方法库、模型库和代码库等组成;元数据则是最基本的数据信息。2、分析层。通过对存储层的数据进行分析,从而使研究人员获取所需的信息,在具体运作时一般都会采用数据挖掘技术和多维分析工具作为分析手段。3、表达层。该层的作用是将分析层的结果转化为研究人员能够直接理解的类型并显示出来。
3.1数据组织结构
地质数据仓库的数据组织结构与一般数据库不同,主要体现在如下几点:1、数据的流向有差异。在一般的数据库中,各层都能直接接受外界的数据,而在地质数据仓库中,只有部分结构能接受外界的数据,并且其它结构的数据也只能由这一部分得来,这就在一定程度上使地质数据仓库具有很大的局限性,且数据的更新变得复杂和繁琐;2、度量参数的选择不同。一般数据库都是选择时间作为相关数据的度量参数,而在地质数据仓库中,需要用空间作为度量参数方能全面系统的对数据进行管理和描述,这在一定程度上增加了数据仓库建设的复杂程度,给相关人员带来一定难度;3、可更新属性有差异。地质数据仓库的数据是可以更新的,这也是实际情况的要求,因为外在环境处在不断变化之中,而数据若没有及时更新,会产生因失效导致的研究工作出现差错等问题。同时,数据的更新还具有整体性,即对于基层数据的修改也会影响到上层数据,最后全体数据都可能因此发生变动,这也是数据在改动时需要注意的地方。
3.2粒度与分割
一般数据库与地质数据仓库在关于粒度的概念上并没有多大差异,表示的都是对数据综合程度的度量或采样率的高低。而分割则是将数据进行分散,通过与各自的物理单元相配合,提升数据的处理效率,而在地质数据的物理组织上,则采用空间尺寸来作为分割标准。
地质数据仓库对于地质行业的发展具有重大意义,建立和完善地质数据仓库系统不仅能使海量地质资料信息得到更加有效的管理,方便研究人员的工作,还能促使人们发现数据之间的潜在联系,从更加立体的角度来看待实际地质情况。本文对地质数据仓库的特点进行了仔细分析,并客观详细地说明了其内部的数据组织形式,为相关研究人员提供了一定帮助。
参考文献:
[1]王珊.数据仓库技术与联系分析处理[J].科学出版社,2013.
[2]屠跃明.数字档案信息融汇服务系统的研究与实践[J].档案学研究,2014,(4):65-70.
[3]张红军,李亚芬,周小林.大型数据库应用系统中基于角色的权限管理方案[J].现代计算机,2014,(5).