马 逍
(贵州省水利水电勘测设计研究院有限公司,贵阳 550002)
考虑到水库移民工程的复杂性,工程的具体实施与社会环境和自然资源均有联系[1]。水库移民工程在不同领域涉及的信息类型众多,既包含移民属性数据,又有地理数据、区域设施数据等[2],这些数据对工程推进的顺利程度均有较大影响。为了更好地管理水库移民工程数据,针对空间数据和非空间数据构建可以集中管理的数据库至关重要。文献[3]针对历史数据库建设质量进行研究,生成一种可以控制数据库质量的数据库模型构建方案。基于现代化管理技术,按照数据质量将待管理数据划分为多个层级,以此为依据建立数据库模型。但是,该数据库模型查询效率较低。文献[4]采用HBase管理技术设计一种关系型空间数据库模型,基于传统数据库存储模型,结合HBase转换规则,将空间矢量数据转化为可以被统一管理的数据。按照HBase的反范式化特点,实现对传统数据库模型的优化。但是,该模型管理操作过于复杂。文献[5]结合可视化技术与GIS地理信息系统,建立符合工程数据管理需求的数据库模型。引入日本的数据库模型建设经验,与国内数据库模型设计内容相结合,获取数据库模型具体设计流程。但是,该模型的应用拓展性较差。
本文以水库移民工程数据管理为研究重点,提出以GIS为基础的数据库模型。经过数据处理、数据分类及编码、数据库模型逻辑以及数据库访问机制,完成数据库模型整体设计。以期有效提升数据查询效率,并在水库移民工程推进过程中发挥巨大作用。
考虑到水库移民工程数据的多样性,本文以QuickBird数据为主要数据源,设计数据校正、数据融合相结合的处理方案[6]。
本文采用几何校正的方式进行水库移民工程基础地理数据精度纠正,结合地面控制点坐标与多项式变换方法,明确实际信息与采集信息之间的对应关系[7]。根据水库建设区域的实际环境特点,将几何校正的控制点选在宽度为0.5 m左右的小道。再通过多项式变换方法变换数据的几何位置,具体公式为:
(1)
式中:(a,b)为像点的像平面坐标;(α,β)为像点对应地点的大地坐标;η、μ为多项式系数。
其中,系数可以通过最小二乘法进行计算,而多项式变换过程中系数数量,与阶数的联系可以表示为:
(2)
式中:φ为控制点数量;f为阶数。
基于上述多项式变换方法,在ERDAS 8.7处理软件的作用下完成水库移民工程数据的几何校正,确保每个控制点的残余误差低于0.2。
数据处理后进行融合处理,本文采用IHS变换融合技术,从RGB彩色空间变换角度入手,将数据映射到HS空间内,实现数据融合,这一融合算法主要包括正变换式和反变换式两部分。其中正变换式为:
(3)
(4)
(5)
式中:P为明度;E为色度;S为饱和度;R为红色;G为绿色;B为蓝色;RGB为整个彩色空间;m1、m2为彩色变换中间变量。
以正变换式为基础,将数据融合的反变换公式表示为:
(6)
将水库移民工程涉及的基础地理数据处理完成后,参考实际研究区域的主要地理要素,以村为单位进行数据无缝镶嵌,与其他非空间数据一起,作为后续数据库模型构建的基础。
除上述处理的基础地理数据外,水库移民工程数据库还包括移民属性、土地利用现状等多种数据信息[8]。为了便于数据管理和查询,本文在数据库模型构建过程中,针对所有数据进行分类,将数据库划分为空间数据库、属性数据库两大部分。
其中,空间数据库内的数据信息包括淹没区分析和基础地理位置分析,均包含明显空间位置特征。这部分数据可以在工程推进过程中,作为移民安置规划的设计参考。而属性数据库的设计主要是为了存储移民相关信息[9],按照水库移民工程数据的实际性质,将其划分为移民损失调查表、工程建设表等多个独立统计表。数据具体分类结果见图1。
图1 水库移民工程数据分类图
按照图1所示的水库移民工程数据分类图完成数据分析后,进行数据编码。采用常用的符号,分别表示不同的空间要素,这一过程中需要保证数据编码可以让人们能够统一识别,最直观的编码产物就是数据代码[10]。合理的数据编码体系,可以提升水库移民工程数据库的信息共享效率。实际编码过程中,可以将基础地理数据集、土地利用现状数据集等作为第一级数据分类,而每个子数据集的内容作为第二级数据分类。为了加强数据库模型建立数据库的实际应用效果,将二级数据分类编码信息与其对应的一级数据分类编码应该有所关联,按照这一原则,将整体水库移民工程数据进行连接。
数据库逻辑设计是水库工程数据库模型构建的重要内容,本文从数据库使用者的角度,设计以GIS为基础的数据库模型。针对空间数据的表达内容,通过矢量存储、栅格存储两种方法保存数据信息。其中,基础地理数据和移民专题数据均属于矢量数据,按照分层的组织形式管理这部分数据,并采用合理的对象标识符与相关的损失调查数据进行连接。
本文采用Arc SDE设计一个空间数据库引擎,将水库移民工程数据库分解为多个空间特征要素集。每个特定的要素集内均保存着符合专题内容的二维矢量数据,形成多个要素类。在空间数据库引擎设计过程中,本文融合GIS地理信息系统,根据现实世界到计算机的转换原理,形成GIS数据模型。通过研究可知,GIS数据模型包括概念、逻辑、物理3种数据有机联系层次,见图2。
考虑到当前GIS技术的发展情况,本文设计的数据库模型逻辑不再根据模型层次进行直接操作,而是针对图2所示的层次进行深入分析,生成对象关系型数据库模型。水库移民工程数据库模型设计过程中,在GIS技术的作用下,可以将空间实体转化为相应的空间对象,且空间对象具有点、线、面等某一类公共属性。结合空间知识对象原理,在水库移民工程数据中获取包含信息量最高的领域空间知识。
图2 空间数据模型的3个层次
结合GIS地理信息系统和对象关系概念,生成的工程数据库模型,从领域空间知识应用的方向,设计与对象相关的技术,有效结合点、线、面3种空间概念,将数据分类及编码结果分别保存至对象内部,作为空间对象的内部属性。通过关系模型,完成空间对象的有效扩展,与水库移民工程实际环境相结合,建立符合外部属性管理要求的空间实体要素。在GIS数据库模型逻辑设计过程中,按照关系模型一体化保存的模式,从数据属性入手管理空间数据。本文采用对象最小化原则,从点、线、面3个角度分析,将水库工程数据库保存内容描述为不同类型的空间对象,并针对空间对象进行物理存储。根据数据属性逻辑管理各种数据,除了运用空间关系将空间内部属性封装在对象中外,还可以采用关系模型表达的方式,将土地用途、元数据等外部属性知识,直接附加到空间对象上。根据GIS地理信息系统和空间对象扩展关系,得到空间数据库模型,见图3。
图3 基于GIS的空间数据库模型
依托于GIS地理信息系统生成图3所示的数据库模型,再结合统一管理要求,对数据库进行命名。为了加强数据管理和查询能力,本文根据数据管理要求,利用Geo-digital管理模式建立数据库命名策略,并将该命名策略应用在数据表命名、图层命名等多方面。
深入分析GIS数据库模型逻辑可知,水库移民工程数据信息之间存在较强的关联性,在工程数据库模型实现过程中,需要考虑数据的从属关系,以此为基础建立数据层次关系。之后,利用唯一键和缺省值等约束条件,设计水库移民工程数据统计表,以及工程数据图形属性统计表,并且表与表之间可以实现实时信息变化。从空间数据和属性数据两个角度进行分析,前者以图形数据为主,分析主体数据与属性数据之间的联系,描述水库移民工程数据的特点。而属性数据可以仅仅指代属性表,多个属性表并列、具有从属关系属性表结合形成的链状表也可以被称为属性数据。这一过程中,图形数据和属性数据存在对应关系。
工程涉及数据存储完成后,数据库模型实现的最后一个步骤就是数据查询,本文利用数据库访问机制完成数据读取。根据计算机技术当前发展情况可知,水库移民工程实施过程中,工程规划、信息网络发布以及可视化实现均需要通过访问数据库得以实现。本文采用C/S结构构建数据库模型,便于后续工作过程中数据信息提取。此外,工程数据库模型的实现采用B/S结构作为外部Internet,有利于数据的远程处理和发布。从数据库使用人员的角度来看,数据库读取内容最好都是以对象的形式存在,并且以数据表的形式呈现这部分读取的对象信息。按照上述设计的工程数据库模型读取机器,见图4。
图4 数据访问结构示意图
同时,为了提升用户读取信息的效率,本文设计在图4所示的数据访问结构中添加多个中间层接口。这些中间层接口均由数据库后台人员进行管理,利用中间层接口向用户提供标准的数据内容,便于用户应用数据进行专业工作。根据图4可知,数据库内每个对象都不是独立的,通过字段访问对象表内记录信息,获取所需数据。当访问信息存在其他表格内时,数据库访问机制会反馈给用户指向信息,向用户表明数据获取方式。并且,每个对象表之间都存在联系,总体构成链状数据结构,连接数据库中每一张数据表。
本文以水库移民工程为研究重点,提出基于GIS的数据库模型,为了验证该模型可行性,针对某一水库移民工程建立数据库,并进行数据库模型应用效果分析。
本次实例分析选定的研究区域为广西壮族自治区内红水河流域。据调查,该流域每年年径流量在517×108m3左右,是水力资源最丰富的区域之一。随着区域内水电站建设数量的不断增加,水电水库必然会导致区域内居民生活受到淹没,急需开展水库移民工程。根据本文提出的数据库模型,在GIS技术的作用下采集红水河流域空间信息,并建立空间数据库,作为移民规划的基础。红水河流域具体情况见图5。
图5 红水河流域概况图
红水河流域内修建的水库位于龙滩水电站附近,总库容达到162.1×108m3,且年平均发电量为156.7×108kW·h。该水库修建完成后,可以充当红水河流域的骨干工程,兼具发电、航运等多种功能。经过计算可知,该水库工程的建立会导致龙滩水电站附近约4 000 km2的面积受到淹没,影响11个县人民群众的生产生活。为了确保水库移民工程的顺利进行,需要对该区域的土地利用情况、移民属性等多种数据进行清查,合理转化为GIS数据并保存在数据库内,有利于指导后续移民工作的进行。
水库移民工程数据库模型的应用,需要基于GIS采集的空间信息来建立,转化为符合工程要求的数据库。首先,针对采集和处理完成的空间数据进行验收,将合格的数据分类保存至不同的空间数据库内。这一过程中,为了便于后续数据查询和调取,以乡为单位设置独立的要素数据集,并对每个村划分要素图层,数据集的属性字段设置见表1。
表1 要素图层属性字段设置表
数据库的设计是为了支持水库移民工程决策的实现,对采集数据进行分类组织编码后,本文提出的GIS空间数据库模型设计逻辑,生成红水河流域水库移民工程数据库。应用模型得到的数据库实际显示界面见图6。
图6 数据库显示界面
图6中,工程数据库内包含村组、乡镇、安置点、主要公路以及库区设施等多种相关数据,可以通过点击的方式获取水库移民所需的数据,并在页面下方获取坐标信息。红水河流域水库移民数据库的建立,充分表明了本文设计模型的可行性。
为了更好地展现本文所提出模型的优越性,采用常规工程数据库模型建立原始数据库,以基础地理数据、土地利用现状数据以及移民属性数据为测试用例,对比两种模型构建的数据库的数据查询性能。其中,红水河流域水库移民工程所涉及的基础地理数据包括50多万条,土地利用现状数据包括3万多条,而移民属性数据高达400万条。针对上述数据发送查询口令,查询响应时间见图7。
图7 数据查询响应时间对比图
从图7可以看出,本文设计模型生成的数据库在实际应用过程中,查询响应时间远远低于原始数据库,从原始的9、4.9、2.2 s降低至2.9、2与0.8 s。实例分析结果表明,本文提出的水库移民工程数据库模型在实际应用中,数据查询响应时间降低63.53%,提升了数据库查询效率。
由于水库移民工程涉及多种类型的数据,工程数据库的设计是不可或缺的内容。本文采用GIS技术构建了一种新的数据库模型,依托于GIS技术加强对工程数据库的管理与维护。根据实际工程应用结果可以发现,按照模型要求生成数据库,完成了数据的有效存储和提取,数据查询响应时间大大缩短。