吴 楠
(陕西学前师范学院计算机科学与技术系,陕西 西安 710100)
随着计算机技术及网络技术的发展,传统的测量技术和手段得到了飞跃式的进步,城市海量数据的采集和处理技术也趋于成熟,使得数字化、信息化的城市管理成为可能。随着社会的进步和发展,城市的信息化水平已成为衡量一个国家现代化程度、综合国力及经济增长潜力的重要标志。从广义上讲,“数字城市”指的是建立一个城市信息模型,将城市的每一角落的信息都收集、整理、归纳,按照地理坐标建立完整的信息模型,用网络联结起来,使城市管理部门可以快速、完整、形象地了解城市宏观和微观的各种情况。从具体内容看,“数字城市”是基于3S(GIS,GPS,RS)等关键技术,建设服务于城市规划、城市建设和城市管理的可持续发展的信息基础设施和应用体系[1]。
数字化城市管理是一种城市管理新模式,通常有2种管理方法[2],即“万米单元网格城市管理法”和“城市部件管理法”。在这种新的城市管理模式中,它把城市管理涉及到的对象分为城市部件和城市事件2大类,通过地理编码技术,将城市部件按照城市坐标进行准确定位;采用计算机技术,将城市事件[3-9](如:城市秩序、市容市貌、市政公用、环境卫生等)进行实时监控。数字化城市部件信息管理系统充分运用 GIS技术和网络技术,将城市的空间信息与属性信息处理完美地结合起来,以直观的方式显示所有固定目标的位置和状态,并直接在地图上对受控目标进行管理。数字化城市部件信息管理系统的开发对城市市政的各项管理提供了很大的方便,可为城市创造可观的社会效益和经济效益,有效提升城市的信息化和现代化水平。数据库技术是数字化城市部件信息管理系统中的核心技术之一,它对该系统各种功能的实现、实时高效运行起着至关重要的作用。文中重点研究了数字化城市部件信息管理系统中的数据库设计技术。
空间数据结构是能够适合于计算机存储、管理、处理的空间数据逻辑结构。也就是空间数据在计算机中存储和处理的形式。它可以分为矢量数据结构和栅格数据结构2种。
矢量数据结构是通过记录空间对象的坐标及空间关系来表达空间对象的几何位置。在计算机中,使用矢量数据具有存储量小、数据精度高、数据结构严密、图形输出精美、描述空间关系完整等特点。使用矢量数据,除了能够表达实体的属性外,还能够方便的记录每个目标具体属性信息数据项之间拓扑关系,并可从点坐标链中提取某些特征。其主要缺点是数据编辑、更新和处理软件较复杂。
栅格数据结构是按网格单元的行与列排列、具有不同灰度或颜色的阵列数据。它是用大小相等、分布均匀、紧密相连的像元(网格单元)阵列来表示空间地物或现象分布的数据组织,每个地表与一个像元相对应,因此栅格的大小与地表相应单元的大小之比就是栅格数据的比例尺。它所表示的实体位置隐含在栅格行列位置中。在栅格数据结构中,用一个栅格像元来表示点实体,用一定方向上连接成串的相邻栅格像元表示线实体,用具有相同属性的相邻栅格像元的块集合来表示面实体(或区域),它是最简单、最直观的空间数据结构。因此,这种结构算法简单、易于实现、便于扩充、易于修改、直观性强。
空间数据管理通常分为文件结构型数据管理模式、混合结构数据管理模式和全关系型数据库管理模式。
1.2.1 文件结构型数据管理模式
文件结构型数据管理模式如图1所示,其数据是通过一定格式的属性文件和图形文件组织的,图形要素和属性记录之间通过标示字段进行关联。这种模式的最大优点是技术实现容易、系统结构简单;缺点是对于大型的GIS,它的数据管理和更新困难,信息利用效率不高。
1.2.2 混合结构数据管理模式
混合结构数据管理模式如图2所示。图形数据文件通过图形处理系统给GIS软件平台提供数据,属性数据通过数据库管理系统(DBMS)进行管理。与以文本数值型数据为主的OA/MIS实现集成管理方便;但由于这种方式仍是以文件形式进行空间数据管理,只是对文件形式进行了一定的改进,几何图形数据与属性数据是通过关键字ID进行关联,因此在进行组织、管理和检索时还是独立地进行。
1.2.3 全关系型数据库管理模式
全关系型数据库管理模式如图3所示。这种方式将空间数据与属性数据统一用现有的关系型数据库来管理,通过数据库引擎(ArcSDE)和数据库接口将空间数据和属性数据实现无缝管理。这种模式的最大优点是提供了一致的访问接口(SQL)以操作分布的海量数据,并支持多用户并发访问、安全性控制和一致性检查,它是目前大型GIS中的主流数据管理模式[10]。其缺点是由于空间数据不定长,会造成空间数据存储效率低。
图1 文件结构型数据管理模式Fig.1 Data management mode of file structure
图2 混合结构型数据管理模式Fig.2 Data management mode of hybrid structure
图3 全关系型数据库管理模式Fig.3 Management mode of relational database
空间数据引擎(ArcSDE)技术是用来解决如何在关系数据库中存储空间数据,建立空间数据服务器的方法。ArcSDE是ArcGIS与关系型数据库(RDB)之间的GIS通道,允许用户在多种数据管理系统中管理地理信息,并使所有的ArcGIS应用程序都能够使用这些数据。
ArcSDE是一个多层体系结构,它的数据存储和提取由底端的存储层实现,数据的整合和数据处理功能则由高端的应用层(ArcGIS)提供。ArcSDE能够用于高效索引、存储和访问在DBMS中的各种空间数据。ArcSDE主要特性:①具有开放的、完备的、通用的数据模型;②全面支持Oracle,Microsoft SQL Serve等多种类型的数据库;③能够支持海量数据的网络化管理;④具有强大的数据安全性和多用户性控制。
1.4.1 Geodatabase 模型
Geodatabase是建立在RDB上的一种现代地理信息数据模型,它为ArcGIS管理和使用地理数据提供了管理框架和数据接口。其中还定义了空间数据管理的方式,如数据类型、显示、访问、存储、管理和处理的方法等[11]。
Geodatabase是一个多层结构体系(应用程序层和存储层),使用Geodatabase对地理数据集进行管理的过程就是现在GIS软件和一般关系型数据库管理系统(RDBMS)软件之间的数据共享。RDBMS用来完成计算机物理层面上的磁盘存储、逻辑层面上的属性定义、应用层面上的数据查询及多用户的事务处理等基本工作。而GIS应用程序的功能则是表现地理数据,如数据完整性和数据处理结果等[9]。
1.4.2 空间数据库
空间数据库是指在RDB内部对地理信息进行物理存储,并允许多个用户同时访问的共享数据库。空间数据库技术是用来解决存储在RDB中的空间数据与应用程序之间的数据接口问题。Arc-GIS通过ArcSDE来管理和应用GeoDatabase数据。ArcSDE是一个基于RDB的地理数据库服务器,它允许向数据库中加入空间数据,提供地理要素的空间位置及形状等信息。RDBMS服务器与ArcSDE服务器协同工作来存取空间数据,RDBMS以关系表的形式提供物理存储,ArcSDE解释这些表的内容供GIS使用。由于ArcSDE采用的是C/S体系结构,所以众多用户可以同时并发访问和操作同一数据[3]。
1.4.3 空间数据库的主要特征
空间数据库与一般数据库相比,具有以下空间关系特征、空间分布特征、海量性特征和分类编码等特征。
文中空间数据库和属性数据库设计遵循以下原则。
1)数据的共享性:数据库中的数据应满足多用户和多任务的信息共享,因为在信息系统中相当多的数据是面向系统的多用户和多应用的;
2)数据的独立性:在数据库中数据存储结构发生变化时,尽量保持应用程序不变;
3)数据的完整性:数据库应具有完整性控制功能,以保证数据的有效性、正确性和一致性;
4)数据的安全性:为了防止数据的非法访问,数据库应具有安全性控制功能。
文中所涉及的主要是栅格型空间数据,它包括城市的基础数据、网格数据和地理编码数据。下面分别介绍3种数据的建立机制。
2.2.1 城市基础数据
城市基础数据指建筑物、道路面、绿地、水系等,它主要包括基础地图数据、专题数据和航空正射影像数据。将所有数据进行加工及相应的格式转换后导入地理数据库Geodatabase中[4]。
2.2.2 城市网格数据
网格数据指单元网格、街道、社区、行政区等。本系统从城市管理的实际出发,在搜集有关社区、街道、行政区资料基础上,构建该地区的“万米单元网格”。城市网格数据建立机制如下[5-6]
1)万米单元网格编码。万米单元网格编码结构如图4所示。单元网格编码由14位数字组成,依次为:2位单元网格顺序码、3位社区代码、3位街道(镇)代码和6位县级及以上行政区划代码。根据编码可以对单元网格的具体归属、所在位置进行唯一确定。
图4 万米单元网格编码结构Fig.4 Code strature of thousand meter unitgrid
2)万米单元网格划分。万米单元网格划分主要是以现有的街道办事处所辖范围、社区居委会所辖范围、全区道路、院落等图层为背景,按照民政部门核准的社区边界线,根据当地最新修测的地形图(1∶500)进行补充,进行万米单元网格图的划分和绘制。
3)地理编码数据。考虑到不同数据涵盖的空间范围和地理编码数据的特点,文中以专题的形式分层次进行管理,设计了一套完整的数据库快速索引机制来保证地址编码和地理坐标的快速匹配。
第一,地址匹配索引机制的建立。地址匹配索引包括主索引和分类索引。其中主索引保证了整个城市地理编码数据的唯一性。地址匹配索引机制的建立,能够加快数据库的查询和响应速度。
第二,空间索引机制的建立。地理编码数据库将城区按照不同的空间范围划分为不同等级,如:万米单元网格→社区→街道办事处→城区等4个层级管理空间。对地理编码库中的任意地物建立起对应的空间网格索引,从而使系统可以快速定位到某一网格下所有地理编码信息。利用四级管理空间建立起的空间网格索引机制,大大加快了地理编码搜索引擎的搜索效率。
第三,空间数据的采集。针对万米单元网格中地理对象多、索引数据存储量大这一实际情况,对万米单元网格再进一步细分,通过对以下2类数据进行参照的办法来解决数据冗余和搜索速度的问题。①门址数据(门牌地址和楼牌地址)是城市管理中常用的地址信息,广泛应用于邮政投递等工作。门址数据采集工作主要用调绘的方式来完成,并以信息点的方式录入到计算机中;②地址兴趣点数据是城市管理中人们感兴趣和具有标志性意义的地址信息:地址兴趣点共分17类,包括单位、宾馆、医院、加油站等。采集工作同样是人工现场调查,将地址兴趣点信息采集并标定到1∶500地图上,并以点的方式录入到计算机中。
城市部件属性数据库用来描述实体的属性和说明数据,它以SQLsever数据库统一管理,以表为基本存储单位,其中包括部件属性信息表和地理编码数据表。
属性数据库建立通常包含以下几步:对部件属性数据进行分类、部件数据加工、数据校核、数据录入。
2.3.1 部件属性数据分类整理
按照中国城镇建设行业标准,对城市部件进行分类、编码和属性信息赋值。
1)部件的分类。城市部件(部分)按以下内容分类:①公用设施类主要包括各种检查井盖(水、电、气、暖)及相关公用设施等;②道路交通类主要包括公交站、交通标志、停车场等;③园林绿化类:主要包括名木、古树、雕塑、绿地等;④其它设施类:主要包括市容环境类、房屋土地类等。
其中,公共设施类部分代码与符号见表1.
表1 公共设施类部分代码与符号表Tab.1 Part of the code and the symbol table in public facilities
2)部件的编码。部件编码由10位数字组成,依次为:2位小类代码、2位大类代码和6位县级及以上行政区划代码。部件编码结构如图5所示。
图5 部件编码结构Fig.5 Component code structure
其中:小类代码为2位,表示部件小类,从01~99由小到大顺序编码。大类代码为2位,表示部件大类,01~07分别表示公用设施类、道路交通类等。县级及以上行政区划代码为6位,按照国标进行编码。
3)部件属性的信息赋值。部件基本属性字段数据结构见表2,其结构为:部件代码+流水号(000001~999999),表示部件定位标图顺序号,依照部件定位标图由小到大顺序编码。如:陕西省西安市雁塔区小寨东路与翠华路十字西北角某电力井盖,按照上述编码规则,雁塔区的行政区划代码为110101,大类代码为01,小类代码为05,其普查测绘和标图定位的顺序为1739,流水号为001739,则该电力井盖的编码为1101010105001739.
表2 部件基本属性字段数据结构表Tab.2 Bacic attributes of components field data structure table
2.3.2 部件数据加工
部件数据加工是将已有的部件数据加工描述为带属性的地理编码数据,它包括管理部门描述、位置描述和网格编码等数据描述。部件数据加工流程如图6(a)(b)(c)所示。
图6 部件数据加工流程Fig.6 Flow of parts data processing
2.3.3 数据校验
城市部件数据在入库之前,必须对数据进行校验和纠正。对采集完成的数据进行字段非空检查、录入代码正确性检查、图属一致性检查、标识码唯一性检查等,直到数据满足规范要求。数据校验步骤如下
1)按照相关标准确定检查项:数据几何精度和拓扑检查、属性数据完整性和正确性检查、图形和属性数据一致性检查等;
2)按照上述检查项确定检查内容并配置相应的参数;
3)采用系统自动批量检查与人机交互方式检查相结合的方式对上述内容进行检查,并及时修正检查中发现的错误;
4)编写检查报告。
2.3.4 数据入库
在完成数据分类及校核后,对检查合格的数据方可入库。将属性数据采用人工手动键盘逐条录入到创建好的表文件中。
随着中国城市建设的迅速发展和城市规模的不断扩大,充分利用地理信息系统技术对城市部件信息进行管理和分析,可以有效保证城市管理的高效性和科学性,城市部件管理的信息化和科学化具有重要意义。文中着重探讨了基于城市部件管理系统下数据库的设计方法,分别就数据库建设过程中空间数据库和属性数据库2大部分进行了详细研究,设计给出了一套对应于城市部件的数据库设计方案,完成了空间数据和属性数据的各级汇总、加工、校验和入库,为城市部件管理决策提供了实时、有效的信息,具有较高的工程实用价值。
References
[1]邱春霞,赵征远.CAD数据与MAPGIS数据格式共享研究[J].西安科技大学学报,2011,31(2):188 -193.QIU Chun-xia,ZHAO Zheng-yuan.Sharing data with CAD data formats MAPGIS[J].Journal of Xi’an University of Science and Technology,2011,31(2):188 -193.
[2]杨 瑾,马耀峰.GIS在数字旅游中的应用研究[J].西安科技大学学报,2007(3):502-506.YANG Jin,MA Yao-feng.Application of GIS in digital tourism[J].Journal of Xi’an University of Science and Technology,2007(3):502 -506.
[3]孙友仓,宋彩利,李润洲.一种基于Web Service的异构数据集成中间件[J].西安科技大学学报,2007(2):284-287.SUN You-cang,Song Cai-li,Li Run-zhou.A middleware of heterogeneous data integration based on Web Service[J].Journal of Xi’an University of Science and Technology,2007(2):284 -287.
[4]孟祥飞,王 卫.ArcGIS数据与Corel Draw数据的转换方法研究[J].测绘科学,2009(3):181-182.MENG Xiang-fei,WANG Wei.ArcGIS data conversion method and data research Corel Draw[J].Science of Surveying and Mapping,2009(3):181 -182.
[5]刘洪江,曹玉香,张长荣,等.杭州市数字城管城市部件数据采集方案研究与实现[J].城市勘测,2008(2):17 -19,22.LIU Hong-jiang,CAO Yu-xiang,ZHANG Chang-rong,et al.Research and implementation of digital urban management in Hangzhou city parts data acquisition program[J].City Survey,2008(2):17 -19,22.
[6]徐狄军,周灵勇,井发明,等.宁波市“数字城管”数据普查与建库方案研究与实现[J].城市勘测,2009(4):6-9.XU Di-jun,ZHOU Ling-yong,JING Fa-ming,et al.Ningbo City“digital city”and building a database of census data research program[J].City Survey,2009(4):6 -9.
[7]杨瑞霞,王韩波,张 莉.数字化城市管理一体化数据建设研究——以郑州市为例[J].地球信息科学学报,2010(2):2214-2219.YANG Rui-xia,WANG Han-bo,ZHANG Li.Digital city construction of integrated data management[J].Geo-Information Science,2010(2):2214 -2219.
[8]王 珊,萨师煊.数据库系统概论[M].北京:高等教育出版社,2006.WANG Shan,SA Shi-xuan.Introduction to database systems[M].Beijing:Higher Education Press,2006.
[9]张成才.GIS空间分析理论与方法[M].武汉:武汉大学出版社,2004.ZHANG Cheng-cai.GIS spatial analysis theory and methods[M].Wuhan:Wuhan University Press,2004.
[10]汤国安,赵牡丹.地理信息系统[M].北京:科学出版社,2000.TANG Guo-an,ZHAO Mu-Dan.Geographic information system[M].Beijing:Sciences Press,2000.
[11]王建强.城市部件数字化调查系统的研究与实现[J].测绘与空间地理信息,2009(3):78-80.WANG Jian-qiang.Research and implementation of digital cities survey system components[J].Surveying &Spatial Information,2009(3):78 -80.