孟雪娇,刘显傅,陈艺榕
(1.国家海洋局汕尾海洋环境监测中心站,广东 汕尾 516600;2.国家海洋局南海规划与环境研究院,广东 广州 510300;3.南方海洋科学与工程广东省实验室(广州),广东 广州 511458)
海岸带生态系统位于海陆交互界面,受陆海相互作用显著,包括潮间带、红树林和海草床等,是世界上生产力最高的生态系统之一[1-2],为全球人类活动最为活跃的海岸带地区提供了海岸防护、侵蚀控制、蓝碳固定、水质净化、污染物降解、区域气候调节、动植物栖息地,以及教育、科研、景观等生态与人文服务[3-5]。在国家“一带一路”发展战略下,海岸带地区是拉动我国经济发展的重要引擎,科学认识海岸带生态系统的健康状况和自然规律,是实现沿海地区海洋经济健康可持续发展的前提。
然而,在过去的60 多年里,受海平面上升加剧、环境污染加重、外来物种入侵、海岸带过度围垦等自然和人为因素的影响,我国的砂质海岸、红树林、海草床等海岸带生态系统遭受到极大的破坏,海域资源的不合理开发和利用导致海岸带生态系统的结构和功能发生重大变化[6-11]。截至2012年,我国有超过30%的原生砂质海岸遭到开发活动的破坏,超过60%的沿岸沙坝、海岸潟湖等地貌景观被损毁,重点海湾较1990 年海岸带生态系统面积平均缩减了19.1%[12-13]。因此,针对海岸带生态系统快速而深刻的变化,如何预测其对生物多样性、人类生产生活产生的影响,并采取措施、科学应对,已成为沿海地区科学与可持续发展研究的重大课题。
2018 年,习近平总书记在中央财经委员会第三次会议上提出:实施海岸带保护修复工程,建设生态海堤、提升抵御台风、风暴潮等海洋灾害的能力。为此,自然资源部组织实施了海岸带保护修复工程(2020—2022 年),并出台了《海岸带生态系统现状调查与评估技术导则》(T/CAOE 20.1—2020)系列技术标准(以下简称《导则》)。当前,沿海各市正有序开展海岸沿线红树林、砂质海岸、海草床和河口等生态系统的调查与评估工作,并取得了初步成果,为进一步有针对性地开展海洋生态保护修复提供了重要依据和有力的基础数据。然而,由于现状调查包括船舶走航调查、现场测量、遥感解译、社会调查和资料收集等方式,所获取的调查成果涉及海洋环境、生物化学、地形地质、遥感测绘等学科,数据资料类型繁多、形式多样、格式不一,既包括矢量、影像、数据表等结构化数据,也包括文档、图片、音视频多媒体资料等非结构化数据,故而难以直接进行综合分析,亦不便直接应用于生态系统现状评估和保护修复工作之中。
本文以2020 年江门市海岸带生态系统调查为例,通过对红树林、砂质海岸、河口等典型滨海湿地生态系统的现场调查和遥感解译成果进行分析,开展对多源、异构、海量调查成果数据库建立技术的研究,形成一套数据整理、处理、检查、数据库构建的技术流程,实现成果的入库存储、集成等规范化管理,以及即点即看等直观可视化展现的实践应用,以有效支撑生态系统调查专题图集编制和海岸带生态状况科学评估等工作。
本文数据来源于2020 年9 月广东省江门市生态系统调查获取的现场调查数据。该调查严格遵照《导则》规定的技术方法,采用现场调查、遥感调查、社会走访和资料收集等方式,组织开展了海岸沿线红树林、砂质海岸、海草床和河口等典型生态系统的现状数据获取工作,调查站位覆盖江门市海岸带区域,调查内容见表1。调查获取的现状资料包括:红树林、砂质海岸、盐沼、基岩和淤泥质等5 类生态系统分布状况的遥感解译成果,以及红树林、砂质海岸、河口3 种典型海岸带生态系统的详细现场调查数据。
为充分发挥调查成果资料在生态系统现状评估和综合分析中的应用,本文从成果资料汇集、质量检查与勘误、数据预处理分析等方面,探索出一套针对多源异构调查资料的整理、质检、建库的技术流程,以实现成果资料的规范化管理,技术流程如图1 所示。
图1 成果建库技术流程图
将所获取的广东省江门市海岸带生态系统现状调查成果资料进行汇集,按照河口生态系统、红树林生态系统和砂质海岸生态系统3 种类别,对现场调查成果资料进行归类整理。每一典型生态系统形成一个单独目录,目录中包含现场调查所得的数据记录表、照片、视频等成果资料。
为确保数据质量,采用软件(如ArcGIS)批量检查和人工辅助检查相结合的方法,对成果数据进行检查[14]。检查内容主要包括数据完整性、图形数据质量、属性数据质量、图数一致性等。
(1)数据完整性:数据是否完整、数据文件能否正常打开、文件命名是否准确、是否存在元数据说明等。
(2)图形数据质量检查:图层是否完整、图形数据是否存在拓扑错误、是否存在碎图斑、图形数据范围是否正确、数学基础是否符合要求等。
(3)属性数据质量检查:包括空间图层名称、空间数据属性数据结构是否符合《导则》要求,字段取值是否符合取值范围规定、编号字段是否唯一、必填字段是否填写、图层内部各个字段取值是否一致等。
(4)图数一致性检查:包括遥感信息解译图斑边界和最新海岸线修测现场实测边界一致、养殖区图斑面积要和养殖用海调查中图斑面积保持一致等,确保和其他专项调查成果的一致性。
在数据入库之前,采用ArcGIS 和自编软件[15]进行数据的预处理分析,具体分析内容见表2。
表2 数据预处理分析内容
2.3.1 基础地理要素处理
根据调查区域的行政范围对高清卫星影像进行裁剪作为底图;叠加江门市行政区域范围内的海陆要素、居民地、水系等基础地理信息图层;叠加江门市海域管辖范围的广东省政府批复海岸线,并在海图中提取零米等深线;按照《导则》要求,所有基础地理要素图层的坐标参数统一设置为国家大地坐标系(China Geodetic Coordinate System 2000,CGCS2000)。
2.3.2 成果数据分析处理
将所有调查成果数据表中的站位号、断面号、标识码进行统一赋值和一致性检查,并按照《导则》要求对数据表中各字段的名称、格式、大小进行规范化整理,同时从ArcGIS 平台数据入库规则角度进行相应的数据格式转换,如浮点型转换为文本型、特殊字符采用其他字符代替、长字段名称采用拼音首字母代替等。
2.3.3 调查站位信息处理
在ArcGIS 平台中,利用添加XY 数据功能,将现场调查站位信息转换为空间矢量图层数据,保留站位号、经纬度、调查时间、调查内容等信息。
2.3.4 视频照片文档信息提取
利用ArcGIS 平台ArcToobox 工具的照片信息提取功能,批量提取现场照片的经纬度、存储路径、拍摄时间等,形成空间矢量图层。依据视频文件空间轨迹提取方法[15],获取视频文件轨迹的经纬度、存储路径等信息,形成线状空间矢量文件;对于无法获取轨迹经纬度信息的视频文件,将同一地点获取的照片文件所在经纬度、存储路径等作为视频文件的信息,形成点状空间矢量图层。
2.3.5 拓扑检查分析处理
本文通过ArcGIS 平台的ArcCatalog 应用程序进行拓扑检查和分析处理。先把需要做拓扑检查的图层放入建立好的数据集中,新建拓扑,根据图层之间的相互关系选择拓扑规则后,进行拓扑检查和分析。主要拓扑检查和分析规则有:确保图斑无重叠、无空隙、面图层闭合等。拓扑检查完成后,可将结果叠加进ArcGIS 中进行分析查看,针对错误提示,采用补面、删除等方法进行修改处理,直至无错误提示。
3.1.1 数据库平台选型
鉴于ArcGIS 平台的Geodatabase 地理数据库具有数据格式兼容性强、建库操作简易、和外部非结构数据交互便捷、数据调用接口灵活等优点,因此,本次工作选取ArcGIS 作为数据库构建工具,以更好支撑专题制图、空间分析和信息系统开发等工作的顺利开展,发挥调查成果的信息化服务功能。
3.1.2 数据库框架结构设计
广东省江门市海岸带生态系统现状调查成果数据库框架结构如图2 所示,分为结构化数据库和非结构化数据库两大类,同时又细分为现场调查成果数据库、遥感解译成果数据库、基础地理信息数据库等9 个子库。在此数据库框架结构下,空间矢量数据统一存储为“*.mdb”(Microsoft Database)格式文件,栅格数据以“*.tif”格式存储,非结构化数据以调查数据表格(“*.xls”)、报告文本(“*.txt”和“*.docx”)、图像(“*.jpg”)和视频(“*.mp4”)等格式存储,将多源异构调查成果数据纳入数据库中,以解决“涉及学科多、文件类型杂、数据格式不统一”调查成果数据的规范化统一管理问题。
图2 现状调查成果数据库框架结构
3.1.3 数据库逻辑结构设计
广东省江门市海岸带生态系统现状调查成果数据库主要包括调查站位、现场调查成果、遥感解译成果和非结构化数据4 个对象,每个对象又包括若干数据表或数据文件。各对象之间的关系及结构如图3 所示。
图3 数据库逻辑结构设计图
3.1.4 数据表设计
广东省江门市海岸带生态系统现状调查成果数据库中的调查站位、现场调查成果和遥感解译成果,包含了红树林沉积环境、河口水质监测和砂质海岸海滩地形地貌等31 个数据表,每个数据表的字段结构,按照《导则》要求进行设计,表3 为河口生态系统水质监测数据表字段结构。
3.1.5 数据字典设计
将现状调查成果数据库中各对象之间逻辑结构关系描述,以及每个对象所包含数据表字段说明整理成数据说明文档,形成数据字典,供程序员和其他需要查阅数据的人参考。
基于现状调查成果,遵照《导则》 要求,在ArcCatalog 应用程序中进行海岸带生态系统现状调查数据库各类数据表及字段的建立,具体流程如下。
(1)在ArcCatalog 中以Personal Geodatabase 方式建立数据库,并按照生态系统类型进行命名,如河口生态系统数据库、红树林生态系统数据库、砂质海岸生态系统数据库。
(2)在数据库中构建相关数据表,如红树林沉积环境、红树林生物群落、红树林水环境、红树林威胁因素、河口水质监测、河口水文气象、砂质海岸底质环境、砂质海岸海滩地形地貌等。建立数据表时,其投影坐标系统设置为国家大地坐标系CGCS2000。
(3)对于新建的每个数据表,按照《导则》要求,建立相应字段,包括字段名称、数据类型等,例如河口生态系统的水质监测数据表各字段设计如表3 所示。可采取手动方式,在ArcCatalog 中逐个建立各字段,也可将Excel 文件数据表头直接导入,批量建立相关字段。
表3 河口生态系统水质监测数据表字段结构(节选)
3.3.1 调查数据入库
基于ArcGIS 平台,将经过预处理后的调查成果数据表导入已建好的数据表中,实现现状调查数据的规范化入库存储。
3.3.2 调查数据空间化处理
借助ArcGIS 平台的表关联功能,将数据预处理阶段已形成的调查站位矢量图层,与数据库中各数据表逐一进行连接(Joint) 操作,连接字段为“站位号”,使各数据表转换为具有空间属性的矢量图层。
3.3.3 构建空间矢量图层
建立调查成果空间数据库,以各生态系统名称为名构建数据集,并将矢量图层导入相应数据集中,如图4 所示。
图4 海岸带生态系统现状调查成果数据库
建设形成的数据库,可基于地理信息系统(Geographic Information System,GIS) 平台进行可视化展现,同时可采取文件读取、程序调用、服务发布等方式,实现用户对数据库中海岸带生态系统现状调查成果的共享和调用应用。
基于构建完成的数据库,可将各空间矢量图层,添加到ArcGIS 平台的ArcMap 应用程序中,形成地图文档“海岸带生态系统现状调查成果数据库.mxd”。在ArcMap 中对各空间图层进行叠加和渲染整饰(如设置点、线、面图式图例和显示颜色,设置标注及格式等),完成各图层的可视化展现。
利用“信息查看工具”,以“所点即所见”的方式,可在ArcMap 中进行调查站点、照片视频、调查数据、遥感解译等调查成果的可视化浏览。
构建完成的海岸带生态系统现状调查成果数据库,可以通过文件读取、程序调用、地图服务发布等方式,进行数据调用和共享应用,解决专题制图、空间分析和信息系统开发等工作的规范化数据来源问题,发挥调查成果的信息化服务功能。
4.2.1 文件读取方式
所构建完成的调查成果数据库,统一保存为“*.mdb”(Microsoft Database)格式的文件,专题制图、空间分析等数据应用人员可利用Microsoft Access、Excel 或ArcMap 应用程序直接打开该mdb格式的数据库文件,直接读取海岸带生态系统现状调查成果数据库中的调查成果信息。
4.2.2 程序调用方式
信息系统开发人员可借助Microsoft Office Access 数据库引擎或基于COM(组件对象模型)的自动化接口技术,通过计算机程序开发语言调用本工作所形成的“*.mdb”格式数据库。如C#语言可通过引用“System.Data”和“System.Data.OleDb”两个类库,快捷连接和调用操作“*.mdb”格式的数据库文件,直接读取海岸带生态系统现状调查成果数据库中的调查成果信息。
4.2.3 地图服务发布方式
数据库共享人员可利用地图服务发布方式,将海岸带生态系统现状调查成果数据库导入ArcMap地图文档中,并在ArcGIS Server(ArcGIS 空间数据服务管理平台)中作为网络地图服务发布。专题制图、空间分析和信息系统开发等数据应用人员只要与共享人员在同一网络环境中,即可通过Web(万维网)方式调取地图服务地址,将该数据库中的图层加载到本地ArcMap 地图文档之中,或者调用到信息系统之中。其优点是用户不需要拷贝或读取数据库文件,即可访问到海岸带生态系统现状调查成果数据库中相关信息,而且可供多个用户并发访问,既灵活便捷,又确保了数据的安全管理。
海岸带生态系统现状调查资料涉及学科多、文件类型杂、数据格式不统一,难以直接应用于生态状况科学评估、专题制图分析、信息系统建设等方面的工作。为解决这一难题,本文对江门市红树林、砂质海岸和河口等海岸带生态系统的现场调查和遥感解译成果进行分析,研究形成了一套行之有效的数据整理、处理、数据库构建技术流程,完成了对现场调查、无人机航拍、遥感解译等调查成果资料的规范化集成管理,并基于GIS 平台,实现了数据库资料查看、浏览和专题展示等可视化应用,最后探讨了数据库的共享应用思路。
本文所形成的数据库建设技术,在江门市海岸带生态系统调查与评估工作中得到了有效应用,为评估提供了规范化集成的基础资料信息,支撑完成了图集编制和海岸带生态状况科学评估,同时为信息系统开发提供了数据共享和调用接口,助力自然资源管理及辅助决策。此外,本文研究形成的多源异构数据资料整理、质检、建库、可视化应用和数据共享等技术成果,可在我国海岸带生态系统现状调查成果管理和共享服务中进行示范推广。