徐华平
(1.安徽省第二测绘院,安徽 合肥 230031)
水系包括自然河流、沟渠和水体,其实体数据表达为点、线、面,取决于对应比例尺下的宽度、面积指标以及其他特征。单线水系和与其有串联关系的面状水系是河网研究的主要对象。自然河流是指地貌低点间水往低处流动的区域,表现为地表水从分水岭到汇水区域的流动以及在汇水区域内的运动。支流汇入干流,逐级汇入,呈树状结构。沟渠是指人工修建的供灌溉、引水、排水的水道。沟渠并非总是沿着汇水区域运动,符合地貌上的水往低处流的特点,地上渠有提水设施。干渠向支渠提供水源,表现为干渠流向支渠,支渠流向毛渠,毛渠流到田间,局部表现为逆树状结构。干渠是地面上人工开挖的供引水、排水的主干渠道;修筑正规、渠道较宽,通达几十公里以上[2]。基础地理信息数据中干渠随处可见,不符合数据字典的定义。水体包括池塘、湖泊、水库、海洋等,是洼地积水的宽阔水面。本文首先构建面状水系(河流、运河、沟渠、水体)的中心线,形成水系结构线;再与单线水系共同构成完整的河流网络[3]。
将水系抽象为河流网络,仍需进一步细化河网的构成。河段是指两个结点间的有向线,如图1中8号点与9号点间的有向线。河段高差是指河段中首点高度减去尾点高度,高差为负的河段属异常,如图1中3号点到1号点为河段异常。1级河网是指源头到交汇点的河段。剥离1级河网后,按照1级河网原理标定的河网为2级河网,依次类推。源头是指河段的首点且悬挂,如图1中的8号点;终点是指河段的尾点且悬挂,如图1中的1号点(错误的终点)。流经点是指两条河段的连接点,只有两个端点在此重叠。流经点异常(如图1的3号点)说明该处违背了一首一尾的连接方式,经过流经点的河段具有相同的河网级别。交汇点是指3个及以上的河段端点在此重叠,若交汇点均由首点或尾点构成,则属于异常,如图1的9号点和7号点。
图1 河网的数据对象
不积小流,无以成江海。一条条支流,逐渐汇成干流,呈树状结构,如图2所示。终点数远小于源头数,因此保证河流终点正确比保证源头正确的工作量小很多。图2中蓝色方块表示终点,绿色圆点表示源头,直观上也能反映其数量关系。
图2 河网的树状结构
流向错误主要表现在3个方面:①河段高差为负数,并使用特殊颜色表示;②流经点是两个河段的连接点,两个首点或尾点连接则显示结点异常;③3个或3个以上的河段交汇处,若均为首点或尾点,标记异常。异常并不总是在第一时间被揭示出来,可能会在剥离1级河网、2级河网后才会出现。
本文根据树状结构、水往低处流、首尾相接等河网特点设计算法。首先验证每个终点,并标记流经点、交汇点中的异常,标记并提取1级河网;再对剩余数据重复上述处理,标记2级河网;以此类推,直至交汇点为空集为止。
算法的具体步骤为:①目标数据添加字段;②验证河网终点的正确性,修改高差为负的河段流向;③人工处理流经点和交汇点的异常情况;④标记1级河网;⑤重复步骤②、③、④,分别标记为2、3、…、n级河网,直到交汇点列表为空。
本文采用的开发语言为Python 2.7,主要模块为ArcPy。针对ArcGIS的gdb和mdb格式数据由若干功能函数组成,本文将功能函数的调用设计为人机交互式和一键式两种模式。函数的主要功能和形式参数为:
1)删除字段和增加字段:del_fld_2_fc(workspace'fc'flds)、add_fld_2_fc(workspace'fc flds)。
2)河段端点坐标:hydl_2_ptf_ptl(workspace'fc)。
3)端点重叠个数(含首点、尾点和总端点数):hydl_2_ptf_ptl_pts(workspace'fc)。
4)结点类型(源头、终点、流经点、交汇点):node_type(workspace'fc)。
5)河段高差计算:ptf1_ptl1_dh(workspace'fc'image_file)。
6)1级河网提取:export_fenji(workspace'fc)。
7)分汊河段处理:branching_river(workspace'fc)。
8)综合调用函数,主要用于一键式运行:run(workspace'fc'image_file'flds)。
交汇点为空值时,布尔值为false,终止执行程序;否则持续依次运行上述函数,初始河网值设为1,运行时河网值递增1。除增加、删除字段外,其他值根据需要重新计算,如首尾点列表随河段的改向变化。
对于自然河流,程序运行效果非常好;而在沟渠密布区域有时会出现逆树状结构,通过大量验证“终点”数据也无法提供对流向判断的支撑,仍以人工分析为主。
人机交互模式是在河网每次分级前修改程序报出的问题,若某源头错判为终点,不及时修改,则无法生成局部1级河网,涉及的2级河网也无法生成,程序会将矛盾和异常记录在河网数据中,如高差为负值,在结点文件中会记录结点异常;一键式模式是等程序全部运行后再进行问题修改,需考虑该错误的影响范围,易漏改、错改问题,往往需要运行多次,反复查看比对不同级别河网分级前的异常记录。
1)Strahler法。没有支流的河流为1级,级别相同的河流交汇后的河流分级将升高1级,不同级别的河流交汇后,保持交汇前的高级别[4]。
2)Shreve法。没有支流的河流为1级,交汇后的河流分级是交汇前的级别之和。
程序首先生成1级河网,剥离并定名为fc_01;再对剩余数据依次生成2、3、…、n级河网,命名为fc_02、fc_03等。河网分级结果符合Strahler法。
本文提取安徽省南部某一水系区域,主要利用该区域的DLG、DEM、DOM数据。DLG中的HYDL数据是待验证的对象[5]。对HYDL数据进行过滤,排除溢洪道、干沟、河道干河等不参与河网分级和流向判断的要素,并对数据进行线重叠、微短线、自相交、相交打断处理[6]。河流也有立交的情况,需查看输水槽和地上渠的情况,避免这些数据的误处理扰乱(立交不打断)程序的进行。添加字段为后续分析、计算的结果提供信息载体。
验证“终点”,逐条修改自然河流河段高差为负的区域,并分析其断在此处的合理性;分析处理全部“流经点_异常”;逐个核实“交汇点_异常”,并将质量测试结果符号化[6],如图3所示。
图3 研究区范围内部大量的“终点”
1)不合理的终点。可通过延长、连接、添加结构线或改变方向来处理。
2)河流与沟渠混乱。河流与沟渠相交的不合理打断将干扰河网分级和水系流向的判断,排查交汇点个数≥4的区域。河流一定在汇水区,不管是否进行了人工修建。跨越河流和不同等高线的、不沿地貌低点流动的就按沟渠对待。
3)河流分汊。交汇点之后新增河段数≥2,则分汊后河网级数与分汊前保持一致,执行了河网分级原理;并标记分汊点供人工结合影像图来分析。
4)封闭沟渠。类似池塘一样静止的水面,没有水源,也不外流。按独立水网对待,为1级河网。
一键式模式、人机交互模式实际上均归结为人机交互模式,差别在于及时处理问题或事后集中处理问题。
给定数据路径后,再计算结点类型,并给出矛盾结点和问题河段,人机交互主要体现在这个环节。首先按提示修改每个问题,再计算结点类型,生成并提取1级河网。如此往复,生成并提取2级河网、3级河网等。若不通过人机交互处理问题,矛盾结点和问题河段将累计到程序运行结束。分级后叠加高程模型的河网分级结果如图4所示,正常情况下不使用DEM数据。
图4 河网分级结果
迭代终止的条件是交汇点个数为0或源头数为0。表1中5个字段有4个字段的数量在大幅减少,唯独流经点—异常在增加,剥离上级河网后,才显露问题,这也是通过河网分级解决流向问题的价值所在。终点数不为0,是由于一条河流两头都是终点,程序无法为其分级,改正存在的错误后程序才能运行彻底。由于存在结点错误,初次运行的分级结果并不完全可靠,改正存在的错误才能得到满意的结果。
表1 分级结点类型统计
河网分级是解决水系流向问题的手段。通过确保河段终点的正确性,推算结点关系和终点所在河段的高差,可大幅提高解决水系流向的工作效率。