井梅秀 ,穆天红★,马文君,赵慧芳
(1.青海省农牧业区划遥感中心,青海西宁 810000;2.青海省气象科学研究所,青海西宁 810000)
全球经济的快速发展,使人类对动物源性食品的需求量急剧增加,加快促进了畜牧业的发展。 畜牧业的发展逐渐引起了人类的高度重视, 畜牧业一定程度上与环境承载力紧密相关,对维持草畜、生态平衡,实现可持续发展、人与自然和谐共生至关重要。目前, 人类掌握牲畜情况依然长期依赖于传统的统计调查数据, 是以行政区划为单元进行的逐级数字收集,多以省、市、县三级为主,尺度比较粗糙,只能满足以行政区划为单元的数字分析,在应用上具有局限性,不能反映牲畜的实际分布与自然地理特征之间的关系,不能用于可视化、空间分析和地学模拟。近年来,数据空间化已成为自然社会科学中的研究热点, 如气象观测要素的空间化、 人口统计数据空间化、国民经济产值数据空间化等,随着人们对空间化概念的不断深入, 使得牲畜数据空间化的必要性更加强烈,空间化能够揭示牲畜在地理空间上的分布位置和数量信息, 参与地理信息空间进行整合计算, 实现空间尺度上的分析和决策。因此,研究牲畜数据的空间化, 将牲畜的统计数据扩展到一定的空间尺度上, 实现社会统计数据与自然数据的整合, 具有重要的理论和现实意义。
青海省是我国传统的四大牧区之一,牧区主要分布在青海南部地区(青南地区),畜牧业是青南地区重要的经济基础,是特色优势产业。以青南地区为研究区,结合气候、地理等多源遥感数据的准确、可靠性优势,开展了基于神经网络算法的牲畜研究, 探讨了神经网络算法在牲畜统计数据网格化研究中的适用性, 实现了1 千米格网尺度上牲畜的空间化, 解决了传统的牲畜数据以行政区为单元统计, 难以与地理空间数据融合进行分析决策的问题, 整体的描绘出了青南地区牲畜的空间化情况。
青南地区是指青海境内柴达木盆地、青海南山及八音山以南的地区,包括玉树、果洛及黄南藏族自治州、海南州的兴海同德, 格尔木市的部分地区等地, 面积占全省土地面积的一半左右,约为36 万平方公里,占青海省总面积的一半,西部、南部与藏北高原、川西高原连成一片。 青南地区具有典型的青藏高原特征, 西部和北部地面较平缓、完整,东部和东南部地区因河流切割,多为高山峡谷,绝大部分地面海拔在4000~5000米以上,区内气候寒冷,东南部河谷地带年平均气温0℃~3℃,其余地区在零摄氏度以下,年降水量从东南向西北逐渐减少。 植被类型有高寒灌丛草甸、 高寒草甸、 高寒草原、 高寒荒漠草原等, 具有耐寒、生长季节短、生物积累缓慢等特点。 土壤类型有高山草甸土、高山草原土、高山寒漠土、山地草甸土、钙栗土等。河流从多,冰川广布,是长江、黄河、澜沧江的发源地。 耕地、 林地极少,草原广阔。
表1 数据来源表
放牧是青南地区最主要的牲畜的活动方式之一,羊是青南地区的优良品种,选泽牲畜羊来模拟它的空间分布,包括山羊、绵羊(半细毛羊、藏羊),收集获取了2021 年青南地区21 个县、区羊的年末存栏量数据。气候、地形、地貌等都是影响牲畜活动的主要因素。该地区牲畜主要以天然草地为食,草地的利用率较高,活动范围主要受土地利用覆盖的影响。 随着海拔高度的增加,地形起伏度呈现逐渐升高趋势,牲畜量也会随之减少。本文综合考虑了青南地区地域特色和气候特征,选取了影响牲畜分布的高程(DEM)、归一化植被指数( NDVI)、人口、年降水量、平均湿度、年均温度、 土地利用数据等11 个多源遥感数据作为研究牲畜空间化的环境变量因子。
借助地理信息系统ArcMap 软件,将行政区划数据做适宜性掩蔽处理,剔除区内冰川、常年积雪等不适宜牲畜生存的区域, 结合2021 年羊的年末存栏量数据, 计算获得各县羊的密度数据,作为构建牲畜模型的的因变量。 裁剪、计算得到2021 年青南地区人口密度数据、 归一化植被指数数据、年均湿度、年降水量、年均温度数据、 坡度数据。 在2021 年土地类型数据基础上,统计每个公里网格中各地物类别的像元个数, 再除以每个公里网格中包含的总像元个数,得到耕地、草地、林地、未利用地的百分比数据。 将这11 个数据,进行数据预处理,整合到统一的投影、坐标及分辨率,作为构建牲畜模型和模拟空间化的自变量。
人工神经网络(ANN)是由人工构建的、以有向图为拓扑结构、通过对连续或断续的输入做出响应而进行大规模信息处理的动态系统,是一种试图模拟生物神经网络的结构和功能的数学模型或计算模型,是集神经科学、数学、统计学、计算机科学等学科于一体的一种综合技术。 其实质是以大脑生理变化过程为基础,模仿大脑的结构和功能,是对人脑的某种程度上的抽象、简化和模仿。 神经网络结构是由多个神经元相互组合而成的,而神经网络的学习过程就是连接权重的更新训练过程。其具有强大的计算能力、学习和归纳能力,应用在各个方面,比如在医学、油漆成藏、电力等各个行业,取得了较好的效果。
经GIS 处理得到影响牲畜的环境变量因子土地利用类型、坡度、年均温度、年降水量、年均湿度、人口密度、NDVI、DEM 等如图1 所示。
图1 多源遥感数据图
采用均值统计分析方法, 获得各县的11 个环境变量因子的值, 作为构建牲畜模型的自变量, 牲畜密度值作为因变量, 借助IBM SPSS Modeler 软件,采用神经网络算法,构建了牲畜模型。 结果显示:牲畜模型的精度为94.16%,最大误差为0.63,绝对平均误差为0.12,小于2,误差比较低,牲畜统计数据与各因子之间的线性相关性为0.98, 表明选取的11 个环境变量因子能够比较准确地反映牲畜的分布情况,训练的牲畜模型模拟家畜数量是相对准确的。影响牲畜分布最重要的环境变量因子是年降水量,占27%,其次是年均温度占17%,草地覆盖占13%,人口密度占10%,其余影响因子占比较小。 青南地区属青藏高原气候,条件恶劣、暖季短、冷季长,牲畜主要以草为食,以天然草场放牧为主,降水是直接影响牧草的生长状况的一个重要条件,在降水丰富、温度适宜的情况下,牧草生长茂盛,草地资源情况较好, 为牲畜的生存提供了充足的饲料,相反,如果降水过少或者温度过低,都不适宜牲畜的生存。该地区位于青海南部,地域广阔,人烟稀少, 牲畜的分布与人口的活动有着紧密的联系,有人的地区,就有牲畜,无人的地区,牲畜分布就很少,因此人口密度也是影响牲畜活动范围的重要因子。 由于海拔高、气候寒冷,种植业难以发展,青南地区耕地很少,有极少的林地分布,因此耕地、林地、植被覆盖度、未利用地等对牲畜的影响都比较小。 羊主要在平坦的地区放牧,因此坡度等的影响因素比较小。
青南地区牲畜主要分布在黄南藏族自治州贵南县、贵德县、贵德县、同仁县、尖扎县、兴海县等地区, 玉树和果洛藏族自治州等地区分布较少。 从统计调查数据上只能获得各县牲畜数字信息,不能获得地理位置分布信息。 基于GIS 技术,结合多源遥感数据,利用神经网络计算机牲畜模型, 模拟得到了1 千米格网牲畜空间化结果。 如图2 所示,从空间上可以看出,东部地区贵南县、同德县、贵德县分布的牲畜多。其次是兴海县、同仁县、尖扎县、河南蒙古族自治县。 玛多县、玛沁县、称多县、曲麻莱分布较少,囊谦县和班玛县等地方最少。 通过实现牲畜的空间化,可直观地看出牲畜的空间分布状况,解决了传统调查数据难以反映与自然地理特征关系的难点,该数据可以和气象、土壤等地理空间数据进行整合运算,参与评估草蓄平衡,分析草原生态状况,从更小的地理单元上分析研究牲畜的活动分布情况,对研究畜牧业的现代化发展具有重要意义。
图2 青南地区牲畜空间化图
本文以青南地区为研究区域,收集了牲畜的统计数据及影响牲畜分布的多源遥感数据,利用神经网络算法,构建了牲畜模型。 在牲畜模型的基础上,选取多源数据作为影响牲畜分布的自变量环境因子,用GIS 技术统一到相同的投影和坐标,进行网格化处理,对青南地区的牲畜进行了网格化模拟,实现了牲畜的空间化。 得出以下结论:
神经网络算法构建的牲畜模型模拟精度高,达到94.16%。
影响青南地区牲畜分布的主要环境变量因子是年降水量、年均温、草地覆盖,其次为人口密度和湿度等。
结合统计、 多源遥感数据实现了牲畜的空间化,从空间上看,牲畜分布最多的在贵南县、同德县,最少的是囊谦县和班玛县,该数据可参与农牧业空间运算。
牲畜的分布还与许多因子相关, 比如居民点、道路等,居民点是人口与牲畜空间分布的重要指示因子,道路的通达性一定程度上也影响牲畜的分布。 因数据收集存在一定的难度,且道路数据、河流数据在空间上也难以实现1 千米格网化分析, 本文在进行牲畜空间化时并未考虑这些因素,在今后的研究中,将继续对道路、河流等牲畜活动范围的影响因子,进行深入地分析、计算,更准确地模拟牲畜的空间分布,为实现空间地理数据整合、 预测牲畜空间分布等提供更高更可靠的数据支撑。