摘要:森林是陆地生态系统的核心部分,其生物量约占陆地生态系统总生物量90%,承担著65%以上的年碳固定量,在维持全球碳平衡、减缓温室气体增加等方面具有重要作用。天山云杉是新疆地区重要的林木资源,其种植覆盖面积为75 8600 hm?,占新疆维吾尔自治区天山区域总面积的42.33%,蓄积量为0.17 km?,占总蓄积量的50.66%,构建其生物量时空数据集,可为新疆维吾尔自治区天山区域碳固存潜力评估和天山云杉林保护与可持续经营实践提供科学依据。数据集以2002年、2007年、2012年和2017年天山云杉密集区野外样地调查和相关多源遥感影像资料为基础,利用时空地理加权回归(GTWR)模型拟合生成各时期生物量分布图。该数据集有助于探索天山云杉生长趋势和生物量变化,同时在新疆天山地区生态保护和气候变化研究领域具有科学价值,对区域生态系统管理具有实践意义。
关键词:天山云杉;生物量;时空地理加权;时空分布
1 引言
新疆天山山脉位于中国西北部,是亚洲中部的一座巨大山系。该山脉全长近2500 km,由3座大山及其20余座山脉和10余个山间盆地或谷地等地貌单元组成。山脉拥有丰富的植被和动物种类,其独特的自然景观和生态系统为天山云杉等多种野生动植物提供了栖息地[1-2]。云杉主要生长在天山北坡海拔1.3至3 km的中山带和亚高山带[3],是天山山脉的典型地带性植被和优势树种之一,总覆盖面积约为758600 hm?,占山地总面积的42.33%,蓄积量为0.17 km?,占山地总蓄积量的50.66%。云杉在保持水分、防止水土流失及维持区域生态系统平衡方面发挥着关键作用,具有显著的生态和经济价值。森林生物量是森林生态系统结构和功能的重要定量指标之一。天山云杉森林生物量的准确计算不仅是区域森林生态系统有效监测评估的关键指标,同时也是森林科学管理和持续运作的重要前提[4-5]。
森林资源分布受到众多因素的影响,具有多样性和复杂性,并在特征上呈现空间连续性、随机性和结构复杂性。这种复杂性不仅体现在资源的分布上,而且关系到森林生物量的估算。传统上,森林生物量主要通过现场测量取得数据并计算得出,具体包括调查样地内林分特征(例如树种、树高、胸径等),建立树种单木异速生长方程进而测算森林地上生物量(例如,皆伐法、平均木法和相对生长法等)。该方法以实地调查为基础,计算结果较为准确,但存在工作量大、成本高、周期长、具有破坏性和空间局限性等不足[6]。近年来,综合利用遥感数据、气象数据、地形数据、土壤数据等多源数据的生物量估测模型逐渐得到广泛应用,其中,地理加权回归(Geographically Weighted Regression, GWR)方法被认为是解决林业和生态学应用中空间异质性问题十分有效的方法[7-8],原因在于其在回归系数确定中引入了空间位置从而反映了空间的非平稳性,从而提供了更精确的局部估测结果。Wang等利用GWR与遥感数据估算了竹林地上生物量[9],Chen等结合GWR与光学、微波雷达数据计算长白山脉地上生物量,结果显示GWR是有限样本条件下预测和绘制AGB分布规律的最佳方法,其均方根误差为0.08 Mg/hm2,展示了GWR在生物量估测中的应用潜力[10]。部分研究注意到森林生物量的时空属性,提出了将时间维度纳入GWR以构建时空地理加权回归(Geographically and Temporally Weighted Regression, GTWR)模型[11],有效整合了时间序列数据和空间数据,更好揭示了森林资源的时空变化过程[12]。卢士欣等学者基于丰林县地区 4 期 Landsat 影像和对应气象站点数据开展的地上乔木生物量时空变化研究表明,加入时间特征的GTWR在模型评价指标上较GWR更为理想[13],表现出更好的拟合效果。基此,本研究采用GTWR处理2002、2007、2012、2017年收集的涵盖生物量、地形、气象和遥感因子等指标的多源时空数据,生成天山云杉生物量空间分布图,以支持对生物量空间变化趋势及其时空分布规律的分析。
对天山云杉生物量的研究近年来有所发展,出现了诸如2014年天山西部云杉生物量空间分布[14]、伊犁地区云杉生态因子数据集[15]等公开访问数据集,然而整体上相关数据仍相对有限,同时时空分布与多尺度特征并不理想,在一定程度上限制了相关研究的发展。本数据集源于国家自然科学基金项目“天山北坡天山云杉生物量时空估测方法的优化研究”中开展的对2002-2017年间研究区(地理范围为北纬41°48′至44°45′,东经80°39′至87°44′,图1)天山云杉的4期野外调查。数据集由相关野外样地调查数据和相关多源数据整合而成,目的是描述与说明天山云杉林生物量与各相关变量间的关系,为天山云杉生物量研究提供更大时空尺度和更多维度的数据。该数据同时也对天山云杉森林生态系统的监测评估与森林科学管理和持续运作具有实践意义。
2 数据采集与处理方法
2.1 数据采集与预处理
数据集生成包括野外林分调查与数据处理、生物量估算和多源数据整合3个阶段组成。
(1)野外林分调查与数据处理
研究团队选择天山云杉密集生长区域作为调查区(图1)开展了多年(2002年、2007年、2012年及2017年)四期野外调查。调查区内共圈定了297个样地,每个样地规模为28米×28米,选定标准主要为未明显受病虫害影响且人为干扰最小。调查内容包括样地的行政区划、样地位置和胸径、树高、龄组等林学测量因素。调查中依据国家林业和草原局提出的采样标准采用GPS记录样地中心点的位置,样木胸径起测5厘米,测量位置在树高1.3米[16]。
(2)调查数据处理与生物量估算
在数据处理后,本研究引入天山云杉异速生长模型[17],选择区域内最优模型,决定系数R?为0.981的生长公式进行样地单木生物量的估算。计算结果具有一定的适用性和准确性。
W = 0.1661×D 2.2528 (1)
公式(1)中,D為云杉胸径(厘米),W为本地区云杉生物量的计算结果(千克)。
为了全面评估样地级别的生物量,本研究首先对每个样地的单木生物量进行了汇总。随后,为了更准确地评估森林生态系统的碳储存能力,进一步计算单位面积生物量。最终得到了不同调查年份的样地生物量数据,结果如下:
(3)多源数据整合处理
当前覆盖研究区的多源遥感数据来自谷歌地球引擎(Google Earth Engine, 简称GEE)包括地形因子(海拔)、遥感因子(植被指数)、气象因子(降水、径流、风速)。(1)海拔数据是由航天飞机雷达地形测绘任务(SRTM30)获得,可以精确描述研究区域地形特征。实验步骤:通过在gee上访问SRTM数据集,裁剪出研究区范围,导出研究区高程数据,分辨率为30×30;(2)植被指数数据选择中分辨率成像光谱仪(MOD13A2)产品。实验步骤:通过在gee上访问MOD13A2数据集,裁剪出研究区范围,质量控制筛选2002-01-01到2002-12-31时间区间的数据计算均值,选择特定数据层(NDVI/EVI),同理可得2007、2012、2017年年均分布,分别导出研究区植被数据,分辨率为1000*1000;(3)年度气象因子数据通过 ERA5-Land 数据集下载,实验步骤:通过在gee上访问ERA5-Land数据集,裁剪出研究区范围,质量控制筛选2002-01-01到2002-12-31时间区间的数据计算均值,选择特定数据层(降水、径流、风速),同理可得2007、2012、2017年年均分布,分别导出研究区气象数据,分辨率1000*1000。所有数据集通过采样重投影到统一的空间分辨率和坐标系统(WGS1984_UTM_Zone_45N)中,通过 ArcGIS 转换成结构化的数据格式,适用于时空地理的加权回归分析。
2.2 云杉生物量分布数据计算
本研究通过对天山云杉密集区生物量分布与环境因素之间复杂相互作用的时空地理加权回归(GTWR)模型进行探索。在进行建模之前,研究通过方差膨胀因子(VIF)进行了解释变量与生物量关系的共线性检测。多重共线性,即模型中自变量相互之间的高度相关性,可能会影响模型估计的准确度[18],通过SPSS软件的共线性检测得到本研究的解释变量VIF值均小于10。GTWR模型作为地理加权回归(GWR)的进阶版本,不仅考虑了空间异质性,还引入了时间维度的变化,从而能够更全面地揭示生物量分布随时间和空间的动态变化。
在GTWR模型中,自变量的回归系数随着时空的变化而不断变化,从而提供了比传统GWR模型更精确的分析框架来理解变量之间复杂的时空关系。GTWR模型的基本公式如下[19]:
yi=β0(ui,vi,ti)+∑βk(ui,vi,ti)×Xik+?i (2)
公式(2)中,(ui,vi)表示第i个样本点的地理坐标,ti表示观测时间,yi表示第i个样本点的因变量值,Xik表示第i个样本点的第k个解释变量,而β0(ui,vi,ti)和βk(ui,vi,ti)分别是回归常数和回归系数,?i代表模型误差项。
回归系数的估计公式为:
Β( ui,vi,ti)=(X'W(ui ,vi,ti)X)-1X'W(ui,vi,ti)y (3)
公式(3)中,W(ui,vi,ti)表示时空位置的权重,时空地理加权模型决定不相同的本点对于返回样本点的影响程度,是通过构造时空权重矩阵W(ui,vi,ti)。时空权重矩阵在时空地理加权回归(GTWR)模型中起着核心作用,其构建过程是模型分析的关键环节。构造过程一般是通过构造时空距离计算并带入权重函数(例如高斯函数或bi-square函数),从而计算得到权重矩阵,这一过程确保GTWR模型在进行回归分析时可以将各个样本点的时空特性考虑在内,从而在对复杂时空数据进行分析时提高模型的精确性和适应性 [11,20]。
3 数据内容
数据集主要包括天山云杉密集区域样地结构数据和分布数据。
(1)天山云杉密集区域样地结构数据,内容包括2002年-2017年每期样地情况,编号、行政区位置、单位生物量、海拔、归一化植被指数、绿色植被密度指数共8个气象生物因子(表2)。
(2)天山云杉密集区域生物量及背景数据。背景数据包括地形数据、遥感数据和气象数据。地形数据为海拔(图2),遥感数据包括归一化植被指数和绿色植被密度指数(图3),气象数据包括年平均降水量、年最大降水量、年最小降水量、年平均径流深度、年最大径流深、年最小径流深、年平均向北风速、年平均向东风速(图4)。云杉密集区域生物量时空地理加权结果分布如图5所示。
4 数据质量控制
为确保数据的科学性和处理的精确性,从选择样点、测量样本、检查校验、数据分析等过程尽可能标准化步骤,减少人为误差。对于野外调查数据,项目团队采样严格执行国家林业和草原局公布的森林调查技术规程,依据天山实地随机均匀设置多个未明显受病虫害影响且人为干扰最小云杉采样点。每个样点所有样木调查数据以平均值的三倍标准差作为排除阈值排除实测数据中由于人为误差所引入的异常值,并在此基础上利用云杉异速生长方程获取样地生物量数据值。地形因素、气象因素以及遥感因素的数据则借助于谷歌地球引擎(Google Earth Engine, GEE)的地理空间数据处理能力获取。其中,高程资料源自SRTM30的航天飞机雷达地形测绘任务(SRTM30),植被指标资料则选择了中解析度成像光谱仪(MOD13A2)产品。年度气象因子数据,包括降水量、径流量和风速等,均通过ERA5-Land 数据集下载。所有数据的获取和处理均在GEE代码编辑器中通过编写脚本实现,严格指定了时间和空间范围。此外,时空地理加权回归模型的建立和分析工作在RStudio和ArcGIS 10.8环境下完成,通过对插值结果进行交叉验证(RMSE为64.36Mg/ha)来确保实验的精度。本研究在所有数据集的处理和分析过程中,严格遵循了相关技术规程和软件操作指南,以确保数据质量的高度可靠性和分析结果的准确性。
5 数据价值与使用建议
本数据集融合了2002年、2007年、2012年和2017年四期的297个样地的生物量数据、SRTM30的高程数据、MOD13A2的植被指数和ERA5-Land的年度气象因子,相对于分析天山云杉生物量的时空分布而言数据更加全面。对更好揭示天山云杉的生长趋势和周期性变化极为关键,也为识别和保护关键生态区域、评估气候变化对生态系统的影响、监测和模拟生态系统碳循环过程、全球碳预算研究提供数据支持,还为生态系统管理和相关领域的科研工作者提供了宝贵的数据资源[21]。
6 数据可用性
中国科技资源标识码(CSTR)码为17058.11. sciencedb.agriculture.00089;
数字对象标识码(DOI)为10.57760/sciencedb. agriculture.00089。
公开访问。
7 代码可用性
本文所用代码存储于国家农业科学数据中心并允许公开访问、下载与安装,访问地址为https://agri.scidb. cn/preview?dataSetId=89ae131046bd42369f0930abc21a1e31&version=V1。
作者分工与贡献
胡啸琦,数据处理分析与论文撰写。
胡林,数据分析。
曹姗姗,数据采集。
孙伟,组织实施与数据校对。
伦理声明
本研究不涉及伦理事项。
利益冲突声明
全部作者均无会影响研究公正性的财务利益冲突或个人利益冲突。
参考文献
[1] 卢雅焱,徐晓亮,李基才,等.基于InVEST模型的新疆天山碳储量时空演变研究[J].干旱区研究,2022,39(6):1896-1906.
[2] 王敏,李贵才,仲国庆,等.区域尺度上森林生态系统碳储量的估算方法分析[J].林业资源管理,2010(2):107-112.
[3] 罗庆辉,徐泽源,许仲林.天山雪岭云杉林生物量估测及空间格局分析[J].生态学报,2020,40(15):5288-5297.
[4] 李宗英,罗庆辉,许仲林.西天山雪岭云杉林分密度对森林生物量分配格局和异速生长的影响[J].干旱区研究,2021,38(2):545-552.
[5] 阿地来·赛提尼亚孜.天山北坡中段雪岭云杉林8 hm?样地群落特征10a变化[D].乌鲁木齐:新疆大学,2022.
[6] 魏智海,张乐艺,李霞.森林地上生物量遥感估算研究进展[J].农业与技术,2021,41(11):78-84.
[7] Zhang B, Ou G, Sun X, et al. Application of spatial effect and regression model on forestry research[J]. Journal of southwest forestry university, 2016, 36: 144-152. https://doi.org/10.11929/j.issn.2095-1914.2016.03. 025.
[8] Kupfer J A, Farris C A. Incorporating spatial non-stationarity of regression coefficients into predictive vegetation models[J]. Landscape Ecology, 2007, 22: 837-852. https://doi.org/10.1007/ s10980-006-9058-2.
[9] Wang J, Du H, Li X, et al. Remote sensing estimation of bamboo forest aboveground biomass based on Geographically Weighted Regression[J]. Remote Sensing,2021, 13(15), 2962. https://doi.org/ 10.3390/rs13152962.
[10] Chen L, Ren C, Zhang B, et al. Estimation of forest above-ground biomass by Geographically Weighted Regression and Machine Learning with sentinel imagery[J]. Forests 2018, 9(10): 582. https:// doi.org/10.3390/f9100582.
[11] Fotheringham A, Charlton M, Brunsdon C. Geographically Weighted Regression: A natural evolution of the expansion method for spatial data analysis[J]. Environment and Planning. A, 1998, 30(11): 1905-1927. https://doi.org/10.1068/a3019.
[12] 肖宏偉,易丹辉.基于时空地理加权回归模型的中国碳排放驱动因素实证研究[J].统计与信息论坛,2014,29(2):83-89.
[13] 卢士欣,贾炜玮,孙毓蔓,等.基于局部回归模型的森林生物量动态变化分析[J/OL].西南林业大学学报(自然科学):1-9[2023-12-15].
[14] 蔡潮勇,曹姍姗,孔繁涛,等.2014年新疆天山西部云杉地上生物量空间分布数据集[J].中国科学数据(中英文网络版), 2022, 7(3): 250-263.
[15] 卫培刚,孔繁涛,胡林,等.2014年伊犁地区天山云杉分布区生态因子数据集[J].中国科学数据(中英文网络版),2023,8(1):242-252.
[16] GB/T 38590-2020. 森林资源连续清查技术规程[S].北京:中国标准出版社,2020.
[17] 张绘芳,高亚琪,朱雅丽,等.新疆雪岭杉生物量模型对比研究[J].西北林学院学报,2015,30(6):52-58.
[18] 田晓梅,崔洪军,朱敏清,等.基于时空地理加权回归的服务区驶入量影响因素分析[J].科学技术与工程,2023,23(20):8828-8838.
[19] 孙裔煜,高静,仝德,等.基于GTWR的广东省乡村聚落规模时空演变研究[J].地理科学,2023,43(7):1249-1258.
[20] Zhang Y, Teoh B K, Zhang L M, et al. Spatio-temporal heterogeneity analysis of energy use in residential buildings[J]. Journal of Cleaner Production, 2022, 352: 131422. https://doi.org/10.1016/j.jclepro. 2022.131422.
[21] 张绘芳,张景路,侯晓巍,等.新疆天山山区乔木林碳密度变化特征及其影响因素[J].水土保持通报,2021,41(2):122-127.
引用格式:胡啸琦,胡林,曹姗姗,孙伟. 2002-2017年新疆天山云杉区域生物量时空分布数据集[J].农业大数据学报,2024,6(1): 24-32. DOI:10.19788/ j.issn.2096-6369.100008.
CITATION: HU XiaoQi , HU Lin , CAO ShanShan , SUN Wei.Spatial and Temporal Distribution of Biomass in Dense Regions of Tianshan Spruce in Xinjiang, 2002-2017[J]. Journal of Agricultural Big Data, 2024,6(1): 24-32. DOI: 10.19788/j.issn.2096-6369.100008.
Spatial and Temporal Distribution of Biomass in Dense Regions of Tianshan Spruce in Xinjiang, 2002-2017
HU XiaoQi1,2 , HU Lin 1,2 , CAO ShanShan 1,2*, SUN Wei 1,2*
1. Agricultural Information Institute of CAAS, Beijing 100081, China; 2. National Agriculture Science Data Center, Beijing 100081, China
Abstract: Forests constitute the central part of terrestrial ecosystems, encompassing approximately 90% of the total biomass. They are responsible for over 65% of the annual carbon sequestration, playing a crucial role in maintaining global carbon balance and mitigating the increase of greenhouse gases. Tianshan Spruce, a vital forest resource in the Xinjiang region, covers an area of 758,600 hectares, accounting for 42.33% of the total area, with a volume of 0.17 cubic kilometers, representing 50.66% of the total volume. Constructing a spatiotemporal biomass dataset of Tianshan Spruce provides a scientific basis for assessing the carbon sequestration potential and for the protection and sustainable management of these forests in the region. In recent years, biomass estimation models integrating multisource data like remote sensing, meteorological, topographic, and soil data have been widely adopted. The geographically weighted regression (GWR) method is particularly effective in addressing spatial heterogeneity issues in forestry and ecological applications. This study's dataset is grounded on field survey data from dense Tianshan Spruce areas collected in 2002, 2007, 2012, and 2017 by the project team, adhering to the forest survey technical procedures of the National Forestry and Grassland Administration, and on multisource remote sensing images from the Google Earth Engine. The geographically and temporally weighted regression (GTWR) model was employed to generate biomass distribution maps for each period. This dataset is instrumental in exploring the growth trends and biomass variations of Tianshan Spruce, holding scientific value for ecological protection and climate change research in the Tianshan area of Xinjiang. It has practical significance for regional ecosystem management. Additionally, it offers data support for identifying and protecting key ecological areas, assessing the impact of climate change on ecosystems, monitoring and simulating the carbon cycle processes in ecosystems, and contributing to global carbon budget research. Furthermore, it provides valuable data resources for researchers in ecosystem management and related fields.
Keywords: Tianshan spruce; biomass; spatial and temporal geographic weighting; spatial and temporal distribution