宋长江 孙旭东 蔺雪莹 刘兆刚
摘 要:通過调查和查阅资料收集帽儿山地区水曲柳、黄菠萝、胡桃楸3大珍贵硬阔叶树种的地理分布数据,利用GIS技术和随机森林模型,结合目标树种小班的地形和土壤数据,开展帽儿山地区3大珍贵硬阔叶树种适宜性分布研究。结果显示,10组数据集的随机森林模型准确率均在70%以上,当Ntree(森林中决策树的数量)=500时随机森林模型的平均准确率为75.2%,当Ntree=1 000时随机森林模型的平均准确率为75.4%,并且10组数据集的最佳临界值(AUC)均在0.7以上,其平均AUC为0.746。在10组数据集中,海拔的平均降低精度和平均降低基尼系数最大,坡位的平均降低精度最小,地貌的平均降低基尼系数最小,目标树种在海拔200~300 m范围内生长适宜性最高,在海拔高于300 m之后随着海拔的升高,目标树种生长的适宜性越低;在坡度为0°~10°与30°~35°2个范围内生长适宜性最高,随着坡位由上到下的变化,目标树种生长适宜性越来越高;在西南、南、北这3个方位的生长适宜性最高;在平原地区的生长适宜性最高;在A层(淋溶层)厚度大于15 cm之后目标树种的生长适宜性越来越高;当AB(淋溶层和淀积层)层厚度在10~25 cm范围内最适宜目标树种的生长。研究结果证明,影响帽儿山地区3大珍贵硬阔叶树种适宜性分布的环境因子重要性排序,按照由高到低依次为海拔、AB层厚度、坡度、坡向、A层厚度、地貌和坡位。其主要适宜分布在帽儿山地区的南部和西北部区域,海拔200~300 m范围内,坡度平缓,土层厚度在15~25 cm,坡向为南北方向,地貌为平原,坡位为下坡位的地区。
关键词:随机森林模型;硬阔叶树种;适宜性评价;重要性排序;机器学习
中图分类号:S718 文献标识码:A 文章编号:1006-8023(2023)03-0064-09
Abstract:The geographic distribution data of the three precious hardwood broad-leaved tree species, Fraxinus mandshurica, Juglans mandshurica and Phellodendron amurense in the Maoershan area were collected through investigation and consulting data. And the suitability distribution of three precious hardwood broad-leaved tree species in Maoershan area was studied by using GIS technology and random forest model, combined with the topographic and soil data of the target tree species subcompartment. Results showed that, the accuracy rates of the random forest models in the ten datasets were all above 70%. When Ntree(number of trees grown)=500, the average accuracy of the random forest model was 75.2%; when Ntree=1 000, the average accuracy of the random forest model was 75.4%, and the AUC of the group datasets were all above 0.7, and the average AUC was 0.746. In the ten datasets, mean decrease accuracy and mean decrease Gini of altitude were the largest, mean decrease accuracy of slope position was the smallest, and mean decrease Gini of landform was the smallest. The target tree species had the highest growth suitability within the altitude range of 200-300 m. As the altitude increased above 300 m, the growth suitability of the target tree species was lower as the altitude increased. When the slope was 0°-10° and 30°-35°, the growth suitability was the highest in the range. As the slope position changed from top to bottom, the growth suitability of the target tree species was getting higher and higher. The growth suitability in the three directions of southwest, south and north was the highest. The growth suitability was highest in plain areas. When A layer (eluvial horizon) thickness was greater than 15 cm, the growth suitability of the target tree species became higher and higher. When AB layer (eluvial horizon and deposition layer) thickness was in the range of 10-25 cm, the growth of the target tree species was the most suitable. The order of affecting environmental factors importance sorting of the suitability distribution of the three precious hardwood broad-leaved tree species in the Maoershan area was altitude, AB layer thickness, slope, slope aspect, A layer thickness, landform and slope position in descending order. They were mainly suitable for distribution in the southern and northwestern areas of Maoer Mountain, with an altitude of 200-300 m, a gentle slope, a soil layer thickness of 15-25 cm, a north-south aspect, a plain landform, and a downhill position.
Keywords:Random forest model; hardwood broad-leaved tree species; suitability evaluation; importance ranking; machine learning
基金项目:中央高校基本科研业务费专项资金项目(2572021DT07)
第一作者简介:宋长江,硕士研究生。研究方向为森林可持续经营。E-mail: 2294256769@qq.com
*通信作者:刘兆刚,博士,教授。研究方向为森林可持续经营。E-mail: lzg19700602@163.com
0 引言
水曲柳(Fraxinus mandshurica)、黄菠萝(Phellodendron amurense)和胡桃楸(Juglans mandshurica)是中国东北地区珍贵的3大硬阔叶树种,其木材坚硬致密,纹理美观,具有很高的经济价值和生态价值[1-2],本研究主要目标是研究水曲柳、胡桃楸、黄菠萝3大珍贵硬阔叶树种的适宜性分布区域,其研究地区位于东北林业大学帽儿山实验林场,该地区平均海拔300 m,属温带大陆性季风气候,地带性土壤为暗棕壤,植被属长白植物区系[3-5]。因为树木的生长是多种因素的综合作用,所以如何科学地对3大珍贵硬阔叶树种进行适地适树地种植非常重要。
树种的生长首先在于与周边环境的适宜程度,通过分析树种与环境因子之间的关系来判断该树种的适宜性分布区域,目前在方法的选择上,逐步从定性的经验总结向定量的数学模型方法靠近,比如使用随机森林模型来进行拟合研究。在国外,Kumar等[6]研究美国不同地区不同树种的发生和生长性能,完成了现有树木范围的适宜性地图;Toledo-Aceves等[7]选取62块样地,研究了凤梨科植物在墨西哥韦拉克地区的树种适宜性;Murgante等[8]利用灰色关联分析法确定评价因子权重,并通过GIS技术研究红枫适宜性。在国内,陈艳瑞等[9]以新疆准噶尔南缘为研究区,采用指数和法评价水曲柳、夏橡等树种适宜性;尚雪等[10]通过遥感技术并结合GIS技术对川产道地药材羌活的适宜性空间分布进行研究;赵文龙等[11]利用最大熵模型研究不同基原的中药川贝母生境适宜性分布。
随机森林模型本质为集成学习的一种,可用于回归和分类,是以决策树為基础的更高级的算法模型。随机森林模型是以随机的模式构建一个由许多相互不关联的决策树组成的森林,通过建立n个模型的组合来解决单一问题。随机森林模型从首次被提出至今,被许多学者在诸多领域展开应用,并且有了优秀的表现。Peters等[12]采用随机森林模型,研究比利时地区11种水生植物的潜在地理分布格局;Maxwell等 [13]通过随机森林模型,绘制了基于地形变量西弗吉尼亚州森林沼泽湿地产生的概率;Sahragard等[14]运用随机森林模型模拟预测牧区植物的生境适宜性;Cutler等[15]基于随机森林模型研究罕见地衣植物入侵,得到了高精度的分类结果;沈师濛[16]基于随机森林模型对杉木、桉树和青冈3种国家储备林树种进行了分布预测与适宜性评价;蒋育昊[17]在全国范围内利用随机森林模型预测红松的潜在分布,并对辽宁省内红松进行适宜性评价研究;汪康宁等[18]通过随机森林算法,利用地面蓄积量采样点数据,建立凉水自然保护区蓄积量反演模型;姚雄等[19]使用随机森林算法构建了林地叶面积指数估算模型;高若楠等[20]利用随机森林回归算法,建立了阔叶、蒙古栎混交林及针阔混交林的立地质量评价模型,并且对不同立地条件下的造林地进行了生产潜力预测。本研究以帽儿山地区3大硬阔叶树种的空间分布数据、土壤数据和地形数据为基础,采用随机森林模型和GIS空间分析技术开展该树种(组)的适宜性分布研究,为3大硬阔叶树种可持续经营提供参考依据。
1 研究区域概况
东北林业大学帽儿山林场位于黑龙江省尚志市境内,距哈尔滨市主城区80 km,属长白山系张广才岭西坡小岭的余脉,地理坐标范围为127°29′~127°44′ E, 45°14′~45°29′ N,林场总面积26 496 hm2,有301国道和帽儿山火车站,交通非常便利。地貌属低山丘陵区,平均海拔300 m,地势由南向北逐渐升高,最高山峰为帽儿山,海拔805 m。帽儿山地区为温带湿润地区,属大陆性季风气候,年平均气温2.8 ℃,年降水量为723 mm,降雨主要集中于7-8月份。植被属长白植物区系,原始地带性顶级群落为红松阔叶林,但经多年无序采伐,原始植被发生了逆向演替,已退化为典型的阔叶次生林。森林覆盖率约为80%,森林总蓄积量为3 500 000 m3。
2 研究方法
2.1 数据来源与处理
本研究数据来源于东北林业大学帽儿山林场二类调查数据,共计2 510条数据,包含林层、地类、权属、面积、散生木、郁闭度、组成树种、树种结构、优势树种、地形地貌、土壤类型、植被类型、灾害类型、林层结构和小班蓄积量等信息。提取的信息主要包括坡度、坡位、坡向、海拔、地貌、A层(淋溶层)厚度和AB层(淋溶层和淀积层)厚度。使用caret包,将数据分为10组,分别为A1—A10,其基本特征见表1。
从地形数据中获取地形因子,主要包括经纬度、海拔、坡度、坡位、坡向、坡形、坡长及地形起伏度等因子,本研究使用海拔、坡度、坡位、坡向和地貌共5种基本因子。地形因子通过改变土壤、水文和光照等自然条件间接作用于树木,从而影响树木的生长发育与空间分布。其中,海拔会影响降雨量、土壤pH和空气湿度等因素;坡度会影响土壤侵蚀强度、土壤有机质和土壤含水量等因素;并且坡度还会同坡向、坡位一起影响日照时数、辐射强度,从而间接作用于土壤理化性质。从土壤数据中获取土壤因子,土壤因子主要包括A层厚度、AB层厚度,这2个土壤因子会直接影响到泥土中水、气的含量以及植被需要的养分含量,同时也会影响根系的成长以及树木抗风能力,对树种组成、林木生长和林地生产力等都有一定的作用。帽儿山地区坡度、坡位、海拔和坡向的空间分布如图1所示。
2.2 研究方法
2.2.1 模型建立
随机森林算法是以决策树为基学习器,将最初的许多弱学习机形成强学习机。算法的处理过程类似Bagging的扩展变体,倘若存在n个特征数为m的样本案例,需要运用Bootstrap完成數据集的采样工作,每次随机抽取的n个样本当作每棵决策树的训练数据集。在节点处随机抽取m个变量,在此过程中寻找可以用于划分的最优预测属性;随后,在不进行剪枝的情况下,形成单棵决策树;最终,将从每棵决策树中获得分类预测结果。如果是回归问题,最终的预测结果是全部预测结果的平均值或者加权平均数值;如果是分类问题,最后的预测结果是预测类别众数。
1)环境因子的共线性诊断。虽然多重共线性并不影响随机森林模型的预测能力,但是会影响数据的解释性。随机森林可以给出特征因子的重要性,但多重共线性会对其产生影响,具体来说就是具有多重共线性的特征因子的重要性会相互抵消。
2)划分训练集与测试集。为了评估随机森林算法的区分度、稳定性和准确性等模型效果,往往会将样本拆分为训练集和测试集,本研究使用K折交叉验证法,K折交叉验证法主要是将训练集数据划分为K份,利用其中的K-1份用来训练,1份用来测试,最后取平均测试误差作为泛化误差。这样做的好处是,训练集的所有样本都必然会成为训练数据同时也必然有机会成为一次测试集,可以更好地利用训练集数据。
利用从二类调查数据提取的目标树种小班地形数据中的坡度、坡位、坡向、海拔、地貌、目标树种小班土壤数据中的A层厚度和AB层厚度共7种环境因子,将这些环境因子作为建立随机森林模型的自变量;利用水曲柳、黄菠萝和胡桃楸3大目标树种分布数据以及非目标树种分布数据汇总成数据集,其中有目标树种分布的点标记为1,没有目标树种分布的点标记为0,以此来作为建立随机森林模型的因变量来建立随机森林模型。主要建模过程通过R语言的randomForest包完成。
2.2.2 模型拟合与检验
建立随机森林模型时,A1—A10每组数据分别做一次测试集,其余组数据即为训练集,例如将A1作为测试集时,A2—A10即为训练集。建立随机森林模型具体步骤如下:由于建立模型所需的试验数据中有7个环境因子和2 259条分布数据,在2 259条分布数据中进行随机抽取(有放回),得到Ntree(森林中决策树的数量)个样本,作为样本集,然后可以得到Ntree棵决策树。通常情况下Ntree默认为500,但Grimm等[21]研究发现,当Ntree=1 000时,模型误差曲线最小且稳定,因此为了获得更精确的模型结果,本研究首先选取Ntree=500与Ntree=1 000进行建模。其次每棵决策树在进行节点分列时随机选取Mtry(在每个节点上为分裂采样的预测数)个环境因子,由于本研究使用7个环境因子,所以将Mtry赋值为2进行最合理的分解组合。最后,随机森林模型由Ntree棵决策树组成,Ntree棵决策树获得的分类结果中的众数即为最后的试验结果。一些经过Ntree次抽样后依然没有被抽到的数据,就会自动组成测试数据,从而对随机森林模型的样本精度进行测试,这些数据又被称为袋外数据(Out of Bag, OOB),OOB展示了随机森林模型的错误率。模型建立成功后,利用测试集对训练集进行预测检验,将预测结果数据与实际结果数据进行比对,得出每个模型具体的准确率。通过10组数据集的随机森林模型来绘制受试者工作特征(ROC)曲线,ROC曲线是用来查出分类器在某个阈值时对样本的识别能力,有利于对随机森林模型的拟合程度进行检验,在试验中使用ROC曲线,曲线越是靠近左上角,试验的伪阳性率(False Positive Rate,FPR)越高和越低,即灵敏度越高,误判率越低,则诊断方法的性能越好。在ROC曲线最靠近左上角的点,这个点为最佳临界点,点上有最佳临界值即为AUC值,AUC值越大,分类正确率越高。
3 结果与分析
3.1 随机森林模型
使用R语言中car包,计算膨胀因子法(VIF)对数据进行共线性诊断,在7个自变量中VIF最大值为1.540 3,远小于10,因此因子间不存在多重共线性(表2)。十折交叉验证结果表明,10组数据集随机森林模型的准确率均大于70%(表3),且当Ntree=500时随机森林模型的平均准确率为75.2%;当Ntree=1 000时随机森林模型的平均准确率为75.4%,表明随机森林模型预测准确率良好。
经过计算得出10组数据集所建立的随机森林模型ROC曲线AUC均值为0.746,其中A1最大,为0.778;A4最小,为0.709(表4)。
3.2 环境因子重要性排序
通过10组数据集的随机森林模型来输出影响帽儿山地区3大珍贵硬阔叶树种的环境因子重要性排序,见表5。平均降低精度(Mean Decrease Accuracy, MDA)与平均降低基尼系数(Mean Decrease Gini, MDG)是判断因子重要性的重要指标,其中MDA代表随机森林模型预测准确性程度,数值大小与环境因子的重要性成正比关系;MDG则是代表分类树上的节点观测值与环境因子的异质性影响,进而比较环境因子的重要性,数值大小也与环境因子的重要性成正比关系。综合10组试验结果得出影响目标树种适宜性生长的环境因子重要性排序由高到低依次为海拔、AB土层厚度、坡度、坡向、A层厚度、地貌和坡位。
3.3 环境因子的部分依赖图
通过10组数据集的随机森林模型,利用R语言中的rfUtilities包来输出影响帽儿山地区3大珍贵硬阔叶树种的环境因子部分依赖图,如图2所示。部分依赖图会展示1个或2个特征对模型预测的边际效应,本研究通过观察特征和预测目标之间的一维或二维关系图确定特征与目标的关系,即保持其他所有特征不变,哪个特征对留存的提升影响最大,通过对图2的分析从而得出目标树种的适宜性分布环境。在海拔200 ~300 m范围内最适宜目标树种的生长,在海拔高于300 m之后随着海拔的升高,目标树种生长的适宜性越低。在坡度为0°~10°与30°~35°这2个范围内最适宜目标树种的生长,在坡度为15°~25°范围内目标树种的生长适宜性很低。图2(c)通过分析可得出目标树种随着坡位由上到下的变化,生长适宜性越来越高。图2(d)通过分析可得出目标树种在西南、南、北这3个方位的生长适宜性最高,在东北方位的生长适应性最低。图2(e)通过分析可得出在平原地区的生长适宜性最高,在丘陵和山地地区的生长适宜性适中,在低山地区的生长适宜性最低。在A层厚度大于15 cm之后目标树种的生长适宜性越来越高,在5~10 cm的厚度范围内生长的适宜性很低。当AB层厚度在10~25 cm范围内最适宜目标树种的生长,在厚度超过25 cm后目标树种的适宜性迅速降低。综合以上因素,在ArcGIS中绘制帽儿山地区珍贵硬阔叶树种分布,如图3所示。从图3可以看出帽儿山地区不同区域下珍贵硬阔叶树种分布适宜性,珍贵硬阔叶树种适宜分布区总面积为10 421.31 hm2,占帽儿山实验林场总面积的39.39%,其中珍贵硬阔叶树种分布最优适宜区、次适宜区、一般适宜区面积分别为97.06、7 293.64和3 030.61 hm2。珍贵硬阔叶树种适宜分布区呈镶嵌分布,主要分布在帽儿山北部,并且适宜分布区从北至南面积逐渐减少,但最优适宜区主要位于帽儿山中部区域,可能是由于海拔的影响。
4 结论
本研究以东北林业大学帽儿山林场作为研究区,以水曲柳、胡桃楸和黄菠萝3大珍贵硬阔叶树种作为研究对象。利用二类调查数据,以目标树种分布小班地形数据和目标树种分布小班土壤数据作為输入因子,以目标树种分布数据作为输出因子,建立基于随机森林模型的目标树种适宜性评价体系。主要利用坡度、坡位、坡向、海拔、地貌、A层厚度和AB层厚度共7种环境因子构建随机森林模型,输出影响目标树种适宜性生长的环境因子重要性排序,根据随机森林模型输出的局部依赖图进行分析,从而得出影响帽儿山地区珍贵硬阔叶树种适宜性分布的影响机制。主要结论如下。
1)综合随机森林模型的结果,对于影响帽儿山地区的3大珍贵硬阔叶树种适宜性分布的环境因子重要性排序由高到低依次为海拔、土层厚度、坡度、坡向、A层厚度、地貌和坡位。海拔、土层厚度和坡度3种环境因子对3大珍贵硬阔叶树种的适宜性分布影响最大。
2)综合具体环境因子的部分依赖图,帽儿山地区的3大珍贵硬阔叶树种适宜分布在海拔200~300 m、坡度平缓、土层厚度在15~25 cm、坡向为南北方向、地貌为平原、坡位为下坡位的地区。
3)根据东北林业大学帽儿山林场地图,结合具体的环境影响因素,得出帽儿山地区3大珍贵硬阔叶树种适宜生长的分布区域为帽儿山的南部和西北部地区,不适宜树种分布的区域为帽儿山地区的东北部地区。
【参 考 文 献】
[1]舒兰,刘兆刚,董灵波.帽儿山天然次生林内主要木本植物空间格局及更新特点[J].应用生态学报,2019,30(6):1945-1955.
SHU L, LIU Z G, DONG L B. Spatial pattern and regeneration characteristics of main woody species in natural secondary forest in Maoershan, Northeast China[J]. Chinese Journal of Applied Ecology, 2019, 30(6): 1945-1955.
[2]魏红洋,张一帆,董灵波,等.帽儿山主要林分类型空间结构状态综合评价[J].中南林业科技大学学报,2021,41(10):131-139.
WEI H Y, ZHANG Y F, DONG L B, et al. Comprehensive evaluation of spatial structure state for the main forest types in Maoershan Mountain[J]. Journal of Central South University of Forestry & Technology, 2021, 41(10): 131-139.
[3]袁志聪.人工智能:随机森林技术分析[J].科技创新与应用,2020(6):151-152.
YUAN Z C. Artificial intelligence: analysis of random forest technology[J]. Technology Innovation and Application, 2020(6): 151-152.
[4]方匡南,吴见彬,朱建平,等.随机森林方法研究综述[J].统计与信息论坛,2011,26(3):32-38.
FANG K N, WU J B, ZHU J P, et al. A review of technologies on random forests[J]. Statistics & Information Forum, 2011, 26(3): 32-38.
[5]董师师,黄哲学.随机森林理论浅析[J].集成技术,2013,2(1):1-7.
DONG S S, HUANG Z X. A brief theoretical overview of random forests[J]. Journal of Integration Technology, 2013, 2(1): 1-7.
[6] KUMAR J, HARBROVE W, HOFFMAN F M, et al. Imputation of continuous tree suitability over the continental United States from sparse measurements using associative clustering[C]// 98th ESA Annual Convention 2013, 2013.
[7]TOLEDO-ACEVES T, GARCIA-FRANCO J G, FLORES-PALACIOS A. Do cloud forest tree species differ in their suitability as a substrate for epiphytic bromeliads?[J]. Plant Ecology, 2017, 218(5): 541-546.
[8]MURGANTE B, GUISEPPE L C. GIS and red maple for the land suitability analysis[J]. Lecture Note in Computer Science, 2001, 25(3): 536-545.
[9]陈艳瑞,刘康,陈启民,等.准噶尔盆地南缘防护林树种适宜性评价[J].干旱区资源与环境,2011,25(11):152-156.
CHEN Y R, LIU K, CHEN Q M, et al. Suitability evaluation on trees species of shelter belt on the southern edge of Xinjiang Junggar Basin[J]. Journal of Arid Land Resources and Environment, 2011, 25(11): 152-156.
[10]尚雪,董丽君,文路军,等.基于遥感与GIS技术的四川省羌活资源适宜性分布研究[J].中国中药杂志,2015,40(13):2553-2558.
SHANG X, DONG L J, WEN L J, et al. Study on suitable distribution areas of Notopterygium incisum in Sichuan Province based on remote sensing and GIS[J]. China Journal of Chinese Materia Medica, 2015, 40(13): 2553-2558.
[11]赵文龙,陈红刚,林丽,等.不同基原的中药川贝母生境适宜性分布[J].生态学杂志,2018,37(4):1037-1042.
ZHAO W L, CHEN H G, LIN L, et al. Distribution of habitat suitability for different sources of Fritillariae cirrhosae Bulbus[J]. Chinese Journal of Ecology, 2018, 37(4): 1037-1042.
[12]PETERS J, DE BAETS B, VERHOEST N E C, et al. Random forests as a tool for ecohydrological distribution modelling[J]. Ecological Modelling, 2007, 207(2/3/4): 304-318.
[13]MAXWELL A E, WARNER T A, STRAGER M P. Predicting palustrine wetland probability using random forest machine learning and digital elevation data-derived terrain variables[J]. Photogrammetric Engineering & Remote Sensing, 2016, 82(6): 437-447.
[14]SAHRAGARD H P, AJORLO M, KARAMI P. Modeling habitat suitability of range plant species using random forest method in arid mountainous rangelands[J]. Journal of Mountain Science, 2018, 15(10): 2159-2171.
[15]CUTLER D R, EDWARDS T C JR, BEARD K H, et al. Random forests for classification in ecology[J]. Ecology, 2007, 88(11): 2783-2792.
[16]沈師濛.基于随机森林模型的国家储备林树种分布预测与评价:以贵州省册亨县为例[D].北京:北京林业大学,2019.
SHEN S M. Prediction and evaluation of tree species distribution in national reserve forest based on stochastic forest model-a case study of Ceheng County, Guizhou Province[D]. Beijing: Beijing Forestry University, 2019.
[17]蒋育昊.基于随机森林模型的红松潜在分布预测及适宜性评价[D].北京:中国林业科学研究院,2017.
JIANG Y H. Potential distribution prediction and suitability evaluation of Korean pine based on random forest model[D]. Beijing: Chinese Academy of Forestry, 2017.
[18]汪康宁,马婷,吕杰.基于随机森林算法的凉水自然保护区蓄积量反演研究[J].西南林业大学学报,2016,36(5):125-129,157.
WANG K N, MA T, LYU J. Stock volume estimation research based on random forest algorithm in Liangshui nature reserve[J]. Journal of Southwest Forestry University, 2016, 36(5): 125-129, 157.
[19]姚雄,余坤勇,杨玉洁,等.基于随机森林模型的林地叶面积指数遥感估算[J].农业机械学报,2017,48(5):159-166.
YAO X, YU K Y, YANG Y J, et al. Estimation of forest leaf area index based on random forest model and remote sensing data[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(5): 159-166.
[20]高若楠,谢阳生,雷相东,等.基于随机森林模型的天然林立地生产力预测研究[J].中南林业科技大学学报,2019,39(4):39-46.
GAO R N, XIE Y S, LEI X D, et al. Study on prediction of natural forest productivity based on random forest model[J]. Journal of Central South University of Forestry & Technology, 2019, 39(4): 39-46.
[21]GRIMM R, BEHRENS T, MARKER M, et al. Soil organic carbon concentrations and stocks on Barro Colorado Island - digital soil mapping using Random Forests analysis[J]. Geoderma, 2008, 146(1/2): 102-113. .