广东省森林覆盖率的影响因素分析和模型预测
——基于灰色关联分析和GM(1,1)模型*

2017-10-28 05:43陈哲华杨超裕邓冬旺李志华
林业与环境科学 2017年5期
关键词:覆盖率关联度灰色

陈哲华 杨超裕 邓冬旺 李志华

(1.广东省林业调查规划院,广东 广州 510520;2.湖南省农林工业勘察设计研究总院,湖南 长沙 410007)

广东省森林覆盖率的影响因素分析和模型预测
——基于灰色关联分析和GM(1,1)模型*

陈哲华1杨超裕1邓冬旺1李志华2

(1.广东省林业调查规划院,广东 广州 510520;2.湖南省农林工业勘察设计研究总院,湖南 长沙 410007)

基于2005—2015年广东省森林覆盖率的原始数据,选取年平均气温、降水量、年日照时数、有林地面积、活立木蓄积量、林业产值、造林面积及育苗面积8个指标对森林覆盖率的影响要素进行灰色关联度分析。分析结果显示,关联度最大的3项因素依次是:有林地面积0.993 4、年平均气温0.992 1、年降水量0.973 2。为验证森林覆盖率灰色系统预测模型的适用性性,根据2005—2010年的森林覆盖率数据,分别建立GM(1,1)模型、多项式回归模型和Logistic回归模型,对2011—2016年的森林覆盖率进行预测,并与实际值进行比较,3个模型的预测相对误差平均值依次是0.69%、1.08%、1.28%。结果表明在获取的年份数据较少时,采用灰色系统森林覆盖率预测模型精度高于多项式回归模型和Logistic回归模型,预测适用性更优。

森林覆盖率;灰色关联度;灰色系统;GM(1,1)模型;多项式回归模型;Logistic回归模型

森林资源是生态文明建设的物质基础,是社会经济持续发展的前提和保证。保护和管理好森林资源,对于发展现代林业、推进生态文明建设、促进经济社会可持续发展和构建和谐社会均具有十分重要的意义。《广东省林业厅关于2015年度全省森林资源情况的通报》显示,至2015年底,广东省林业用地面积1 095.89万hm2,森林蓄积量达5.61亿m3,森林覆盖率达58.88%。森林覆盖率是森林资源丰富程度及实现绿化程度的重要指标,还是确定森林经营规划和实施开发利用政策的重要依据。森林覆盖率的消长变化与年平均气温、年降水量、年日照时数、有林地面积、活立木蓄积量、林业产值、造林面积及育苗面积等因素有关。这些因素对森林覆盖率变化影响大小不同,在系统分析时需要确定各因素的“贡献率”大小。

当前我国对森林资源趋势的灰色预测取得了一定的成果,研究区域主要集中在东北三省[1-3]及华南地区的几个省份[4-7]。然而,运用灰色关联度分析及GM(1,1)模型对广东省的森林覆盖率进行影响因素分析和预测的文献却很少。本文运用灰色系统理论中灰色关联度分析得出森林覆盖率的主要影响因素,比较不同影响因素与森林覆盖率之间的关联程度;并建立森林覆盖率灰色系统的预测模型,与多项式拟合模型和Logistic回归模型的预测适用性进行比较,为森林资源的科学预测提供参考。

1 研究区域与方法

1.1 研究区概况

广东省地处中国大陆最南部,东邻福建省,北接江西省、湖南省,西连广西壮族自治区,南临南海,珠江口东西两侧分别与香港特别行政区、澳门特别行政区接壤,西南部雷州半岛隔琼州海峡与海南省相望。全境位于 20°09′~25°31′ N 和109°45′~117°20′ E 之间。根据 2015 年度土地变更调查,全省陆地面积为1 797万hm2,约占全国陆地面积的1.87%,在各省陆地面积排名第15位。

广东省光、热、水资源丰富,四季常青,植物种类繁多,全省有维管束植物289科、2 051属、7 717种,其中野生植物 6 135种,栽培植物 1 582种。植被类型中,有属于地带性植被的北热带季雨林、南亚热带季风常绿阔叶林、中亚热带典型常绿阔叶林和沿海的热带红树林,还有非纬度地带性的常绿—落叶阔叶混交林、常绿针—阔叶混交林、常绿针叶林、竹林、灌丛和草坡[8]。

1.2 研究方法

1.2.1 灰色关联度分析模型 关联度是表征两个事物的关联程度,关联度分析是灰色系统分析、评价和决策的基础。灰色关联度分析是多因素统计分析方法,用灰色关联度来描述因素间关系的强弱、大小和次序[9]。如果两种要素变化的态势基本一致,则他们之间的关联度较大,反之,关联度较小。分析步骤如下。

(1)确定参考序列 本文选取森林覆盖率为参考数列,其他要素为比较数列。参考数列常记为X0,一般表示为:

(2)对于一个参考数列X0和比较数列Xi,可用下述关系表示各比较曲线与参考曲线各点的差:

式中,ζi(k)为比较数列Xi对参考数列X0在k时刻的关联系数,其中ρ∈[0,+∞)为分辨系数,引入分辨系数的目的在于减少极值对计算的影响。一般ρ的取值区间为[0,1],具体取值可视情况而定,ρ越小,分辨力越大,本文取ρ=0.5。

(3)原始数据处理 各因素原始数据存在量纲和数量级的差距,通过无量纲化处理,便于不同要素序列的比较。

(4)关联度的计算和比较 关联系数只表示各时刻数据间的关联程度,为了便于比较,取各个时刻关联系数的平均作为关联度,对问题进行因素分析和比较。

1.2.2 灰色系统GM(1,1)模型 灰色系统理论以部分信息已知、信息未知的小数据、贫信息不确定性系统为研究对象,通过对部分已知信息的生成、开发,提取有价值的信息,实现对系统运行行为、演化规律的正确描述,进而实现对其变化的定量预测[10]。基于灰色系统对原始数据连续度和规律性要求不高,适合森林覆盖率数据量较少时用来建立预测模型。其中灰色系统GM(1,1)模型反映的是一个变量对时间的一阶微分函数,其相应的微分方程为:

式中x(1)为经过一次累加生成的数列;t为时间;a,u为待估参数,分别称为发展灰数和内生控制灰数。

(1)建立一次累加生成数列 设原始数列为:

按下述方法做一次累加,得到生成数列(n为样本空间):

(2)利用最小二乘法求参数a、u。设

参数辨识a、u:

(3)求出GM(1,1)的模型:

1.2.3 多项式回归模型和Logistic回归模型 为了体现GM(1,1)模型在预测森林覆盖率时的适用性,考虑加入多项式回归模型和Logistic回归模型进行比较分析。

(1)多项式回归模型 当两个变量呈曲线关系式,需用曲线来拟合确定变量间的数学关系[11]。采用多项式回归模型预测时,就是建立森林覆盖率与年度的函数关系:

式中x、y为变量;a、b为参数;p为多项式阶次。根据2005—2010年的森林覆盖率数据,利用最小二乘法求出上式中的各项参数,从而建立多项式回归方程,对2011—2016年的森林覆盖率进行预测。

(2)Logistic回归模型 Logistic回归模型是广义线性回归模型中的一种,因此与多重线性回归分析有很多相同之处,它们的原理相同,模型形式基本相同,因此设置Logistic函数:

yi=a×exp{[ln(xi)-b]2/c},i=1,2,…,n ,式中x、y为变量;a、b、c为参数。

1.3 指标选取和数据来源

基于数据的可获得性和完整性,遵循设计指标的科学性原则、可操作性原则,结合广东省实际,本文选取年平均气温、年降水量、年日照时数、有林地面积、活立木蓄积量、林业产值、造林面积及育苗面积作为灰色分析指标。指标数据来自2006—2016年的《广东省农村统计年鉴》[12]、《广东统计年鉴》[13]的相关数据,统计数据见表1。

表1 2005-2015年广东省森林覆盖率的灰色分析原始数据

续表1

2 结果与分析

2.1 广东省森林覆盖率的灰色分析

经过计算得到森林覆盖率和8个因素的关联结果(表2),从关联度大小可知,8个因素中对广东省2005—2015年森林覆盖率影响关系最大的是有林地面积,其次是年平均气温、年降水量、年日照时数。

表2 2005-2015年广东省森林覆盖率与影响要素的关联度

林地资源是森林赖以生存和发展的基础,森林覆盖率反映一个国家或地区森林面积占有情况或森林资源丰富程度及实现绿化程度的指标。有林地面积即森林面积,森林覆盖率是森林面积占土地面积的百分比,因此在土地面积不变的情况下,有林地面积直接决定了森林覆盖率的大小。其次,广东省地处我国南部,属亚热带季风气候区,陆地自南至北横跨北热带,南亚热带和中亚热带。热量资源丰富,气候温暖,各地年平均温度在20.4~23.1 ℃之间;全年日照为 1 500~2 100 h;雨量充沛,年降水量在 1 500~2 500 mm 之间。广东省的气候特点使这里成为全国光、热、水资源最丰富的地区,涵养了森林资源,有利于林木的生长。因此,年平均气温、年降水量、年日照时数也是影响森林覆盖率的主要因素,水热条件的综合作用,使得境内植被呈典型的水平地带性分布:北部南岭地区的典型植被为亚热带山地常绿阔叶林,中部为亚热带常绿季雨林,南部为热带常绿季雨林。另一方面,当年的林业产值、造林面积与森林覆盖率的关联度则相对较小,从实际分析,由于早年对林业产业的投入不足以及对植树造林的意识薄弱,导致这两个指标值在2005—2009年间较低,与2011年后的指标值有较大的差异;从理论上分析,统计森林覆盖率是指郁闭度0.2以上的乔木林地面积和竹林地面积,一般情况下当年造林尚未成林,不计入森林覆盖率计算,因此造林面积对森林覆盖率影响较小。

2.2 灰色模型检验

为了进一步验证森林覆盖率灰色系统预测模型的可行性,本文取2005—2010年的森林覆盖率数据作为样本,预测2011—2016年的森林覆盖率,并与实测值进行比较,评价预测模型效果。建立GM(1,1)模型,根据前面公式计算得到模型中的发展灰数a=-0.0046,内生控制灰数u=55.5364。-a<0.3,模型可用于中长期预测。计算得到模拟还原值,分别计算其与实际森林覆盖率的残差,计算结果见表3。相对误差取绝对值后计算得到平均相对误差为0.11%,精度较高。

表3 森林覆盖率实际值与模拟值残差

对GM(1,1)模型进行后验差精度检验。在检验过程中,要求后验差比值越小越好,一般要求≤0.45,最大不超过0.65;小误差频率要大,一般不得小于0.7[14],标准参照表4。

表4 后验差精度标准

根据公式:

2.3 模型预测对比

可知GM(1,1)建模的残差较小,预测精度较高并通过均方差比值检验和小误差频率检验,模型可用于预测。采用GM(1,1)模型对2011—2016年的森林覆盖率进行预测,并与实际值进行比较,评价预测模型效果。此外,对同样的样本数据分别采取多项式回归模型预测和Logistic回归模型预测,结果见表5。其中多项式回归模型公式为:

Logistic回归模型公式为:

表5 广东省森林覆盖率灰色系统预测模型比较分析

图1 广东省森林覆盖率3种模型预测结果对比

3 结论与讨论

本文经过关联度计算结果表明,影响森林覆盖率的8个因素中,对广东省2005—2015年森林覆盖率影响起最主要作用的是有林地面积,其次是年平均气温、年降水量、年日照时数;影响作用最小的因素是造林面积。

用GM(1,1)建模,结果显示残差较小,预测精度较高并通过后验差精度检验,模型可用于中长期预测。根据2005—2010年的森林覆盖率数据,分别建立GM(1,1)模型、多项式回归模型和Logistic回归模型,对2011—2016年的森林覆盖率进行预测,并与实际值进行比较,3个模型的预测相对误差平均值依次是0.69%、1.08%、1.28%。结果表明在获取的年份数据较少时,灰色系统森林覆盖率预测模型精度高于多项式回归模型和Logistic回归模型,预测适用性更优。但GM(1,1)模型和任何其它数学模型一样,也有一定的适用范围,超出了适用范围则难以得到理想的结果。当发展灰数-a≤0.3时,GM(1,1)模型可用于中长期预测;当0.3<-a≤0.5时,GM(1,1)模型可用于短期预测,中长期预测慎用;当0.5<-a≤0.8时,GM(1,1)模型作短期预测应十分谨慎;当0.8<-a≤1时,应采用残差修正GM(1,1)模型;当 -a>1时,不宜采用GM(1,1)模型[15]。在实际运用中,应根据实际情况随着观测点的增加不断修正预测模型,及时提高预测精度。

[1] 邱微, 李崧, 赵庆良, 等. 黑龙江省森林覆盖率的灰色评价和模型预测[J]. 哈尔滨工业大学学报, 2007, 39(10):1649-1651.

[2] 黄妍妍, 关凤丽. 基于灰色关联分析的黑龙江省国有林区小城镇建设影响因素实证分析[J]. 东北林业大学学报, 2015, 43(10): 130-134.

[3] 蒋玉超. 辽宁省未来森林覆盖率预测[J]. 山东林业科技,2013, 43(6): 54-56.

[4] 高兆蔚. 福建森林资源发展趋势的灰色预测[J]. 福建林学院学报, 1990, 10(1): 15-22.

[5] 叶绍明, 张丽君. 广西森林资源动态灰色数列预测[J].中南林业调查规划, 1993(2): 9-12.

[6] 徐天蜀. 云南省森林资源发展趋势预测[J]. 林业资源管理, 1999(5): 8-12.

[7] 陈秀龙, 陈磊夫, 莫杏兴, 等. 海南省森林资源发展趋势的灰色预测[J]. 林业调查规划, 2007, 32(3): 35-39.

[8] 广东省人民政府地方志办公室. 广东年鉴[M]. 广州: 广东年鉴社, 2016.

[9] 杜栋, 庞庆华, 吴炎. 现代综合评价方法与案例精选[M].2版. 北京: 清华大学出版社, 2014: 112-113.

[10] 刘思峰, 杨英杰, 吴利丰, 等. 灰色系统理论及其应用[M]. 北京: 科学出版社, 2014: 140-146.

[11] 何振奇, 乔光建. 基于多项式回归模型的枯季径流预报与分析[J]. 南水北调与水利科技, 2010, 8(5): 85-88.

[12] 广东农村统计年鉴编辑委员会. 广东农村统计年鉴[M]. 北京: 中国统计出版社, 2006-2016.

[13] 广东省统计局国家统计局广东调查总队. 广东统计年鉴[M]. 北京: 中国统计出版社, 2006-2016.

[14] 宁宣熙, 刘思峰. 管理预测与决策方法[M]. 北京: 科学出版社, 2009: 113-145.

[15] 刘思峰, 邓聚龙. GM(1,1)模型的适用范围[J]. 系统工程理论与实践, 2000, 20(5): 121-124.

Analysis of Influencing Factors and Model Prediction of Forest Coverage in Guangdong Province: Based on Grey Correlation Analysis and GM (1,1)Model

CHEN Zhehua1YANG Chaoyu1DENG Dongwang1LI Zhihua2

(1.Guangdong Forestry Survey and Planning Institute,Guangzhou,Guangdong 510520,China;2.Hunan Prospecting Designing and Research Institute for Agriculture Forestry and Industry,Changsha,Hunan 410007,China)

Based on the original data of the forest coverage in Guangdong province from 2005 to 2015, eight indicators were selected to analysis the influencing factors on forest coverage through the gray correlation analysis.The indicators were annual average temperature, amount of precipitation, annual sunshine duration, forest land area,standing forest stock, output value of forestry, afforestation area and seedling area. The results showed that the three factors with the highest degree of correlation were: the forest land area (0.993 4), the annual average temperature(0.992 1) and the annual precipitation (0.973 2). In order to verify the adaptability of the gray system forecast model of forest coverage, three models (GM (1,1) model, polynomial regression model, and Logistic regression model)were established based on the original data of forest coverage from 2005 to 2015. The prediction of forest coverage from 2011 to 2016 was compared with the actual value, and the average relative error of the three models was 0.69%,1.08% and 1.28%, respectively. The results showed that, when the annual data was less, the accuracy of the gray system forecast model was higher than that of the polynomial regression model and the Logistic regression model,and its adaptability is more excellent.

forest coverage;grey correlation;grey system;GM(1,1)model; Polynomial regression model;Logistic regression model

S711

A

2096-2053(2017)05-0101-06

*第一作者:陈哲华(1987— ),女,工程师,主要从事林业调查规划,E-mail:walafa@163.com。

猜你喜欢
覆盖率关联度灰色
民政部等16部门:到2025年村级综合服务设施覆盖率超80%
我国全面实施种业振兴行动 农作物良种覆盖率超过96%
浅灰色的小猪
中国制造业产业关联度分析
中国制造业产业关联度分析
沉香挥发性成分与其抗肿瘤活性的灰色关联度分析
灰色时代
她、它的灰色时髦观
感觉
基于喷丸随机模型的表面覆盖率计算方法