顾及空间自相关的农作物面积空间抽样研究进展

2018-10-24 07:15仲格吉周清波
中国农业信息 2018年3期
关键词:农作物面积效率

仲格吉,周清波,王 迪

(农业农村部农业遥感重点实验室/中国农业科学院农业资源与农业区划研究所,北京 100081)

0 前言

我国是农业生产大国,粮食作物的播种面积、产量等信息更是国家制定粮食政策和经济计划的重要依据。长期以来,我国耕地和农作物播种面积等重要农业统计数据,主要采用村级起报、逐级汇总上报的全面统计(国家统计局农调总队,2002;国家统计局社会调查司,2006)方法。在全国范围内开展全面调查方式统计作物种植面积,存在调查工作量庞大、财力和物力耗费高及调查周期长等诸多缺点。抽样技术作为一种非全面统计调查技术,因具有节省调查费用、缩短调查周期及改善调查数据质量等优点得以在社会经济调查中被广泛使用。随着“3S”技术的发展,传统抽样方法与“3S”技术相结合的空间抽样方法逐渐被应用到大区域农作物面积的监测、估计及耕地与森林变化监测等领域中[1-3]。

近年来,国内外学者在利用空间抽样方法进行农作物面积估计方面进行了相关研究[4-9],选用的抽样方法包括分层抽样、整群抽样和多阶段抽样,涉及的农作物类型主要有小麦、玉米、水稻及棉花。

尽管基于传统抽样方法与“3S”技术相结合的空间抽样方法有效解决了全面统计调查中存在的问题,但是传统抽样方法是建立在研究纯随机变量变化规律的经典统计学理论基础上,要求抽样单元间需满足相互独立原则[10-11]。农作物由于受自然条件(气候、土壤类型、地形地貌等)、社会经济等因素的影响,在空间分布上并不完全具有独立性和随机性,而是存在一定程度的空间自相关性。关于农作物种植面积调查单元在空间分布上的自相关性对空间抽样外推总体的效率(抽样精度和抽样费用)是否有影响、影响程度及如何影响等一系列问题,目前国内外的相关研究明显不足,尚不能科学解释当抽样单元存在空间自相关性时,空间抽样调查效率的变化特征与规律,从而影响了空间抽样方法在国家尺度范围内的进一步推广与应用。

针对以上存在的问题,本文从空间自相关性的科学内涵、研究方法和基本特征出发,对国内外专家学者在空间自相关领域的研究进展进行了系统梳理,总结了国内外关于空间自相关性的抽样调查与空间自相关性对抽样效率产生影响的研究进展,讨论了当前我国农作物面积空间抽样调查中存在的问题,并从空间自相关性对农作物面积空间抽样调查的精度、成本、样本布局和可能产生的影响等方面对农作物空间抽样的应用前景进行了总结与展望。

1 空间自相关性内涵及研究方法

1.1 科学内涵

Tobler于1969年提出的描述地理现象空间作用关系的地理学第一定律指出,“任何事物都是空间相关的,距离近的事物空间相关性大”,即空间数据间存在自相关性[20]。区域化特征或者变量在临近范围内的变化往往表现出对空间位置的依赖关系,即空间自相关性,因此进行空间自相关分析的目的是确定某一变量与其相邻空间单元的属性是否在空间上具有相关性及其相关程度如何[21]。“相邻”的定义,关系到空间权重矩阵的建立,权重的确定主要依据地理特征,如地区边界和距离等,它可以根据多边形邻接标准或距离邻接标准来度量[22-26],不同的研究者对于空间权重矩阵的构建往往存在差异,所以得到的分析结果也不尽相同。确定“相邻”的空间关系之后,进行全局空间自相关分析,依此判断整个区域是否存在空间自相关现象或聚集分布状态[27-29]。

1.2 研究方法

衡量事物间的空间自相关特性可根据不同的数据类型选择不同的空间自相关指数定量表达,常用的自相关指数有全局 Moran’sI、Geary’sC和 Getis-OrdG等,前两者的统计性质与比较方法不同,但都是基于邻近面积单元上变量值的比较,Getis-OrdG指数则为基于距离统计的空间关联指数[22-23]。这3种相关指数都是较常用的空间自相关分析方法,基本原理大致相同,使用范围和侧重点各有不同。张松林[30]、洪国志[31]、陈彦光[32]等学者通过对3种指数进行探讨和对比分析,认为Moran’sI是比较典型且实用性较强的一种方法。

全局Moran’sI指数的取值范围为[-1,1]:小于0表示空间负相关,等于0表示空间不相关或空间随机性,大于0表示空间正相关,值越大表示属性值的空间相关性越强,而无论是正值还是负值,强的空间自相关均意味着近邻对象的属性值高度接近(图1)。C系数的取值范围一般为[0,2]:大于1表示负相关,等于1表示不相关,小于1则表示正相关。

图1 不同Moran’ I值的空间分布模式Fig.1 Schematic diagram of the spatial distribution pattern of different Moran’ I values

对于全局Moran’sI,在获得理论I值的基础上,可构造服从正态分布的统计量Z,以此来检验空间自相关性的显著性[25]。对I值进行Z统计量的显著性检验时,5%/10%显著性水平下的评价标准见表1。

表1 空间自相关性评价标准Table 1 Spatial autocorrelation evaluation criteria

2 空间自相关性及其特征研究进展

自空间自相关的概念提出以来,以 Haining[4]、Anselin[27]、Cliff[33]、Fisher[34]、和Goodchild[35]为代表的众多学者对空间数据的自相关性进行了广泛研究,研究领域主要集中在社会科学、生态环境、土壤、林业与农业等方面。

在社会科学研究领域,已应用于城市环境与气候变迁、健康与疾病及犯罪行为等研究中。如Holmberg和Lundevaller提出了一种检测空间自相关的新方法并使用该方法分析了瑞典老龄人口死亡率的空间自相关性[36]。饶华祥[37]根据疾病发病水平的监测数据存在的时间、空间自相关性的特点,利用Morans’I和Getis-OrdG空间自相关分析技术对青海省肺结核病进行时空分布特征研究,结果表明肺结核年发病率地区的分布存在明显的高发地区聚集倾向。基于中国285个城市的统计数据,Cheng等[5]使用双变量Moran’sI揭示了城市制造业聚集与环境污染之间存在显著的空间自相关性。Zhu等[38]针对柴达木盆地特殊的地理位置和气候特征,以5种环境因子(年降水量、蒸发量、径流量、温度和DEM)为独立自变量、植被覆盖度为因变量建立植被覆盖多元逐步回归模型(MSR)时,引入Moran’sI值计算了根据模型得到的植被覆盖度的空间自相关性,选择了5个因子中与植被覆盖度的相关系数最高的年降雨量与Moran’sI作为自变量构建了最佳植被覆盖度模型。

在森林资源与耕地资源的调查监测中,可以通过对目标样地的参数进行空间自相关分析,揭示森林蓄积量的分布状况和耕地的变化信息。如Gilbert和Lowell利用Moran’sI分析了不同类型的森林群落内存在的空间自相关性,结果表明在高蓄积量的森林群落中存在较强的空间正自相关性,而且空间自相关的探测需要一个空间密度非常大的地面样本点[13]。Overmars等[7]为了克服土地利用多元线性回归模型无法获取土地利用数据中的所有空间自相关性的缺点,采用Moran’sI指数描述了厄瓜多尔土地利用数据集在不同单元尺度下的空间自相关,构建了包含回归和空间自相关的混合回归—空间自相关回归模型(空间滞后模型)。

在农业资源利用研究方面,Ping[14]利用了两种空间自相关性统计指标(Moran’sI和Geary’sC)评价了美国德克萨斯州的棉花产量在干旱和湿润年份的空间相关性,发现在干旱年份研究区的皮棉产量存在一个显著的空间自相关现象。Frutos等[4]使用Moran’sI检测了位于西班牙西北部一个面积为3.84万hm2研究区内黄爪隼的空间分布特征,发现每个方格内的黄爪隼丰度间存在空间自相关,相关距离为4~8 km。张贞等[39]运用Global Moran’sI指数采用空间自相关分析方法得出重庆市合川区丘陵山区水田和旱地质量等级在空间分布上存在极显著空间正相关的结论。

然而,众多研究并不能说明空间自相关性的分析已经趋于完善。实际上,还存在大量的问题需要讨论。不同的地学对象具有其特定的存在与发展形式,空间自相关的存在虽然为我们提供了关于空间格局、结构和过程等一系列有用的信息[40],但是如何运用正确的空间统计方法去分析处理它,是研究空间自相关问题的关键。在农业领域的研究中,针对特定农作物的种植和生长模式,如何根据不同的尺度特征选择合适的权重矩阵与空间自相关统计量以及基于时间滞后问题的空间自相关分析方法的发展等,都值得继续进行分析和探讨。

3 空间自相关性对空间抽样调查效率的影响

虽然传统抽样方法常被用于推断各种目标变量的总体参数,但是这些方法应用的前提是假定抽样单元间相互独立[7,33]。实际上,各种空间数据内经常存在空间自相关现象。以往诸多研究已经表明对空间地物进行抽样调查方案设计时应充分考虑地物间内蕴的空间自相关性[12-15,36]。如果忽略这种空间自相关性,可能会过高估计抽样方差和样本容量,甚至会得到一个错误的结论[41-45]。随着人们对地理空间事物自相关性的深入研究,越来越多的研究者开始认识到传统抽样方法的局限性[4,46],发现研究抽样单元内存在的空间自相关性对于提高空间抽样调查的统计精度,降低调查成本,改善调查效率具有重要意义。

王劲峰[47]等在其编著的《空间抽样与统计推断》一书中明确指出,若不能了解空间相关性特征对抽样方法各个方面的影响作用,就很难制定出科学客观的抽样方案。纵观国内外学者在抽样单元空间自相关性对空间抽样效率的影响方面的研究,其研究对象主要集中在土壤[48-49]、森林[50-54]、生态领域[55]等,对抽样效率的影响大多从抽样精度、样本容量、样方尺寸、分层效率等方面进行分析。如Trangmar[56]以新西兰坎特伯雷平原土壤为例,研究发现在满足相同的精度条件下,考虑抽样单元空间自相关性的空间抽样方法比传统抽样方法所需的样本容量要少。朱静[57]在利用传统抽样方法(简单随机抽样)和空间抽样方法对森林蓄积量进行监测时发现,相对于传统抽样方法而言,融入空间相关性的空间抽样方法外推总体精度更高,且当抽样单元空间相关性越显著时,两种抽样方法之间的外推精度差距就越大。曹志冬等[58]以山东省细小耕地地物面积比例的抽样调查为例,分析了空间自相关性特征对不同分层方式抽样效率的影响。

以往对农作物抽样调查的研究主要集中在遥感与抽样相结合的方案设计方面[59-64]和利用空间抽样技术进行农作物种植面积估计过程中各抽样要素对抽样效率定量化的影响方面[65-67],旨在通过“3S”技术与传统抽样方法相结合来改善抽样调查的精度,降低抽样调查费用,采用的抽样方法包括简单随机、系统抽样、分层抽样、整群抽样及多阶段抽样[57-59,68-70]。王迪等[71]鉴于抽样单元尺寸的合理制定对提高农作物面积空间抽样效率所具有的重要意义,通过分析抽样单元尺寸与其对应的全局自相关指数的相关关系进行样方尺寸初选;在此基础上,以相对误差、变异系数和样本容量为抽样效率评价指标,定量评价了不同样方尺寸下的冬小麦面积空间抽样效率。Jardim和Ribeiro[72]通过改变样本容量和空间布局设计了多种抽样方案,并比较了各种方案的抽样效率。王迪等[73]以正方形网格作为抽样单元,计算了玉米种植面积在不同抽样单元尺度下的空间相关性,选取相关性最弱的网格尺度作为最优抽样单元尺度,利用耕地面积作为分层标志,评价了4种(简单随机、系统等距、分层随机及分层系统等距)抽样方案的空间抽样效率。

以上研究结果均表明,在进行抽样调查方法优化设计的过程中,考虑了抽样单元间空间自相关性的抽样方案,其抽样效率在一定程度上都得到了很大提升,而对于抽样单元间的空间自相关性对抽样效率的影响规律及其定量化评价方法未曾提及。

4 农作物面积空间抽样调查研究进展

抽样是统计调查的常用手段,空间抽样是针对地理分布上具有空间关联性的研究对象的空间抽样,农业遥感空间抽样的目的则是估计大区域内农作物的种植面积。

在国际上,美国最先利用遥感技术进行了农作物种植面积抽样估算,1974年开展的“大面积农作物估产计划”(Large Area Crop Inventory Experiment,LACIE)对美国及世界其他地区小麦面积和总产量进行了估算;随后实施的“农业和资源的空间遥感调查”(Agricultural and Resources Inventory Surveys though Aerospace Remote Sensing,AGRISARS)计划对世界各地多种作物进行了产量预报,并将遥感技术成功地应用于面积框抽样。为实现欧盟地区的农业发展,欧盟在1987年发起农业遥感监测项目(Monitoring Agriculture with Remote Sensing,MARS),其中2个行动(行动A:区域农作物面积清查行动;行动B:农作物面积快速变化估计行动)均涉及农作物面积空间抽样调查。Pradhan等通过GIS、遥感和面积框抽样方法的联合应用,设计开发了一套地理信息系统用于伊朗哈马丹省的农作物面积空间抽样调查业务。这些研究均采用传统抽样与“3S”技术相结合的方法对大区域的农作物面积进行监测,有效地提高了农作物面积信息的获取精度与时效性[12-16]。法国、德国、加拿大、泰国等也相继开展了对小麦、水稻、玉米等主要粮食作物种植面积的遥感抽样估算[17]。

国内作物面积抽样研究主要集中在传统抽样方法应用方面。如周华茂等[18]应用遥感与抽样技术相结合,建立了一套适合我国南方水稻播种面积的抽样调查体系,但该方法在样方布设及尺寸选取方面存在对样本空间相关性考虑不足的问题。也有学者将多种抽样方法联合应用,如吴炳方和李强子[19]提出基于作物种植结构区划,采用整群抽样和样条采样技术相结合的方法,估算全国农作物面积。然而该研究仍然存在未考虑样本点的空间分布特征的问题。

5 总结与展望

尽管关于抽样单元空间自相关的研究已经持续了十余年,但是这些研究主要集中于生态保护[4,7,74]、生态资源调查[55]、森林群落结构[13,51]以及土地利用变化[14,46]等方面,而关于农作物面积抽样单元空间自相关性的研究则尚鲜有报道,影响了空间抽样技术在农作物面积遥感监测业务中的进一步应用。通过以上综合分析可得出以下结论。

(1)农作物面积空间抽样调查在我国发展较快,应用前景十分广阔,但现行的空间抽样调查方法大多采用传统抽样与“3S”技术相结合的研究思路进行农作物面积估计,而就抽样单元间空间自相关性对农作物种植面积空间抽样精度和费用的影响研究还十分缺乏,研究工作明显滞后。

(2)在抽样单元空间相关性的特征方面,国内外关注的研究对象主要集中在土壤、生态、林业等领域,在农业领域,特别是农作物面积抽样单元空间相关性领域的研究很少,缺乏针对不同尺度、作物类型和耕地破碎度条件下的农作物面积抽样单元空间自相关特征的定量表达与评价,致使在农作物面积空间抽样方案设计中无法很好地考虑这一因素。

(3)尽管国内外就空间相关性对空间抽样效率影响的重要性都有较深入的认识,但关于农业资源抽样单元间空间自相关性对抽样效率的影响研究较少,缺乏空间自相关性对农业资源空间抽样效率影响的定量评价方法和指标,这一问题已经影响到农作物面积空间抽样方案的优化设计与实施。开展关于抽样单元空间自相关性对农作物面积抽样效率影响的定量研究,可为农作物空间抽样调查方法在不同地区应用的适宜性评价和抽样效率的进一步改善提供理论依据,这将是未来的主要研究方向。

猜你喜欢
农作物面积效率
高温干旱持续 农作物亟须“防护伞”
俄发现保护农作物新方法
夏季农作物如何防热害
怎样围面积最大
最大的面积
厉害了!农作物“喝”上环保酵素
巧用面积法解几何题
提升朗读教学效率的几点思考
巧用面积求坐标
跟踪导练(一)2