沈丹, 周亮,3, 王培安
(1.兰州交通大学测绘与地理信息学院,兰州 730070; 2.甘肃省地理国情监测工程实验室,兰州 730070; 3.中国科学院地理科学与资源研究所,北京 100101)
近年来,国内外学者在精准扶贫研究的基础上,结合区域特色和实际情况展开了4个方面探索性研究: ①精准识别贫困内容主要由单一维度向多维度转变,维度扩展至区域地理特征、生态环境、基础教育均等化、交通可达性、卫生医疗和大病防治等众多领域[1]; ②研究方法主要采用可持续生计框架[2]、多层模型[3]和机器学习[4]等; ③研究数据逐渐多元化,主要有实际野外调查与抽样数据、电子商务数据和遥感影像等进入贫困研究领域[5]; ④研究尺度由全国尺度[6]、市县尺度[7]和行政村尺度,最终精准到扶贫家庭及个人贫困测度发展,粒度逐渐深入到家庭和个体细胞。这些探索性研究的提出开拓了较多研究思路,但由于部分研究基于特定区域(如北京)数据的可获取性、精细粒度难以深入等原因,对现实解释能力较差[8]、难以满足快速动态的精准识别要求。此外,中国农村贫困统计数据的缺乏与不同省份数据统计口径的不一致使贫困识别数据获取困难,尤其是西部偏远地区。地区的差异、统计数据的偏差和贫困地区一些领导干部的“急功”,也会使贫困的真实情况出现偏差。
因为以上原因,学者们开始借助夜间灯光数据对贫困进行评估和辅助研究。Noor等[9]采用DMSP-OLS数据和资产数据构建贫困指数评估非洲37个国家贫困状况,研究表明贫困指数与灯光亮度间有高度相关性; Elvidge等[10]借助LandScan人口数据和DMSP-OLS夜间灯光数据估算的2006年全球贫困人口与世界银行估算的结果相一致; Wang等[11]使用主成分分析法构建综合贫困指数探讨夜间灯光指数与贫困指数间的关系,发现两者有良好的线性正相关关系; Yu等[12]通过中国2 856个县的区域灯光值和国家贫困县比对,结果显示灯光值低的区域同时也属于国家贫困县; 潘竟虎等[13]运用夜间灯光指数与多维贫困指数(multidimensional poverty index,MPIstatistical)间的线性回归模型将贫困空间化,识别出848个多维贫困县。上述研究仅仅对灯光数据和社会经济数据进行简单处理且只在短时间内评估贫困。鉴于此,本文以六盘山连片特困区为研究区,选用DMSP-OLS和NPP-VIIRS灯光数据,运用不变目标区域法校正灯光数据提取区域灯光指数(average light index,ALI),借助灰色关联模型构建多维贫困体系产生MPIstatistical,以两者的线性拟合关系生成贫困模拟模型,从而识别研究区的贫困现状与特征,实现基于多期夜间灯光数据对贫困的连续动态监测弥补统计数据短缺问题。
六盘山连片特困区跨陕西、甘肃、青海与宁夏4省区,地处黄土高原中西部及其与青藏高原的过渡地带,地形破碎,山、川、塬并存,沟、峁、墚相间; 地势西高东低,平均海拔在1 900 m左右(图1); 属于温带大陆性干旱半干旱气候,土质疏松,植被稀疏,干旱等自然灾害频发。该地区是国家新一轮扶贫开发攻坚战主战场之一,有国家扶贫开发工作重点县49个、革命老区县12个和民族自治地方县20个。2010年农民人均年纯收入仅相当于全国平均水平的54.7%,当年在1 274元扶贫标准以下的农村人口有313.1万人,贫困发生率为15.9%,高于全国13.1%,比西部地区平均水平高9.8%。按照2 300元扶贫标准,2011年区域扶贫对象为642万人,贫困发生率35%,高出全国22.3%。
图1 六盘山连片特困区区位
研究数据主要包括: ①灯光数据,2种灯光数据分别为2000—2012年的DMSP-OLS及2015年的NPP-VIIRS夜间灯光,数据来源于美国国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)网站,空间分辨率分别为1 000 m×1 000 m和500 m×500 m。F162006辐射定标后的灯光数据来源于美国国家地球物理数据中心; ②基础地理数据,县级行政区划图来源于国家基础信息中心、数字高程模型(digital elevation model,DEM)空间分辨率为30 m×30 m; ③经济统计数据,如农民人均纯收入等,来源于2011—2016年各省市统计年鉴。
本研究利用ArcGIS10.2与ENVI5.1平台,通过4个处理步骤实现贫困识别(图2)。
图2 数据处理流程
具体步骤为: ①通过投影、重采样等创建中国灯光数据库并对主要市辖区的部分社会经济数据(国内生产总值(gross domestic product,GDP)、城镇建成区面积等)进行分析,选择黑龙江省鹤岗市市辖区作为不变目标区域,借助不变目标区域法对数据进行初次校正[14]; ②对同一年份的2期数据进行年内整合以及对不同年份的数据进行跨年校正,最终完成DMSP-OLS数据校正[14]; ③通过剔除偶然灯光等对NPP-VIIRS数据进行校正[15]; ④通过建立灯光和社会经济数据产生的ALI和MPIstatistical间的线性关系,生成贫困评估模型与多维贫困指数估算值(MPIestimated)识别贫困。
以国内外多维贫困指标测算体系为依据、以统计数据为基础建立贫困指标体系; 以夜间灯光数据为基础产生ALI,从而构建贫困评估模型。
构建全面描述贫困状况的多维贫困指标体系是精准测度贫困程度的重要前提[6],并且多维贫困指标的客观性和必要性已被世界银行等国际机构和学者们所广泛接受[7-8],因此,MPIstatistical可用于验证ALI模拟贫困的精确性[12]。综合来看,多维度贫困的评价指标主要由经济维度、社会维度和环境维度组成[16]。此外,农民人均纯收入指标仍然是划分贫困县和集中连片特困区的重要经济依据[17]。依据前人研究的基础上,根据研究目的、指标选择的科学性和数据的可得性及可比性等原则,本文选用9大指标构建贫困指标体系,采用熵值法赋予权重,其原理是信息量与不确定性成反比即信息量越大、不确定性就越小,熵越小、权重则越大[12]。与其余权重方法相比熵值法更具客观性,从而常用与构建经济、社会和自然多维的贫困度测算。9个指标如表1所示。
表1 MPIstatistical指标权重
由于评价体系具有复杂性和不确定性特征,而灰色关联系数会缩小主观对结果的影响,能更精准测算个体的贫困程度[18],即
(1)
式中:x0(k)为特征序列;xi(k)为因素序列,其中有k个子序列,即xi(k)={xi(1),…,xi(k)};i分别代表各个指标;e为分辨率,其值为0.5;δ(k)为灰色关联系数。
运用熵值法和灰色关联系数法确定的权重与指标值,计算MPIstatistical,即
(2)
式中:wi为各个指标的权重;n为指标总个数。
夜间灯光数据是通过探测小规模低强度灯光反映区域的社会经济情况,而区域经济发展薄弱等社会经济多方面因素导致贫困[12],通过构建代表不同区域灯光强度的ALI反映区域间社会经济水平的差异性,进而探究ALI与MPIstatistical的关系[13],即
(3)
式中:P为县级行政单元像元的个数;ALI为县级区域灯光指数;DNp为第p个像元的DN值。
借助MPIstatistical与ALI之间的线性回归方程,将特困区贫困空间化生成MPIestimated。采用误差公式[13]检验MPIstatistical与MPIestimated间的误差,即
(4)
(5)
式中:MRE和RE分别表示平均相对误差和相对误差;M为区县数目。误差越小,表明MPIestimated估算的精度越高,越接近真实的贫困状态。
3.1.1 区县MPIstatistical与ALI的比较
通过构建多维贫困体系获得MPIstatistica值,值越小则相应区县贫困程度越高,反之,贫困程度越低。2000—2015年间MPIstatistical值较大的区县主要位于市区,而值较小的区县主要分布在生态环境恶劣、经济发展基础薄弱的宁夏等少数民族、革命老区。为了更好地探究贫困分布格局,按照从小到大的顺序采用综合自然分界法(基于数据中固有的自然分组将对分类间隔加以识别,可对相似值进行最恰当地分组并使各个类之间的差异最大化)将各年份的值分成5级(极贫困、高度贫困、中度贫困、轻度贫困和非贫困)。兰州市城关区、西宁市城西区等地区相较于其余区县经济发展水平较高,多年来处于轻度贫困或非贫困; 属中等贫困的白银市白银区、兰州市西固区等拥有较好的工业基础; 海东市平安区等区县邻近城区属于高度贫困; 而属于极贫困的县分布在少数民族聚集区和边缘地区。整体上,MPIstatistical准确、客观地反映了特困区真实的贫困状态。
夜间灯光本身是人类活动的结果,灯光特征反映地区经济水平[19],社会经济发展繁荣的地区在夜间有明亮的灯光。通过式(3)获得多年各区县的ALI,极高的ALI值出现在繁华的市区,而极低的ALI值则发生在贫困的县。按照ALI值从大到小的顺序采用相同的方法对不同年份数据分级,城关区和城西区等有最高的ALI值,属非贫困或轻度贫困; 具有极低ALI值的县有固原市泾源县、白银市会宁县和定西市陇西县等,绝大部分县少数民族人口众多并多以农业为主,属极贫困。
为了进一步探究ALI值的合理性,通过相应年份相应区县的MPIstatistical与ALI等级之间作差比较(表2)发现: 78个区县中有50个以上区县的等级是一致的,占所有区县比例的64.10%以上。例如,白银区、天水市秦州区等具有较好的经济基础,为当地的投资、基础设施建设提供良好的服务; 具有极低ALI值和MPIstatistical值的固原市彭阳县、武威市古浪县和临夏回族自治州东乡族自治县等因人口众多,工业与服务业发展不足而导致持久的贫困。等级差距在±1之间的区县有21~25个,而仅有1~4个区县存在较大的等级差距。总而言之,通过MPIstatistical与ALI等级比较,表明用灯光数据识别贫困是合理、客观的。
表2 2000—2015年MPIstatistical与ALI的等级比较
3.1.2 各区县MPIstatistical与ALI之间的关系
为了更好探究研究区各区县MPIstatistical与ALI之间的关系,分别运用幂函数、线性和多项式等回归模型拟合MPIstatistical与ALI值,最终选用效果最优的线性方程探讨两者关系(图3),分析发现: 两者之间存在明显的线性关系。决定系数R2分别为0.51,0.67,0.77,0.88和0.85,表明ALI值高的区县社会经济发展水平高、就业率和人民收入增加,而人民收入的增加使区县的贫困程度降低; ALI值低的区县社会经济基础薄弱,以农业为主,人民收入减少并具有不稳定性,进而导致贫困程度高。为了检验结果的可信度,对各年份的拟合结果进行F检验与t检验。2000—2015年间F值分别为78.14,152.95,250.14,578.75和441.88;t值分别为56.31,64.82,72.76,98.55和88.68; 所有F值和t值均大于临界值表中F0.01,76与t0.01,77,表明各年份MPIstatistical与ALI之间的回归模型都通过了检验。
(a) 2000年 (b) 2004年 (c) 2008年
(d) 2012年 (e) 2015年
3.1.3 MPIstatistical空间化与结果检验
以MPIstatistical与ALI之间的线性回归方程为基础,借助栅格计算器对校正好的灯光数据作栅格运算实现栅格化的特困区贫困空间化并产生MPIestimated(图4)。通过年内与年际间校正后的灯光像元值相较于校正前具有长时间的连续性,因此可进行2000—2012年间贫困空间化对比。由图4可知,城区具有极高MPIestimated值,而边缘等区域有极低值,这与六盘山区的贫困现象相符合。随着时间推移,特困区的社会经济条件逐渐改善,贫困状况逐渐好转,MPIestimated的最大值与最小值不断增大。运用误差式(4)和式(5)获得2000—2015年间实际的MPIstatistical与估算的MPIestimated之间的平均相对误差分别为3.21%,3.38%,3.14%,3.44%和3.52%。相较于目前已有研究12.51%的误差[23]而言,3.14%~3.52%间的平均相对误差表明估算贫困的精度高,与实际贫困接近。
(a) 校正后的像元总DN值 (b) 2000年MPIestimated(c) 2004年MPIestimated
(d) 2008年MPIestimated(e) 2012年MPIestimated(f) 2015年MPIestimated
3.2.1 各区县贫困识别
2000—2015年间特困区MPIestimated年平均值分别为0.361,0.372,0.375,0.378和0.382,贫困程度逐年减轻。表3为六盘山连片特困区贫困程度识别个数与比例比较。
表3 六盘山连片特困区贫困程度识别个数与比例比较
通过表3可发现,2000—2012年间极贫困与高度贫困总和介于76.92%~84.61%; 而中度、轻度以及非贫困所占比重仅介于15.38%~23.08%,贫困程度两极分化极其严重。但随着时间的推移,极贫困与高度贫困的比例逐年减少,中度、轻度以及非贫困的比例逐年增加。2015年,极贫困与高度贫困比例之和为78.20%,轻度以及非贫困的比例之和为11.54%,表明贫困程度两极分化情况加重。
3.2.2 贫困空间特征
贫困空间集聚性反映着贫困的整体特征,因此借助Opengeoda工具运用queen标准构建权重采用全局Moran’s I指数探究多年MPIestimated的集聚性。2000—2015年Moran’s I指数分别为0.49,0.45,0.47,0.49和0.43,表明78个区县的贫困程度具有明显的集聚性,即MPIestimated值高的区县彼此邻近,MPIestimated值低的区县也彼此呈带状集中。此外,借助ArcGIS软件探究了MPIestimated冷热点分布规律,发现2000—2015年间冷点与次冷点分布在贫困区中经济发展基础薄弱的泾源县和定西市漳县,多民族聚居和农业人口多的中卫市海原县和东乡族自治县,自然灾害频发的定西市通渭县和岷县等县; 而热点与次热点分布在邻近城关区、城西区的永登县和湟中县等区县。
本研究以六盘山连片特困区为例,以社会经济统计数据为基础并采用灰色关联模型构建MPIstatistical。以2000—2015年间的DMSP-OLS/NPP-VIIRS灯光数据为基础,运用不变目标区域法、年内年际间相互校正构建足以实际反映特困区社会经济发展水平的ALI。采用回归模型进一步检验两者关系,最终实现贫困空间化生成MPIestimated并开展贫困识别。
1)基于夜间灯光开展贫困空间化生成的MPIestimated相较于社会经济数据生成的MPIstatistical而言,平均相对误差介于3.14%~3.52%之间,与利用NPP-VIIRS数据对贫困识别的平均相对误差12.51%相比较,其精度更高。由此可见,利用校正后的夜间灯光数据能够较为准确、真实地反映六盘山连片特困区的贫困程度。
2)2000—2015年间县域MPIestimated年平均值分别为0.361,0.372,0.375,0.378和0.382,贫困程度逐年减轻。2000—2012年间识别出极贫困县39~46个、高度贫困县20~21个、中度贫困县4~9个,轻度贫困和非贫困县3~6个。2015年识别出极贫困县45个,高度贫困县16个,中度贫困、轻度贫困和非贫困县分别为8,4和5个,表明特困区贫困程度两极分化现象严重。
3)2000—2015年间Moran’s I指数分别为0.49,0.45,0.47,0.49和0.43,表明78个区县的贫困程度具有明显集聚性。多年来冷点分布在贫困区的西南与东南部,次冷点集中在东北部和边缘区域,而热点与次热点分布兰州与西宁地区。
综上所述,识别微观空间的贫困程度是涉及多学科的问题。本文基于夜间灯光对六盘山连片特困区的实证研究,有效地证明夜间灯光数据对贫困模拟的合理性、客观性以及可识别出长时间贫困程度的时空演化规律。然而,由于研究区统计数据获取的有限性导致体系的建立还存在一定局限性; 同时灯光数据在现有的校正方法上依旧存在误差。因此,构建更加完善的贫困评估体系和增强估算精度将是进一步研究的主要方向。