杨 贺,马蓓蓓,钟 堃,薛东前
(陕西师范大学 地理科学与旅游学院, 陕西 西安 710119)
经济普查(economic census)是指为全面掌握第二产业和第三产业的发展规模、结构和效益等情况,建立基本单位名录库及数据库系统,为制定国民经济和社会发展规划、提高决策和管理水平所进行的重大国情国力调查[1]。我国分别于2004年、2008年和2013年完成了3次经济普查,第4次全国经济普查已于2019年启动。与其他社会经济统计数据相比,经济普查数据具有规范性、全面性、专业性、准确性和周期性等优势,是“小数据”中的“大数据”[2]。
人地关系研究是现代地理科学的出发点和落脚点,其中人类经济活动的空间特征和地域分异始终是人地关系研究的核心主题[3]。目前,地理学人地关系研究的数据来源主要包括社会经济统计数据、问卷调查数据[4]、遥感影像[5]、物质空间要素数据和新兴的大数据[6]。近十年来,以社交网络数据、网站信息数据、移动信息设备数据等为代表的大数据挖掘和应用带来了人地关系研究范式和方法的重要变革。但作为新生事物,大数据在地理学研究中的应用依然面临着理论和方法准备的不足[7]。因此,将对城市与区域发展进行长期系统跟踪的经济普查数据在人地关系研究中的应用进行梳理,有利于提升地理学对社会经济统计类数据源的价值挖掘,促进传统数据间以及传统数据与大数据的有效对接,也是在信息化背景下地理学展开空间规律和机制研究的客观需求。
1949年以来,我国已开展的各项社会经济普查涵盖了人口、农业、工业、第三产业和基本单位等多个项目。依据普查的规范性和制度化程度,可将我国的社会经济普查划分为3个阶段[8]:起步阶段(1949—1993年)、制度确立阶段(1994—2003年)和统筹优化阶段(2003年至今)。目前执行的经济普查是依据国民经济和社会发展计划,按照完整性、系统性和衔接性等原则对普查项目与周期进行统筹调整,将工业普查、第三产业普查、基本单位普查以及建筑业的经济调查合并,统称为经济普查。该普查每5年进行一次,标准时点为普查年份的12月31日。除2004年第一次经济普查外,尾数逢3和8的年份为经济普查年。经济普查的对象是境内(不包括我国的香港、澳门和台湾地区)从事第二、三产业活动的法人单位、产业活动单位和个体户,涵盖了除农业外的国民经济各行业,普查方式为基于统一的规范化量表进行逐一全面调查(对小微企业和个体经营户的生产经营情况等可以采用抽样调查方法)。除了具有海量、全面和周期性强等特点外,从地理学人地关系研究的视角来看,经济普查数据还具有下列3个方面的特征。
在保证基本框架相同的基础上,动态增加了若干体现我国经济发展新特征的指标,如为适应国家建设资源节约型、环境友好型社会对能源消耗统计的需求,第二次经济普查扩大了主要能源和水消费量的统计范围,增加了高耗能通用设备等普查指标;第三次全国经济普查紧密结合“十二五规划”的发展要求,在完成普查基本内容的基础上,还重点查实服务业、战略性新兴产业、文化产业和小微企业的发展状况,体现了政府工作重点,具有明显的时代特征(表1)。
表1 三次全国经济普查统计指标比较Tab.1 Comparison of statistical indicators for three national economic census
相较于年度社会经济统计数据,经济普查数据既包括分地区、分行业的主要经济指标等宏观信息,也包括以企业为单位的微观信息,如企业所在地、行业大类、营业收入、R&D人员及支出等(表2)。
表2 第3次全国经济普查微观数据指标Tab.2 Micro data indicators of the third national economic census
目前,全国和省级尺度的历次经济普查数据均可在国家统计局官网和各省的统计局官网上免费获取。地级及以上城市的经济普查数据对深入分析我国区域经济的空间差异具有重要意义,但尚未见统一的获取渠道。通过在各级统计局、中国知网、国家图书馆和孔夫子旧书网等网站进行系统检索,发现我国338个地级及以上行政区中能检索到经济普查年鉴的行政区仅有124个,其中仅有21个行政区为三次经济普查数据均可获取,表明地级尺度上经济普查数据的公开性尚有待提高。从空间来看,东部和中部地区经济普查数据的可获取性整体优于西部地区,经济普查数据的公开性符合等级扩散规律,直辖市、省会城市和重要区域中心城市的经济普查数据较易获取(表3)。值得关注的是,2018年国家统计局微观数据实验室(http://microdata.stats.gov.cn)公开了第3次全国经济普查的微观数据(全部企业法人单位按照10%比例抽样),很大程度上解决了以往微观企业数据难以获取的问题,为小微尺度上空间信息与经济属性信息相结合的研究提供了重要的数据支持。
表3 我国地级以上城市经济普查数据的可获得性Tab.3 Availability of economic census data for cities in China
以“经济普查”为关键词在中国知网的地理学主要期刊进行全文检索,在文献分析软件Citespace自动聚类的基础上,依据文献内容进行人工归并和调整,最终将经济普查数据在人地关系研究中的应用分为城市、产业、就业、碳排放和土地利用等5个主要领域,下面分别从主要指标、研究内容、应用路径和代表性文献几个方面展开论述,并归纳数据应用的逻辑框架。
2.1.1 城市研究 城市研究是近30年来我国地理学人地关系研究的重要领域,经济普查数据应用也以城市研究的文献比例最高。其主要路径为:基于经济普查中的行业就业数据,在宏观视角下进行城市职能和都市区功能地域结构研究,在中观视角下通过构建城市就业网络分析城市内部空间结构和功能格局。前者代表性的文献如于涛方等[9]将五普人口数据(2000年)和全国第1次经济普查数据(2004年)中的分行业就业数据相比较,依据功能专门化指数对95个样本城市的城市职能转型进行分析。卢明华等[10]选取2004年和2008年北京市经济普查中采矿业、制造业等18个行业的从业人员规模数据,运用因子分析法和聚类分析法对北京都市区功能地域进行划分,总结功能地域结构模式并分析其变化。中观尺度下的研究主要是采用街道办尺度的就业人口数据刻画城市内部社会经济空间,如孙铁山等[11]应用2004年和2008年北京市经济普查中街道办和镇乡的就业人员数,通过城市中心以外高密度就业区的数量、位置和规模揭示城市的多中心空间结构。魏冶等[12]应用2008年经济普查中沈阳市中心城区各街道办的就业人口数据,运用引力模型计算各街道办的就业吸引力,形成以就业行为为基础的“就业-居住”空间联系网络,并将该网络与企业空间组织网络结合起来识别城市中心。
2.1.2 产业研究 产业研究领域使用的主要经济普查指标除分行业就业人口、分行业产值等外,还涉及微观企业数据库和商业网点数据库,用以支持制造业、生产性服务业和商业网点的空间集聚、产业集群和商业企业微区位等研究内容。如贺灿飞等[13]采用第1次全国经济普查数据,研究我国制造业在省、市、县不同尺度上的地理集聚。邱灵等[14]、张珣等[15]分别基于微观企业数据,对北京市生产性服务业和商业网点的空间集聚特征进行分析。吕卫国等[16]基于2004年江苏省第1次经济普查企业数据库,采用Ellison 和Glaeser 产业区域聚集和共同聚集的指标体系对产业集群空间集聚特征和范围进行分析。值得一提的是,由于企业库提供了可空间化的地址信息和企业经济数据(如企业资产、外商资本、营业收入和企业产值等),使得该类研究能够在更为精确的尺度上探讨产业空间特征,并引入数学模型在产业效率、竞争力和关联性等方面进一步深化产业空间差异研究。
2.1.3 就业研究 就业数据是地理学使用经济普查数据中最重要的指标,在上述城市、产业空间研究中,也多以就业空间为切入点展开分析。在以就业空间或就业空间与其他要素相互关系为研究目标的文献中,主要领域涉及就业密度、就业中心识别等空间分布特征以及职住匹配等。在就业空间研究上,刘霄泉等[17]运用Kriging插值法和局部加权回归的Lowess非参数法拟合出2004年和2008年北京市的就业密度曲线。王慧等[18]将2008年南京市第2次经济普查的就业人口数与用地现状图相结合,修正匹配得到南京市主城区各街道服务业、制造业及总的就业密度值,并采用就业集聚指数法识别南京市主城区总体和分行业的就业中心。在就业空间与其他要素的相互关系研究上,孙铁山[19]、修春亮等[20]将人口普查数据和经济普查数据相结合,前者表征居住空间结构,后者表征就业空间结构,分别探讨了北京市和沈阳市的职住空间匹配和“流空间”问题。
2.1.4 碳排放研究 碳排放是具有典型时代特征的研究领域。2009年哥本哈根世界气候大会后,碳排放受到各国政府和学界的关注。中国知网数据显示,2010年关于碳排放的发文量达到2 647篇,是2009年的2.7倍,至今也一直保持在年均发文量2 000篇/年的高位。地理学应用经济普查数据研究碳排放的文献首现于2008年,即第2次经济普查数据增加了能源卷后即有所响应。目前,经济普查数据在碳排放研究中应用的主要内容为不同行业部门的能源消耗[21-22]、碳排放[23]及其影响因素[24]等,涉及的经济普查指标为各地区、各行业的就业人口、产值和企业消耗燃料量等。其中,从业人员数、固定资产等数据可作为经济因子进行碳排放的驱动力研究[25-26],行业产值等可以与能源消耗量相结合进行碳排放强度的核算研究。如冯玲等[27]运用第1次全国经济普查中的分行业产值数据计算各行业的单位产值能源强度,以核算城镇居民生活的间接能耗(指蕴含在居民购买的各种非能源商品或服务中的能源消耗)和碳排放量。
2.1.5 土地利用研究 土地利用研究中涉及的经济普查指标主要为分行业的就业人口、产值数据和微观企业数据库,其应用的主要方向为与土地利用数据相对接,进行土地优化利用中的效益和效率评价。其中,通过微观企业数据库可核算出企业的地均资产总额、地均主营业务收入、地均吸纳劳动力人数等用地效益指标,将城市经济空间的研究尺度进一步精准化[28]。
目前,人地关系研究主要使用经济普查中的就业数据和产值数据,研究热点逐渐从以单一的城市经济空间为核心发展为聚焦城市社会空间以及城市“自然-社会-经济”系统内多要素间的作用关系研究。具体来说,经济普查数据应用的主要思路可分为两条:一是以经济普查数据构建的城市或区域就业空间和产业空间为背景或路径,展开城市或区域空间结构特征研究;二是将经济普查数据与人口普查数据、土地利用数据相结合,研究城市或区域发展中空间、人口、资源、土地和经济等关键要素的耦合关系(图1)。
图1 经济普查数据在人地关系研究中应用的逻辑框架Fig.1 The application framework of economic census data in the study of human-earth relationship
随着社会经济的发展和信息技术的进步,国内外地理学研究均呈现出大数据化、精细化和多尺度综合的发展趋势[29]。在这一过程中,充分利用兼具权威性、连续性、详实性、宏观和微观相结合等特征的经济普查数据,能在一定程度上缓解我国地理学人地关系研究的“统计数据困境”[30],并实现空间大数据与经济属性信息的有效对接。下面尝试总结经济普查数据在时间和空间维度的推演路径和多维应用图谱。
3.1.1 时间维度的数据插值推演 目前文献中出现的时间维度数据推演主要是通过插值的方式实现,具体可分为增长型推演和经验型推演两类。增长型推演是基于经济普查数据的全面性特征,依据与研究期最近的普查年份的某指标值,结合相应的年均增长率等,推算出非普查年份的对应指标值(该指标并非年度统计年鉴中的常见指标)。经验型推演是基于经济普查数据权威性特征,将普查年份中表征区域经济较为稳定特征的指标值(如规模以上企业分行业能耗占全行业的比例、分行业成本费用利润率等)用于弥补邻近的非普查年份的统计指标缺失。如张红丽等[31]运用《河北经济普查年鉴(2008)》中规模以上企业分行业能耗占全行业的比例,推算出2012年河北省全行业的能源消费,以弥补当年统计数据中仅有规模以上企业能耗的不足。
3.1.2 空间维度的数据尺度转换 经济普查数据在空间维度的转换对于地理学的尺度综合研究具有重要意义。目前出现的尺度转换可分为尺度下降和格网化转换两种类型。首先,经济普查数据除本身直接提供较小尺度(如街道办)的详细数据(分行业就业、产销、财税、能源和科技等)外,还可以据此将较大空间尺度的指标空间化分配到较小尺度,促进城市空间研究的精准化。如薛磊等[25]依据北京市经济普查中乡镇街道尺度的分行业企业单位数与从业人员,将北京市各行业的碳排放总量细分到乡镇街道尺度。其次,基于经济普查数据中的微观企业数据库,可以利用地址解析工具获取企业位置,实现经济普查数据在格网层次的自由尺度转化,从而弥补长期以来社会经济数据在空间化过程中受限于行政界线的不足,也更有利于与手机APP、公交刷卡等大数据研究的衔接。如针对现有土地分类对城市第二、三产业用地划分过于粗略、与国民经济行业分类缺乏有效衔接的问题,路振华等[32]将经济普查数据中的详细产业单位数据与城镇地籍数据对接,依据宗地上产业单位的经济属性明确了该宗地的实际土地用途,为城市产业用地研究提供了更为准确的数据来源。
此外,经济普查数据还可作为抽样调查或某种要素专题调查的基本背景数据,据此确定调查方案或检验调查数据。
经济普查数据在人地关系中的应用应以助力研究趋势的精细化和尺度综合化为导向。依据 “格局—过程—机理”的研究范式,本文构建了基于经济普查数据特征的“时间—空间—要素—数据”的多维应用图谱(图2)。
图2 经济普查数据在人地关系研究中的多维应用图谱Fig.2 The multi-dimensional framework for the application of economic census data in the study of human-earth relationship
首先,经济普查数据的规范性和周期性可用以支持横向的区域空间差异比较研究和纵向的区域发展过程及格局演变研究。其次,经济普查数据既有多尺度的空间属性,也有丰富的经济属性,可以支持多尺度的经济空间特征研究,尤其是其微观尺度的企业点及属性数据,一方面可以在很大程度上缓解以往研究小微尺度数据难以获取的困境,另一方面可以与POI数据相匹配,弥补其缺乏属性数据无法深入机理研究的不足[33]。再次,经济普查数据的可关联性非常适合地理学的要素综合视角,其与人口普查、土地利用和环境监测、问卷调查等数据的结合,有利于有效整合地理学人地关系研究中的“人口—产业—用地—环境”核心要素。此外,经济普查数据作为一种自上而下的、大规模的基础性数据源,其数据的可扩展性为地理学人地关系研究中常见的“统计数据困境”提供了较为有效的解决路径。
经济普查数据是传统社会经济数据中最接近大数据“要全局不要样本”特征的数据类型,且具有权威性、详实性、周期性、多尺度性、可关联性和可扩展性等特征。在当前地理学研究关注尺度分异、要素关联和大数据应用的趋势下,经济普查数据在人地关系研究中的应用应该得到进一步关注。
目前,我国已完成了三次全国经济普查,普查数据的可获取性存在显著的空间差异和尺度差异。东部和中部地区经济普查数据的可获取性整体优于西部地区,数据的公开性符合等级扩散规律,直辖市、省会城市和重要区域中心城市的经济普查数据较易获取。这也反映在研究成果的空间响应上,相关成果主要集中在北京、上海和广州等区域中心城市,尤以北京地区的研究成果最为丰富。
我国地理学对经济普查数据的使用主要涉及就业、企业和能源指标,研究热点逐渐从以单一的城市经济空间为核心演化为聚焦城市社会空间以及城市“自然-社会-经济”系统内多要素间的作用关系研究。这一转变与我国人地关系研究近十几年来人文化、精细化、注重多尺度综合和要素关联的发展特征相一致。
经济普查数据在我国人地关系研究中的应用可以归纳为城市、产业、就业、碳排放和土地利用5个主要领域。应用的主要思路可分为:一是以经济普查数据构建的城市或区域就业空间和产业空间分析为背景或路径,探讨城市或区域的空间结构特征;二是将经济普查数据与人口普查数据、土地利用数据相结合,研究城市或区域发展中空间、人口、资源、土地和经济等关键要素的关联关系。
经济普查数据的合理扩展有望在一定程度上缓解地理学研究中的“统计数据困境”,并有助于推动研究尺度的进一步精准化。具体路径可分为时间维度上的增长型插值和经验型推演,空间维度上的尺度下降和格网化转换等。依据地理学“格局—过程—机理”的研究范式,本文从比较研究、格局研究、要素综合研究和数据扩展4个方面构建了基于经济普查数据特征的“时间—空间—要素—数据”多维应用图谱,以期为经济普查数据在地理学研究中的科学高效应用提供思路借鉴。
正值2019年第4次全国经济普查展开之际,在数据公开性越来越强的背景下,本文的研究结论有利于扩展地理学人地关系研究的数据获取思路,尤其是为研究尺度的精准化和研究领域综合化提供数据支持。在本文归纳的“时间—空间—要素—数据”多维应用图谱中,“要素关联”能够有效地将经济属性数据与人口普查数据、土地利用数据、环境监测数据和个体行为数据等其他属性数据联系起来以进行要素耦合、效益评价、系统脆弱性和适应性治理等研究,是今后值得重点关注的应用领域。