第三次农业普查可视化分析

2021-05-27 15:00王竟俨
河南农业·教育版 2021年3期
关键词:数据可视化

王竟俨

关键词:农业普查;数据可视化;农业数据分析

一、简介

农业普查是全面了解“三农”发展变化情况的调查,同时是我国全面建成小康社会进入决战阶段进行的一次重大国情国力调查[1-2]。随着农业和科技的发展,有关农业大数据的分析就显得尤为重要。大数据是一种利用大数据综合推进农业生产向智能型转变的新兴技术,对于现代农业生产提供技术性的生产要素,是促进农业生产方向变革、提高现代农业转型升级的有力手段的重要方法[3]。

本文主要选取第三次农业普查中各地区普查登记农户数量、各地区普查卫星遥感情况和乡镇、村医疗和社会福利机构作为主要研究对象。三项数据集均来源于国家统计局中第三次全国农业普查主要数据公报(全国和省级主要指标汇总数据)。各地区普查登记农户数量数据集中共有36组数据,每条数据包含地区、登记户数、普通农户数、规模农业经营户、普查指导员和普查员。数据分布相对离散。本文主要研究该数据集中的地区和登记农户数。各地区普查卫星遥感情况数据集中共有36条数据,每条数据包含地区、遥感实地调查、卫星影像(景)、样方数量(个)、遥感抽中普杳区(个)、无人机整村架次(次)。数据分布相对离散。乡镇、村医疗和社会福利机构数据集中共包含6条数据,每条数据包含地区和乡镇、村医疗和福利机构单位比。数据分布相对离散。

本文的研究目标是:对于各地区普查登记农户数量数据集和各地区普查卫星遥感情况数据集,分析各数据集总体数量差异和各类别具体因地区导致的数量差异;对于乡镇、村医疗和社会福利机构数据集,分析全国与四大地区乡镇和村医疗福利单位覆盖情况。

本文采用的主要分析方法是使用pyecharts工具进行可视化分析。pyecharts是一款将python与echarts结合的数据可视化工具,可对数据进行有效的可视化分析。本文主要运用直方图、饼图、折线图对研究目标进行可视化分析。

本文研究结论是:普查中登记农户数量和卫星遥感影像数量大,登记农户数量和卫星影像数量不同地区差异明显,东北地区登记农户数量相对较少,无人机全国范围内使用地区少,次数最小,东西部地区乡镇、村医疗和社会福利机构分布相对均匀,全国乡镇、村医疗和福利机构基本全覆盖,农村医疗机构单位比少于乡镇。

本文采用的数据集来源:http://www.stats.gov.cn/tjsj/pcsj/。

二、数据读取

本文采取的数据读取方法是将从官网获得的该数据集进行拆分,每一张表对应一个数据集,先删去每一张表的表头内容和表中多余内容如页码(后期如有需要再添加)。转换完成后,通过读取文件的相关代码读取表中包含所需的数据。

统计获得的各数据集的基本情况:各地区普查登记农户数量和普查员数量数据集中共包含5列36条数据。其中,在统计的全国31 个地区中, 登记农户数量地区平均值为1.439×107人/地区,登记农户数最大值在山东省,最小值在西藏自治区;普通农户地区平均值为7.428×106 人/地区,普通农户数最大值在河南省,最小值在西藏自治区;规模农业经营户地区平均值为7.300×106人/地区,规模农业经营户数最大值在黑龙江省,最小值在北京市;普查指導员和指导员地区平均值为1.275×105人/地区,最大值在山东省,最小值在西藏自治区。

各地区普查卫星遥感情况数据集中共包含6列36条数据。其中,在统计的31个地区中,遥感实地调杳各地区平均值为1793个/地区,最大值在江苏省,最小值在西藏自治区;卫星影像(景) 各地区平均值为3250个/地区,最大值在内蒙古自治区,最小值在天津市;样方数量各地区平均值为3580个/地区,最大值在山东省,最小值在西藏自治区;遥感抽中普查区各地区平均值为731 个/地区,最大值在山东省,最小值在西藏自治区;无人机整村架次(次) 为88个/地区,最大值在广东省,最小值存在多个地区。

乡镇、村医疗和社会福利机构数据集中共包含6列6条数据。其中,全国地区各乡镇、村医疗和社会福利机构平均占比76.38%,东部地区为75.73%,中部地区为86.91%,西部地区为71.65%,东北地区为73.93%。

三、数据预处理

根据统计获得的各数据集的基本情况,可以看出:

对于各地区普查登记农户数量和普查员数量数据集,登记农户数量包含普通农户数量和规模农业经营户数量,各类别数据分布较为离散,且山东省在各个类别中所占比重较大,西藏自治区则是占比大部分最低。

对于各地区普查卫星遥感情况数据集,各类别数据分布较为离散,且各类极值分布地区不一致。

对于乡镇、村医疗和社会福利机构数据集,由于是全国和四大地区的汇总数据,且数据量较少,各类别所占百分比明显。

根据数据现状,得出本文研究问题有以下六个:一是分析四大地区普查登记农户数量中四大地区登记农户数量差异情况;二是分析各地区普查登记农户数量中各地区登记农户数量差异情况;三是分析各地区普查卫星遥感情况中各类别的全国数量差异情况;四是分析各地区普查卫星遥感情况中各地区卫星影像(景) 数量差异情况;五是分析对比乡镇、村医疗和社会福利机构在东西部地区单位覆盖情况;六是分析乡镇、村医疗和社会福利机构中全国范围内乡镇、村各类医疗福利机构占比。

根据问题,需要对每个数据集进行适当的预处理。对于问题一和二,由于属于各地区普查登记农户数量和普查员数量数据集,因此,根据问题内容需要对该数据集中有关登记户数和农户数对应列分别进行筛选并获取对应地区的数量值。问题三和四属于各地区普查卫星遥感情况数据集。针对问题三,需要获取各类别类型和其对应的全国总计数量;针对问题四,需要筛选得到全国各地区卫星影像(景) 对应列并获取对应地区数量值。问题五和六属于乡镇、村医疗和社会福利机构数据集。针对问题五,需要筛选出东西部地区在乡镇、村两级中医疗和社会福利机构并获得对应占比值;针对问题六,需要获得全国范围内乡镇、村各类医疗和社会福利机构的占比值。

四、普查登记农户地区数量差异情况分析

(一) 四大地区普查登记农户数量中四大地区登记农户数量差异情况(见图1)

结论:四大地区中东西部地区登记农户数相对比较均衡,均在七千万左右;中部地区略少,也接近七千万;只有东北地区登记户数远少于其他三大地区。东北地区登记户数少的原因有两点:第一,东北地区所包含的地区相对于其他三大地区数量较少,只有辽宁省、吉林省、黑龙江省;第二,东北地区因为天气寒冷,土地条件较差,无法保证庄稼作物有良好的收成,导致人们无法靠此赖以生计,因此,人们往往不选择成为农民。

(二) 各地区普查登记农户数量中四大地区登记农户数量差异情况(见图2-1、图2-2、图2-3)

结论:31个地区数量差异明显,数量最多的出现在山东省,最少则是在西藏自治区。山东省、河南省、四川省作为人口大省,登记农户数量均在1800万左右,这些省份的大多数农民工因人口基数大、竞争压力大、地区相对贫困,选择外出务工较多。登记农户数量较少的地区大致分为两类:一类是上海市、北京市、天津市,这些地区因其定位不同,经济实力较发达,可耕地土地少,人们往往选择其他方式赚钱;另一类是西藏自治区、新疆维吾尔自治区、青海省、宁夏回族自治区,这些地区因为气候海拔条件较为恶劣,土地条件无法满足人们种地需求,人们也往往选择其他方式赚钱。

五、普查卫星类别和数量差异化分析

(一) 各地区普查卫星遥感情况中各类别的全国数量差异情况(见图3)

结论:全国总体使用无人机的架次最少,仅有2726个,大部分地区均未开始使用无人机,原因是2016年第三次开始农业普查时,无人机是第一次作为普查工具,无人机架次还不足以支撑所有普查的31个地区。从数据读取中可以得出只有广东省大量使用了无人机进行普查,原因在于广东省经济较为发达,有条件支持发展无人机勘察。遥感抽中普查区也较少,原因在于为确保样本抽选的随机性、调查的可操作性以及分布的合理性,按地形及主要作物的种植强度等辅助信息对测算区域进行分层,按照农作物遥感测量的误差精度要求,测算各区域需要抽取的样本普查区的数量,并采用与耕地面积规模成比例抽样方法抽选普查区,并在每个普查区内采用简单随机抽样方法抽选自然地块作为调查目标样方,因此,遥感抽中普查区相对较少。

(二) 各地区普查卫星遥感情况中各地区卫星影像(景) 数量差异情况(见图4)

结论:针对卫星影像(景) 这一类别,各地区数量之间仍然存在较大差异。北京市、上海市等发达地区因为城市职能定位不同于其他地区,农业占用面积较少,卫星遥感所需影像也较少;海南省、重庆市、宁夏回族自治区因地理条件原因可耕种土地较少,需要的卫星遥感影像也较少;其他地区如内蒙古自治区、新疆维吾尔自治区、黑龙江省,因省份所占面积大,地区含有的土地类型較为复杂,所需卫星遥感影像较多。总体来说,鉴于第一次使用该技术,所有勘察地区采用的卫星遥感影像还是较多,说明技术使用相对成功。

六、乡镇、村医疗和社会福利机构地区占比分析

(一) 对比乡镇、村医疗和社会福利机构在东西部地区单位覆盖情况(见图5)

结论:东西部地区在乡镇和村级别医疗和社会福利机构占比相差不大,东部地区在5个类别中占比均高于西部地区。东西部地区在有医疗机构和正规医师的乡镇都达到了95%以上。从乡镇级别来看,东部地区占比均高于西部,在福利机构和敬老院方面,东部地区占比高于西部约20%。原因在于东部地区包含城市和省份经济实力和发展能力均高于西部地区。因此,在有关人民生命安全的基础机构设施上两地区相差不大,但在福利机构等需要社会关怀的方面因西部地区的发展能力稍欠而导致东部地区要胜于西部地区。从村级别来看,西部地区卫生条件发展要略胜于东部地区,原因是西部地区如内蒙古自治区、西藏自治区等由于地区广阔,资源相对紧缺,贫困人口相对较多,人们没有能力去城市就医,因此,农村卫生室和医师就相对比较关键。

(二) 乡镇、村医疗和社会福利机构中全国范围内乡镇、村各类医疗福利机构占比(见图6)

结论:从全国范围来看,乡镇级别的发展占到全国医疗和社会福利机构的70% , 农村卫生室和医师占比不到30%。其原因在于乡镇因为其行政级别高于村级,人口相对更多,资源福利同村级相比更加富裕,选择在乡镇居住的人民往往在经济能力上要强于村居住人民,因此,在乡镇政府更有能力发展支持医疗机构和社会福利和收养机构,同时留下更多有执业资格的正规医师。而村级因为贫困人口相对占比更高,地理条件往往较差,资源等远远不及乡镇,导致村级卫生室和正规医师本身占比要低于乡镇,在全国乡镇、村两级对比上劣势更加明显。

根据上述分析,总结得出:在农户数量方面,全国总体登记农户数量大,四大地区除东北地区1200 万以外均在7000 万左右,普查的31 个地区的农户数量因地区地理位置、气候条件和经济发展情况不同,地区性数量差异明显。在遥感勘察方面,卫星技术虽第一次使用,但是相对成功,大量卫星遥感影像及其样方和实地遥感被记录使用,但由于不同地区发展情况不同,在无人机等方面仍明显呈现地区性差异。在医疗和社会收养福利机构方面,东西部地区在乡镇级别医疗发展方面相差不大,在社会收养福利机构发展方面东部地区胜于西部地区;而在村级西部地区医疗发展要胜于东部地区。全国范围内乡镇级别的医疗和福利机构远高于村级。

猜你喜欢
数据可视化
移动可视化架构与关键技术综述
大数据时代背景下本科教学质量动态监控系统的构建
可视化:新媒体语境下的数据、叙事与设计研究
我国数据新闻的发展困境与策略研究
基于R语言的大数据审计方法研究
数据可视化概念研究
大数据背景下数据可视化方法研究
基于B/S结构的考试成绩分析系统
基于Hadoop的商业数据可视化分析模型的研究
用户数据统计挖掘与展示