2014-2020年国家农民专业合作社示范社基本信息数据集

2024-04-29 10:05杨奇明,施丹燕,沈梦露,黄颖
农业大数据学报 2024年1期
关键词:年份存量合格

摘要:国家农民专业合作社示范社是在国家层面上设立的示范组织,旨在推广和示范农民专业合作社的良好经验和做法,它由政府支持和引导,享受特殊政策和资源支持,并承担着示范引领的责任。构建国家示范社基本信息数据集可以为评估合作社扶持政策效果提供数据基础,在此基础上可以为政府制定新型农业经营主体高质量发展政策提供决策参考。该数据集以《国家农民专业合作社示范社评定及监测暂行办法》(农经发〔2013〕10号,以下简称“《办法》”)为依据,搜集整理了2014-2020年国家相关部委公示的国家农民专业合作社示范社名录,并为其匹配了入选、移出国家示范社名单的年份,以及成立年份、退出(注銷、吊销)年份、所在地县级行政区划等信息,最终形成了囊括1万余家国家示范社基本信息的数据集,并在此基础上构成面板数据。通过该数据集,可以更好地了解不同地区优质农民合作社的生命周期和存续情况,深入分析合作社高质量发展的区域差异及其背后的驱动因素。

关键词:国家农民专业合作社示范社;面板数据;新型农业经营主体;合作社高质量发展

1  引言

我国农村经济发展长期面临小农经济、资源配置不合理、农产品市场化程度不高等问题。农业生产规模小、资金有限,在技术支持和社会服务方面得不到有效支持,导致长期存在生产潜力难以充分发挥的问题。为此,国家出台了鼓励农民合作经营的政策,并推动农民专业合作社的建立。2007年《中华人民共和国农民专业合作社法》正式颁布,该法为农民专业合作社的组织和运行提供了法律依据和规范,促进了农民合作经营的发展。根据该法,农民专业合作社可以通过合作经营、集中采购和销售、技术支持等方式,提高农民的生产效率和经济收益,促进农村经济的发展。此后,国家陆续出台了相关配套政策和措施,推动农民专业合作社的发展,并于2013年开始实施国家农民专业合作社示范社(以下简称“国家示范社”)试点工作,进一步推动农民专业合作社的发展。

目前,示范社研究已成为新型农业经营主体研究的重要组成部分。然而,现有研究中多数集中于考察示范社的优势及其正向溢出效应(即示范效应)。已有研究表明,在农业标准化以及经营服务和农产品质量安全建设等方面[1,3],示范社明显优于非示范社。此外,示范社对农户社会资本提升效果也更为明显[2]。合作社的示范级别是对合作社现有能力的综合考量,体现了合作社的规范程度[8]。示范级别越高,获得的外界资金及政策支持越多,未来发展空间越大[9]。根据示范社的示范效应,可以将示范社作为高质量合作社的代表,为其他合作社的高质量发展提供指导[4,7]。然而,也有研究表明示范社存在一定程度的负向溢出效应。陈锐等[5]发现,尽管示范社通过示范基地建设和合作社的学习模仿,可以促进周边合作社发展水平的提升,但政策资源的竞争也可能限制周边合作社的发展。

虽然国内许多专家学者对示范社进行了深入研究,但已有研究所用数据大多来自调研数据,而非全量示范社数据。因此,研究结果仍会受到样本选择的限制和采样误差的影响。本文构建的2014 -2020年的国家示范社基本信息数据集提供了近似的全量数据,可以更准确地反映国家示范社的整体特征和演变趋势。将这套数据集与其他相关数据进行匹配,可以获得有关国家示范社更多维度的信息。例如,将其与中国工商企业注册数据库的经营异常信息进行匹配,可以获得国家示范社的异常经营情况[6]。

2013年发布的《办法》第八条规定,国家示范社每两年评定一次;第十三条规定,实行两年一次的监测评价制度;第十四条规定,监测合格的国家示范社,以农业部文件确认并公布。监测不合格的或者没有报送监测材料的,取消其国家示范社资格,从国家示范社名录中删除。 以上述文件为基础,我们首先构建了2014—2020年国家示范社面板数据集[ 从2021年开始,国家不再公示监测合格名单,只公示新认定名单,因此,该份数据集面板年份仅收录至2020年。],包含该时间区间内农业部公示的1万多家国家示范社的相关信息。并进一步将其与浙大卡特-企研中国涉农研究数据库(以下简称“CCAD”)数据库进行匹配,扩充了“(登记注册)成立年份”(以下简称“成立年份”)、“吊销年份”(以下简称“退出年份”)、“行政区划代码”等其他基本信息,共获得合计约4.7万条数据。这一数据集将进一步推动国家示范社的相关研究。

2  数据采集与处理

2.1  名单数据采集

根据《办法》,我们绘制了国家示范社评定及监测流程图(图1)。因为该《办法》牵头部门为中国农业农村部,故名录数据主要来自农业农村部网站的公示名单。构建该数据集的名单包括2014年、2016年、2018年、2020年新认定名单,以及2015年第一次监测合格名单、2017年第二次监测合格名单、2019年第三次监测合格名单。共计7份名单,各年份具体数据量见表1。

2.2  数据处理

2.2.1  国家示范社名录清理及数量统计

采集到的2014、2016、2018、2020年度的数据,仅包含当年新认定的国家示范社,不含历史存量;2015、2017、2019年度的数据,仅包含当年监测合格的国家示范社名单,不包含上一年度新认定部分(注:上一年度新认定名单不在本年度监测范围之内)。故以上几份数据(除2014年外)都不是当年存续的完整国家示范社名单,需要根据国家示范社的评定和监测规则,进一步计算当年存量。具体计算公式如下:

国家示范社当年存量(奇数年份)=当年监测合格部分+上一年度新认定部分(减去“二者交集部分”,若有[ 国家示范社每两年评定一次(偶数年份),每两年监测一次(奇数年份)。理论上,两个相邻年份是不可能存在重复数据的。然而根据实际采集的认定和监测名单,我们发现,2014年新认定的示范社与2015年监测合格的示范社存在336家重复,2016年新认定的合作社与2017年监测合格的示范社存在9家重复。])

国家示范社当年存量(偶数年份)=上一年度国家示范社存量+当年新认定部分(减去“二者交集部分”,若有)

在构建国家示范社名录面板数据之前,我们必须首先对上述7份名单进行纵向的融合匹配。主要基于CCAD中唯一识别的全量合作社名录,实现7份名单中国家示范社的唯一识别和纵向融合。

2014—2020年各年国家示范社存量数据的计算过程如下:

- 2014年国家示范社存量:2014年新认定部分,3767家。

- 2015年国家示范社存量:

① 2015年监测合格部分,3292家;

② 2014年新認定部分(每两年监测一次,2014年新认定部分不在2015年监测范围内),3767家。

取二者并集,共6723家(3292+3767-336=6723)。

- 2016年国家示范社存量:

① 2015年国家示范社,6723家;

② 2016年新认定部分,914家。

取二者并集,共计7628家(6723+914-9=7628)。

- 2017年国家示范社存量:

① 2017年监测合格部分,5106家;

② 2016年新认定部分(2016年新认定部分不在2017年监测范围内),914家。

取二者并集,共计6011家(5106+914-9=6011)。

- 2018年国家示范社存量:

① 2017年国家示范社,6011家;

② 2018年新认定2082家。

取二者并集,共计8093家(6011+2082=8093)。

- 2019年国家示范社存量:

① 2019年监测合格部分,4875家;

② 2018年新认定部分(2018年新认定部分不在2017年监测范围内),2082家。

取二者并集,共计6957家(4875+2082=6957)。

- 2020年国家示范社存量:

① 2019年国家示范社,6957家;

② 2020年新认定1759家。

取二者并集,共计8716家(6957+1759=8716)。

通过以上步骤得到每一年国家示范社存量数据统计结果如表2的结果(1)所示。

2.2.2  横向匹配添加字段,获得国家示范社基本信息

(1)添加“入选年份”和“移出年份”字段

为方便进一步使用,我们在名录面板数据的基础上,增加“入选年份(IN_YEAR)”字段,用于表示每家合作社被初次评定为国家示范社的年份,增加“移出年份(OUT_YEAR)”字段,用于表示每家合作社被首次排除在国家示范社名单之外的年份。根据以上定义,同一示范社在面板数据中出现的最早年份即为该示范社的入选年份,在面板数据中出现的最晚年份的下一年即为该示范社的移出年份。

值得注意的是,国家示范社的评定自2014年开始实施,每两年评定一次。理论上,“入选年份”字段的取值只可能是2014年、2016年、2018年、2020年这4个新认定时间,以及2015年第一次监测时间。然而根据实际统计结果,我们发现,少部分示范社的“入选年份”取值为2017年和2019年,这不符合逻辑。因此,我们对这部分示范社的"入选年份"做了特殊处理,将其替换为空值Null。

(2)增加“成立年份”和“退出年份”字段

为方便学者查看一家示范社在正式成立之后,花多长时间入选国家示范社名录,以及该示范社当前的存续状态与存活时长,我们为其匹配上了“成立年份”和“退出年份”两个字段。值得注意的是,部分合作社在完成国家示范社认定之后,再去市场监管部门补办注册手续,即存在部分示范社"成立年份"要晚于或等于其“入选年份”的情况。例如,“黄梅县康宏优质稻种植专业合作社”在2014年被认定为国家示范社,但其在市场监管部门正式登记注册的时间为2015年。

根据前文的计算逻辑,偶数年份国家示范社存量等于上一年度国家示范社存量与当年新认定示范社的并集。而国家示范社每两年监测一次,存在少数示范社在认定当年或第二年退出市场的情况。对于这种情况,我们以各年年底合作社的经营状态,作为是否入选当年名录的判断标准,也就是说,这部分退出的示范社应当从当年和第二年的示范社存量中剔除。因此,我们在前文处理的基础上,进一步剔除了退出年份早于或等于面板年份的记录。最终,2014-2020年国家示范社存量数据统计结果如表2的结果(2)所示。

2.2.3  其他处理事项

(1)关于地址信息相关字段的处理

鉴于采集到的国家示范社地址信息大部分仅精确到省一级,只有极少部分能够精确到地市级。为方便使用,我们利用CCAD中包含的合作社注册地信息,为本表增加了“行政区划代码”和“省份”两个字段,并与采集到的原始地址信息进行核对,从而进一步校验前期数据融合匹配的准确性。

(2)关于"示范社类型"字段的处理

鉴于收集到的2015年第一批监测合格名单缺少“示范社类型”字段,所以只能通过其他几份名单对其进行补充。而部分2015年监测合格的示范社后续退出了,因此其他几份名单未能完全补充2015年缺失的“示范社类型”信息。对于这部分示范社,其“示范社类型”字段记为空值Null。此外,各个年份对示范社类型的表述不一致,除缺失值以外,我们将其统一为“农业”、“林业”和“供销”三类。

3  数据内容

本数据集包含文本数据及图像数据两项。共计47794条信息,其中文本数据47784条,图像10张。

3.1  文本数据

最终处理得到的数据集共计47784条记录,囊括11444家国家示范社基本信息,包含序号(NUM)、国家示范社样本ID(SAMPLE_ID)、国家示范社名称(ENTNAME)、国家示范社统一社会信用代码(UNISCID)、示范社类型(TYPE)、面板年份(YEAR)、省份(PROVINCE_CN)、县级行政区划代码(CNTY)、成立年份(ES_YEAR)、退出年份(END_YEAR)、入选年份(IN_YEAR)、移出年份(OUT_YEAR)等字段。样例数据如表3所示。

3.2  图像数据

根据2014—2020年各年国家示范社的入选、移出数量,我们绘制了3幅国家示范社历年数量变化折线图,根据2014—2020年各年国家示范社的分省统计数据,我们绘制了2014—2020年各年国家示范社存量分省分布情况图,共计7幅图。合计10幅图像,部分图像样本示例如图2和图3所示。

4  质量控制与技术验证

数据质量具体控制细节已在数据采集和处理方法章节展现,可以将其总结为以下3点:

数据收集和录入:我们从权威网站搜集整理了2014年、2016年、2018年、2020年新认定名单,以及2015年第一次监测合格名单、2017年第二次监测合格名单、2019年第三次监测合格名单。确认了数据的准确性与完整性,避免数据输入错误或遗漏。

数据匹配与清洗:我们在获取完整的国家示范社名单基础之上,通过序贯匹配法,为示范社匹配上了统一社会信用代码、示范社类型、省份、县级行政区划代码、成立年份、退出年份、入选年份、移出年份等字段,并检查和纠正了数据中的错误、重复和不一致性,比如剔除了退出年份早于或等于面板年份的记录。

数据验证:每进行一步数据处理,我们都会随机抽取部分样例数据,通过比对和验证数据与原始来源或其他相关数据的一致性和合理性,确保数据准确可靠。此外,我们还将收集与处理后的数据进行绘图,以便直观地判断过程是否稳定和可控。

总之,在数据采集和处理的过程中,我们制定和执行了标准化的操作程序(SOP),绘制了操作流程图,明确了各环节职责要求,确保数据处理流程按照规定的标准和要求进行,以减少人为误差和提高一致性,提高了工作效率和质量。

5  数据价值与使用建议

该数据集提供了接近全量的1万余家国家示范社信息,可以为研究国家农民专业合作社示范社的发展和影响因素提供重要基础。数据集包含了国家示范社的基本信息,如名称、统一社会信用代码、成立年份、退出年份等,可用于直接进行分析或者作为抽样框助力开展国家示范社的抽样调查。提供了国家示范社的类型、入选年份、移出年份、县级行政区划代码、所在省份等信息,可以用于地理分布分析和区域差异比较研究。具体而言,通过该数据集可以进行以下分析研究:①结合面板年份数据,进行国家示范社的发展趋势分析,比较不同类型国家示范社的发展情况,探讨影响各地国家示范社发展的因素。②利用统一社会信用代码或者国家示范社样本ID进行数据关联与匹配,与其他数据集进行整合分析,深入探究国家示范社与非国家示范社、其他新型农业经营主体的关系。③基于县级行政区划代码信息,进行更细致的地理分析,研究国家示范社在不同县域的分布和示范效应。

6  数据可用性

中国科技资源标识码(CSTR):17058.11.sciencedb. agriculture.00091;

数字对象标识码(DOI):10.57760/sciencedb. agriculture.00091。

允许公开访问,限制性获取。

作者分工与贡献

杨奇明,总体方案设计及论文撰写。

施丹燕,数据整理及分析、组织实施与数据校对、数据质量控制与综合管理。

沈梦露,总体方案设计及论文撰写。

黄颖,数据可视化。

伦理声明

本研究未涉及伦理。

利益冲突声明

作者声明,全部作者均无会影响研究公正性的财

务利益冲突或个人利益冲突。

参考文献

[1] 王军,苑鹏,马旺林.农民专业合作社示范社的示范效应分析——基于8省12县市614家农民专业合作社的比较研究[J].学習与实践, 2021(1):29-41.

[2] 张连刚,陈卓.农民专业合作社提升了农户社会资本吗?——基于云南省506份农户调查数据的实证分析[J].中国农村观察,2021(1): 106-121.

[3] 刘杰,李聪,李树茁.示范合作社的农业标准化效应——基于ESR模型的计量分析[J].农业技术经济,2023(5):98-112.

[4] 芮旸,杨钰华,韩静,等.县域高质量果业专业合作社发育的空间归因——基于陕西省省级示范社数据[J].中国农业资源与区划,2021, 42(5):82-92.

[5] 陈锐,张社梅.示范抑或挤出?——农民合作社示范社的空间溢出效应[J].中国农村经济,2022(11):122-144.

[6] 梁巧,白荣荣,邵科.顺其自然还是引导退出——基于空壳社对正常合作社发展的影响研究[J/OL].农业技术经济(2023-06-14):1-17. DOI:10.13246/j.cnki.jae.20230613.001.

[7] 高静,周吉.合作社高质量发展促进农业绿色生产率提高的机理与实效[J/OL].中国农业资源与区划(2023-08-04):1-12.(中国知网)[2023-12-08]

[8] 张征华,甘余超,曾皓.供给侧结构性改革背景下的农民合作社绩效评价[J].江苏农业科学,2017,45(19):63-67.

[9] 白慧,陳彤.基于因子分析联合熵值法的伊犁州种植业农民专业合作社绩效分析[J/OL]. 中国农业资源与区划(2023-04-18):1-12.(中国知网)[2023-12-12].

[10] 杨丹,唐羽.合谋视角下的农民合作社绩效与评级[J].农业技术经济,2019(3):75-86.

[11] 刘骏,张颖,艾靓,等.利润追逐:合作社盈余分配制度的选择动力[J].农业经济问题,2018(4):49-60.

[12] 罗庆,王艺霏,周晓庆,等.中国农民专业合作社空间格局及其影响因素[J/OL].中国农业资源与区划(2023-10-24):1-15.(中国知网) [2023-12-12].

[13] 刘帅,郭焱,田欧南.农民专业合作社分布特征及原因分析——以首批农民专业合作社示范社为例[J].地理科学,2014,34(3): 316-321.

[14] 张连刚,陈星宇,谢彦明.农民专业合作社参与和乡村治理绩效提升:作用机制与依存条件——基于4个典型示范社的跨案例分析[J].中国农村经济,2023(6):139-160.

[15] 孙天合,马彦丽,孙永珍.农民专业合作社理事长提高社员有效参与的行为意向研究[J].农业技术经济,2021(11):130-144.

引用格式:杨奇明,施丹燕,沈梦露,黄颖.2014-2020年国家农民专业合作社示范社基本信息数据集[J].农业大数据学报,2024,6(1): 94-102. DOI: 10.19788/ j.issn.2096-6369.100006.

CITATION: YANG QiMing, SHI DanYan, SHEN MengLu, HUANG Ying. Panel Data Set of The National Model Society of Specialized Farmers' Cooperatives from 2014 to 2020[J]. Journal of Agricultural Big Data, 2024,6(1): 94-102. DOI: 10.19788/j.issn.2096-6369.100006.

Panel Data Set of The National Model Society of Specialized Farmers' Cooperatives from 2014 to 2020

YANG QiMing1, SHI DanYan2, SHEN MengLu2*, HUANG Ying2

1. Zhejiang Sci-Tech University, Hangzhou 310000, China; 2. Qiyan Data Technology (Hangzhou) Co., Ltd, Hangzhou 310000, China

Abstract: The National Model Society of Specialized Farmers' Cooperatives is a model organization established at the national level to promote and demonstrate the good experience and practices of specialized farmers' cooperatives. It is supported and guided by the government, enjoys the support of special policies and resources, and assumes the responsibility of leading by example. The construction of basic information data set of national model cooperatives can provide data basis for evaluating the effect of cooperative support policies, and on this basis can provide decision-making reference for the government to formulate high-quality development policies for new agricultural business entities. Based on the Interim Measures for the Assessment and Monitoring of National Demonstration Cooperatives for Specialized Farmers (Agricultural Economic Development (2013) No. 10, hereinafter referred to as the Measures), this data set collects and collates the list of National Demonstration Cooperatives for Specialized Farmers published by relevant ministries and commissions from 2014 to 2020, and matches the years when they were selected and removed from the list of National Demonstration Cooperatives. As well as the year of establishment, the year of withdrawal (note cancellation), and the county-level administrative division of the location, the panel data including the information of more than 10,000 national model cooperatives are finally formed. Through this data set, we can better understand the life cycle and survival of high-quality farmer cooperatives in different regions, and deeply analyze the regional differences in the high-quality development of cooperatives and the driving factors behind them.

Keywords: The National Model Society of Specialized Farmers' Cooperatives; panel data; new agricultural business entities; high-quality development of cooperatives

猜你喜欢
年份存量合格
特殊的一年
存量时代下,房企如何把握旧改成本?
我是合格的小会计
吉林存量收费公路的PPP改造
谁不合格?
什么是闰年?
一样的年份
做合格党员
腐败存量
盘活存量与扩大增量齐步走