大数据技术在乡村画像中的应用

2020-07-04 12:33李望月刘瑾等
中国信息化周报 2020年24期
关键词:画像农业用户

李望月 刘瑾等

随着国家大数据战略的实施推进,大数据技术蓬勃发展,正加速成为发现新知识、创造新价值的新一代生产力,其应用已渗入经济社会的各个微观单元,并逐渐成为各行各业寻求突破、创新发展的关键力量。

大数据技术同样已经渗入乡村发展的某些领域,其中,应用比较广泛的是农业领域。通过对气候、土壤、农作物基因库、农业传感器返回的数据等农业大数据进行挖掘、分析发现,大数据技术在推动精准农业实施建设方面做出了重要贡献,在农业产量预测、农业自然灾害的监测预警、农产品价格预测、农产品营销等方面的应用也取得了良好的效果。但到目前为止,无论是理论层面,还是实践层面,尚未有文献对大数据技术在乡村层面的系统性应用进行研究。

乡村大数据源

乡村大数据源是大数据技术开展乡村画像的基础。在对现有文献进行检索研究时,并未发现有关“乡村大数据”“农村大数据”的研究,但近两年关于“农业大数据”的研究逐渐增加,有学者从数据来源上梳理了国内外在农业科技活动中长期积累和整编的海量科学数据,即农业科学大数据,通过对其列出的数据源进行梳理发现,数量上汇集了12个国外数据源和30个国内数据源(包括6个地方政府门户开放数据),内容上大致可分为4类:自然条件与资源数据,如气象数据、地质数据、再生资源数据、空间数据等;农业经济数据,如宏观农业数据、生态农业、中国饲料数据库等;生命科学数据,如生物信息数据、细胞数据、微生物病毒数据、基因数据等;农业行政机构数据,主要来自于政府部门开放门户。

也有学者从农业大数据产生的角度,提出了农业物联网数据、农业遥感和农业无人机数据、农业网络数据、科研及农户生产经验数据4类农业大数据,设计了农业大数据平台整体架构,并对农业大数据的应用方向进行了论述。

农业大数据是乡村大数据的一部分。其中,省、市级别的乡村数据可在《中国农村统计年鉴》《中国农业机械工业年鉴》《中国环境统计年鉴》等公开年鉴中获取,而微观数据由各部门保存,一般不对外公开,外部组织机构也无法通过网络爬取获得。在国家或地方各部门拥有的乡村数据中,以农业普查数据中包含的农村信息最为全面,普查表中的行政村综合表和乡镇综合表囊括了乡村基本信息和特征信息;普查表中的农户基层表包括了村内农户生活、生产经营活动的方方面面,进一步丰富了乡村数据。农业普查数据可提供全面的乡村数据信息,局限性为每十年开展一次,最近一次是2016年开展的第三次全国农业普查。但随着近两年地方乡村振兴战略统计工作的开展,乡村振興战略统计的调查指标与普查指标具有较高的相似度,可对相同的指标进行不同年度的连续分析。除农业普查数据外,乡村层面还存在着数量可观的非传统数据。

大数据画像技术

大数据画像技术是大数据乡村画像的核心技术手段。大数据画像的概念来源于用户画像,用户画像的英文概念“user persona”最早由艾伦·库珀提出,其认为user persona是真实用户的虚拟代表,根据用户行为、动机等将用户分为不同的类型,从中抽取每类用户的社会属性、生活习惯、消费行为和兴趣偏好等信息的共同特征,并设定名字、照片、场景等要素对其进行描述。

用户画像又称为人群画像,是根据用户信息抽象出的一个标签化的用户模型,即用高度精练的特征描述一类人,例如年龄、性别、职业、兴趣偏好等。

大数据画像技术是用户画像在大数据环境下的延伸和发展,是基于大量传统数据和非传统数据、静态数据和动态数据、结构化数据和非结构化数据,使用统计分析、机器学习和人工智能等算法,构建模型、挖掘数据、提取特征并进行动态可视化展示的一门数据分析与展示技术。

在中国知网文献数据库中,以“大数据画像”“乡村画像”“画像”等关键词进行检索,对现有文献从画像对象、画像技术方法两个方面进行归纳总结。从画像对象来看,当前文献库中可检索到以“用户画像”“产品画像”“企业画像”“城市画像”为标题的研究,其中,“用户画像”作为画像技术的初始应用领域,研究的文献最多,应用也最为广泛,尤其是在互联网电商等,主要的大数据关联规则方法有APRORI算法、FPGrowth关联规则算法,这些方法主要应用于电商、金融等行业的用户画像。虽然当前关于特征值提取的方法很多,但是特征值挖掘和提取的准确性仍是要持续攻克的难点。

乡村振兴领域研究

乡村振兴领域的热点、重点及难点问题是大数据乡村画像的重要应用方向。学术界关于乡村振兴领域研究的热点、重点及难点问题的研究大多围绕着乡村振兴发展而开展,或是聚焦乡村振兴发展的产业兴旺、生态宜居、乡村文明、治理有效、生活富裕5个维度整体,或是聚焦某一个局部展开研究。

通过对乡村领域相关文献进行研究和分析,可以总结为:乡村振兴领域研究的热点是乡村振兴实施效果评价,文献以乡村振兴评价指标体系构建为主,部分文献选取对象进行实证分析;乡村振兴领域研究的重点是乡村振兴实施路径,当前文献大多对乡村振兴的某一方面进行重点研究,从问题导向给出乡村振兴的实施路径;乡村振兴领域研究的难点是乡村振兴差异化的前期规划,如黄祖辉提出要从区域新型城镇化战略和乡村差异化发展的实际出发,落实乡村振兴战略。其中,除乡村振兴的实施效果可以进行定量分析外,其他研究大多为定性分析。

大数据乡村画像系统的成果可以为乡村振兴领域热点、重点及难点问题的研究提供科学有力的支撑,在实际应用过程中,大数据乡村画像系统主要有三大作用。第一,充分了解乡村全貌。传统的乡村发展评价模型一般使用年鉴数据和调查数据,对互联网上大量可用数据的利用率不高,维度通常也局限于年鉴数据提供的信息,无法全面刻画乡村面貌。大数据乡村画像系统可以充分利用年鉴数据、政府网站公开数据等结构化数据,同时也可以利用地理位置信息、气候信息、政策文件信息等非结构化数据,多维度、全方位、立体化地对乡村发展情况进行描述,帮助政府根据乡村存在的现实问题,有针对性地制定政策。第二,寻找差异,为因地制宜发展乡村振兴提供理论支持。利用大数据乡村画像系统,可以对省份层面、地市层面、县域层面、乡镇层面以及行政村层面等各级行政区划的乡村振兴发展情况进行分析,应用范围广泛。通过对比,可以发现研究主体的优势和劣势,帮助当地政府因地制宜,开展“千村千面”个性化、特色化规划,解决规划的同质性和落地难等问题。同时,大数据乡村画像系统可智能化匹配生产条件、自然条件或者社会条件相似的标杆性乡村,帮助落后乡村找到适合当地的乡村振兴发展路径和实施路径。第三,监测乡村振兴政策实施效果。大数据乡村画像系统可以对乡村振兴发展情况进行连续时间的监测,通过对多年的数据和信息进行对比,系统可使用标签对分析结果进行展示,例如,某省份人均农林牧渔产值连续5年增加,乡村画像标签可展示为“连续5年人均农林牧渔产值增加”。

同时,大数据乡村画像系统也可设置预警机制,在指标值出现异常波动或者下降趋势时(针对正向指标),发出预警信号,帮助政府部门及时做出应对。

猜你喜欢
画像农业用户
国内农业
国内农业
国内农业
威猛的画像
擦亮“国”字招牌 发挥农业领跑作用
“00后”画像
画像
关注用户
关注用户
关注用户