顾 颖,祁小敏
1.南京市信息中心,江苏 南京 210000
2.东南大学,江苏 南京 210000
农民或相关农业管理人员合理应用农业大数据,能够减少农业生产成本,了解农业市场概况,提高农民收入[1-4]。农业大数据存在异构性,数据格式不具有一致性,且数量巨大,使用传统的数据管理平台不能实现农业大数据的精准挖掘,基于此,本文设计一种基于GIS 的南京市农业大数据可视化平台,该平台合理应用GIS 技术的通信优势与数据采集、查询、可视化等优势,引入基于模糊改进聚类分析的农业数据挖掘方法,可实现南京市农业大数据可视化处理。
基于GIS 的南京市农业大数据可视化平台的底层支持技术为GPS 技术,是集农业大数据采集、存储、查询于一体的可视化平台[5]。基于GIS 的南京市农业大数据可视化平台整体架构如图1 所示。
图1 基于GIS 的南京市农业大数据可视化平台架构图Fig.1 The framework of agricultural big data visualization platform on GIS in Nanjing City
基于GIS 的南京市农业大数据可视化平台中核心应用单元依次为数据采集模块、嵌入式操作系统、GIS 终端。数据采集模块主要用于采集南京市农业大数据,通过GPS 通信上传至因特网,通过因特网存储于服务器中;嵌入式操作系统为基于GIS 的南京市农业大数据可视化平台的可视化操作的核心单元,可为用户提供农业大数据可视化操作[6];GIS 终端主要用来和GPS 通信,信道链路是串口传输,传输的数据主要用于嵌入式操作系统所用。GIS 应用层使用可视化模式设计方法,实现可视化编辑,通过串口通信的形式将数据导出至可视化操作界面反馈给用户[7]。
1.2.1 可视化模式设计方法 基于GIS 的南京市农业大数据可视化模式图如图2 所示。
图2 基于GIS 的南京市农业大数据可视化模式图Fig.2 GIS-based visualization model of agricultural big data in Nanjing City
如图2 所示,基于GIS 的南京市农业大数据可视化模式存在多样化特征。支持三维显示模式,三维显示模式主要包含栅格图生成、农业数据矢量化、等值线绘制三步骤;支持农业数据地图显示,地图查询结果以表格显示模式反馈至用户。可视化模式多样,功能齐全,具有较好使用价值。
1.2.2 基于模糊改进聚类分析的农业数据挖掘方法 使用粒子群混沌差分训练对模糊C 均值聚类算法实施改进。将基于GIS 的南京市农业大数据聚类特征采样样本值集设成为基于GIS 的南京市农业大数据聚类特征采样样本,分别在时间段H1,H2,...,Hn中的关联指向特征β是:
其中,cov 表示协方差;农业大数据中连续的关联指向属性依次为A、B;E(B)、E(A)分别表示农业大数据连续的关联指向属的聚类中心;n表示数量。将基于GIS 的南京市农业大数据实施聚类自适应训练:
式中,Q(A)、Q(B)为模糊C均值分布概率;V1(A,B)为农业大数据关联指向属性训练结果,Q(A∩B)表示农业大数据聚类的模糊C均值聚敛概率分布。建立基于GIS 的南京市农业大数据挖掘的聚类目标函数Kn:
获取农业大数据聚类目标函数的最优解,优化寻优性能,实现模糊C均值数据聚类改进。使用改进算法获取农业大数据聚类目标函数的最优解θ是:
其中,εji、εij分别为第i个农业大数据特征分解的第j种矢量、第j个农业大数据特征分解的第i种矢量中存在的混沌扰动量。θ即为最符合用户查询需求的农业数据。
实验分析中使用Java 语言实施编程,在Windows XP SP3 32 位系统计算机中开发本文平台,开发平台使用Myeclipsell 软件实现框架构建与程序代码的编写、测试。设定某用户登录本文平台后,查询2019 年1 月17 日年南京市蔬菜产地收购价、畜禽产地收购价、水产品产地收购价。
设置使用本文平台的并发用户量分别是5 个、15 个、25 个、35 个,用户查询南京市农业数据的种类分别是2019 年南京市高淳县黄瓜、辣椒、苹果、番茄、花菜、芹菜、莴苣的产量与售价,7种农业数据的数据量都设成3000 GB,测试本文平台在响应用户指令时的运行效果与反馈效果,如图3、图4 所示。分析图3、图4 可知,当并发用户量存在差异、用户查询南京市农业数据的种类存在差异时,本文平台的响应耗时低于1 s,最大值仅有702 ms,反馈的农业数据量最大值为2999 GB,最小值为2998 GB,反馈的数据较为全面,本文平台能够按照用户需求,获取最符合用户需求的全部农业数据信息。
为了测试平台对农业大数据的可视化效果,查询2019 年1 月17 日年南京市蔬菜产地收购价、畜禽产地收购价、水产品产地收购价与前一周价格相比后的变动值。平台反馈的效果图如图5 所示。
图5 平台反馈效果图Fig.5 Platform feedback renderings
图5 中,用户使用本文平台,查询2019 年1 月17 日年南京市蔬菜产地收购价、畜禽产地收购价、水产品产地收购价与前一周价格的变动值时,本文平台反馈结果十分清晰,价格变动值标注明显,一目了然,由此可证本文平台的可视化性能极好。
本文构建一种基于GIS 的南京市农业大数据可视化平台,并在实验中测试本文平台的使用效果,经测试得出:(1)用户在本文平台中查询2019 年1 月17 日年南京市蔬菜产地收购价、畜禽产地收购价、水产品产地收购价时,平台的可视化界面内容分类明确,品名、规格、收购价格分类明确;平台对多个地区、多种农业数据信息聚类效果较好,不存在聚类错误的情况。(2)当并发用户量存在差异、用户查询南京市农业数据种类存在差异时,本文平台响应耗时低于1s,最大值仅有702 ms,反馈的农业数据量最大值为2999 GB,最小值为2998 GB,反馈的农业数据较为全面;平台的对农业信息数据反馈结果十分清晰,可视化效果极佳。