周国民+樊景超+吴定峰+夏雪+丘耘
摘 要:针对果园环境采集数据的交换和共享规范缺乏的问题,采用可变数据采集指标项的设计方法,在分析果园环境数据特点的基础上,提出了一种果园环境采集数据表示格式。该格式的语法规范采用Schema来定义,包括43个元素,其根元素是
关键词:果园;环境数据;数据表示;XML
中图分类号:TP274+2 文献标识码:A DOI 编码:10.3969/j.issn.1006-6500.2015.12.018
Data Acquisition and Data Format of Orchard Environment based on XML
ZHOU Guo-min,FAN Jing-chao,WU Ding-feng,XIA Xue,QIU Yun
(Agricultural Information Institute, Chinese Academy of Agricultural Sciences, Beijing 100081, China)
Abstract:According to the lack of exchanging and sharing data format in the orchard environment,based on analyzing the characteristics of the orchard environment data, an orchard environment data format which was expressed by Schema XML was presented by method of variable data acquisition indicator. It consisted of 43 elements. The root element was <OrchardEnvironmentData>, and consisted of 7 elements: <Version>, <BeginDate>, <EndDate>, <Orchard>, <FruitVariety>, <RecordingDefinition>, <RecordSet>. Its feasibility was verified by the actual application of data representation which acquired by the Orchard Data Acquisition System, and by the data share application in Internet.
key words:orchard;environment data;data format;XML
突破传统果业的限制,发展现代果业是我国水果产业发展的必然趋势。现代果业的重要特征是果园生产和管理的数字化、信息化、机械化,数字果园的概念也应运而生[1]。果园环境涉及的数字化对象包括空气温湿度、光照强度、光有效辐射、紫外线强度、降雨量、风速、风向、露点、土壤水分含量、土壤温度、土壤NPK含量、土壤微量元素含量、土壤重金属含量等。近年来,果园环境数据采集系统的研制与应用已得到重视,相关研究也比较多。在围绕某一个指标进行数据采集和监测的研究方面,Changying Li[2]报道了一种气体传感器阵列监测蓝莓果实病害的方法,樊志平等[3]设计实现了柑橘园土壤墒情远程监控系统,李光林等[4]研制了一种基于太阳能的柑桔园自动灌溉与土壤含水率监测系统, 张会霞等[5]利用“3S”技术设计实现了一种柑橘园GPS数据采集系统。在对整个果园环境多个指标进行数据采集和综合管理的研究方面,叶娜等[6]报道了一种苹果园环境监控系统的研究与设计,王新忠等[7]研究了基于无线传感的丘陵葡萄园环境监测系统,杨爱洁等[8]提出了一种基于无线传感器网络的果园数字信息采集与管理系统,王文山等[9]采用物联网技术设计了一种果园环境信息监测系统。另外,还有一些学者的研究则侧重在果园环境数据采集所涉及的信息通讯技术,如Raul Morais等[10]报道了用于葡萄精准管理的多点环境数据采集装置,岳学军等[11]采用GPRS和ZigBee技术实现了果园环境监测系统,潘鹤立等[12]采用ZigBee和3G/4G技术研究分布式果园远程环境监控系统的设计,徐兴等[13]报道了山地橘园无线环境监测系统优化设计方法及如何提高监测的有效性。综上,这些研究工作基本上都是在利用多种信息技术来实现果园环境数据的获取和监测,不同的是使用的监测指标和监测手段有所差异,但他们都对所获取的数据多采用私有的数据格式进行存贮和管理,对如何把所监测的数据与其他信息系统进行交换和共享则几乎没有涉及。
近年来如何从技术角度来消除“信息孤岛”,解决信息系统之间的数据交换问题受到很多研究者的关注,常志国等[14]提出了一种交通信息基础数据元XML Schema表示模型来解决交通信息系统之间的数据交换和共享,潘峰等[15]构建了国家卫生数据字典XML Schem来实现卫生数据的交换与共享,农业领域也有学者开展数据交换和共享方面的研究,如戴建国等[16]针对国营农场管理报道了基于 REST 架构和XML的农情数据共享技术研究,陈宏等[17]提出了蔬菜种植元数据模型信息描述方法。但针对果园环境数据表示以及数据共享技术方面的研究几乎没有涉及。
本研究在分析果园环境数据内涵的基础上,研究基于XML技术的果园环境采集数据表示技术,重点解决果园环境采集数据的表示格式,为不同系统之间果园环境采集数据的交换和共享应用提供支撑。
1 材料和方法
1.1 果园环境数据分析
果园环境是果园中果树群体以外的空间,以及直接或间接影响该果树群体生存与活动的外部条件的总和。果园环境包括非生物因素和生物因素两方面,非生物因素是指温度、光、水分、空气、土壤、地形、污染等环境因素;生物因素是指果树以外的动物、植物、微生物等环境因素。果园环境采集数据就是利用技术手段获取的各种环境因子的状态数据或者特征数据,从数据形态上来看,有数值、字符、图像、视频、声音、矢量等。
果园气候环境因子方面,大气、温度、光照、水分等气候因子与果树生产有密切的关系,目前利用物联网技术可直接采集的数据包括空气温湿度、光照强度、光有效辐射、紫外线强度、降雨量、风速、风向、露点等。
果园土壤环境因子方面,利用物联网技术或者实验室检测手段可以采集的数据有土壤含水率、土壤pH值、土壤有机质含量、土壤电导率、土壤温湿度、土壤重金属含量、地下水位、土壤盐分等。其中,土壤有机质含量是评价果园土壤肥力的重要指标,也是影响果树生长的重要因素。土壤水分是果树吸收水分的主要来源,土壤湿度过低时,果树吸水困难,甚至凋萎,但如果土壤湿度过高,又会发生渍害,土壤水分含量影响着果树的产量和品质。土壤中重金属含量影响着果品安全,也越来越受到人们的关注。
果园地形环境因子方面,一般利用遥感技术和GIS技术获取和管理果园的地形起伏、海拔、山脉、坡度、坡向、高度等地貌特征数据。
果园生物环境因子方面,果园病虫害和杂草方面的数据更受关注。近来利用现代信息技术手段自动测报果园病虫害数据得到研究和应用部门重视。伍梅霞等[18]报道了自动虫情测报灯在果园有害生物测报上的初步应用情况。邢东兴等[19]利用光谱数据定量化测评红蜘蛛虫害对红富士苹果树的危害程度。
1.2 果园环境采集数据表示格式设计方法
果园环境采集数据不但为果园生产管理系统提供支撑,同时也是果品质量追溯、果品电子商务等果园经营管理系统的数据源之一,果园环境采集数据需要在不同管理系统之间实现自动交换和共享。现有的果园数据采集与管理系统一般采用私有的数据格式进行数据存贮和管理,因此需要设计一个果园环境采集数据表示格式,基于这样的标准格式,才能在不同系统之间实现数据的自动交换和共享。
XML(Extensible markup language)是国际互联网联盟(W3C)开发的用于网络环境下进行数据交换和管理的技术[20],它以一种开放的、自我描述的方式定义数据结构,通过Schema使XML文档结构化,并能创建不依赖于平台、语言或者格式的共享数据。近年来,农业领域一些学者也开始采用XML技术来研究农业数据元数据标准以及数据表示。日本学者吉田智一[21]提出了农业生产工程管理中的数据表示格式FIX-pms,欧洲学者Martini[22]提出了用于农业信息交换的agriXchange格式规范,Kunisch M[22-23]提出了针对农场的信息表示格式规范agroXML。本研究也采用XML技术来描述果园环境采集数据。
果园环境因子众多,不同果园因管理目的不同,所选择的采集指标也不同,不同采集指标的采样频率也不尽相同。为了提高果园环境采集数据表示格式的通用性,本研究采用可变采集指标项的数据表示方法。该方法把果园环境采集数据文件分为两个部分。第一部分用来定义所选择的采集指标项情况,包括指标名称、数据单位、数据采集点的GPS坐标、数据采用方法说明。第二部分用来顺序存放所采集的数据,每条数据中采集指标项的次序与第一部分定义的数据采集指标项相对应。
2 结果与分析
2.1 果园环境采集数据格式的Schema
果园环境采集数据采用XML文件来存贮,按照可变采集指标项的数据表示方法,其XML文件的语法规则采用Schema文件来定义。在Schema文件中,按照基本数据类型、基础子元素类型、子元素类型、根等4个层次,一共定义了43个元素。Schema文件中各元素之间逻辑关系如图1所示。
从图1可以看出,果园环境采集数据表示格式的根元素是<OrchardEnvironmentData>,它由<Version>、<BeginDate>、<EndDate>、<Orchard>、<FruitVariety>、<RecordingDefinition>、 <RecordSet>这7个元素组成。版本元素<Version>描述了果园环境数据表示格式所采用的XML Schemas版本号。时间元素< BeginDate > EndDate >描述果园环境数据采集的开始时间和结束时间。<Orchard>元素描述果园名称和果园ID号, < FruitVariety>元素描述水果品种名称、学名和ID号。通过这两个元素的ID号可以把果园的环境数据与其他生产经营管理数据进行关联。<RecordingDefinition>元素描述数据存贮的结构,是对具体数据记录存放形式的解释,由若干个数字型、矢量型、图像型、视频数据型、声音型、备注型的数据采集指标项的结构定义组成,支持可变指标项的定义,可根据实际情况来决定数据采集指标项的数量。<RecordSet>元素是实际采集数据的记录实体,由顺序存放的<Record>元素组成,<Record>元素中的数据项和<RecordingDefinition>元素中定义的数据采集指标项是一一对应的,并通过数据采集指标项中的<index>元素值来关联。
2.2 果园环境采集数据表示格式实例
以位于陕西洛川某果园的数据采集系统为例,其数据采集点现场以及采集数据的快照如图2。各种传感器采集的果园环境数据由专门系统来进行管理,并存贮在SQL Server数据库中。
根据Schema文件中所规定的语法形式,就可以把SQL Server数据库中存贮的果园环境数据表示成XML格式的数据。图3是所形成的果园采集环境数据XML文件的片段。如图3所示,在<RecordingDefinition>元素部分,定义了所采集的指标项分别是大气温度、大气湿度、降雨量、监测点1的土壤温湿度和监测点2的土壤温湿度以及光合辐射,这些数据都是DataItem型,如果涉及到监测点的GPS坐标,则在<Coord>元素中定义。在< RecordSet >元素部分,则通过<Record>元素来顺序存放所采集的数据。
2.3 果园环境采集数据表示格式的应用
对于现有的果园数据采集与管理系统来说,利用本文所述的果园环境数据表示格式,不需要改变其数据存贮形式和相应的管理程序,只需在此基础上,通过一个数据转换程序,把果园的环境数据转换成符合果园环境数据表示格式的XML文件,然后通过webservices技术实现一个数据共享接口,需要使用这个果园的环境数据时,只需要调用这个数据共享接口,就能获得相关的数据。其应用方案的逻辑结构如图4,其特点在于不改造原有的果园数据采集系统,仅需通过新增加一个数据共享接口就能实现果园环境数据的共享应用。
果园环境数据共享服务包括3个接口。GetDataStruct接口返回数据结构定义信息,实际上就是<RecordingDefinition>元素中的内容。GetDataBeginEndDate接口返回已有数据的起始和结束日期,以图2所示的实例为例,其返回开始日期是2015-01-01T08:00:00,结束日期是2015-01-01T15:00:00。GetData接口返回指定起止日期的果园环境数据,实际输出形如图3的XML文件。
3 结 论
本研究设计了一种果园环境采集数据表示格式,并通过对某果园数据采集系统所采集数据的实际表示,以及在Internet环境中的共享应用,来验证果园环境采集数据表示格式的设计。结果表明,该格式的设计是可行的,并且具有潜在的良好性能:(1)数据格式简明易用;(2)系统集成简单,用户可以很方便地建立起一个网络化的果园环境数据集成共享系统;(3)透明,用户关心的事情少,并不需要知道原有果园数据采集系统的实现细节,只需要了解能提供的服务。
参考文献:
[1] 周国民.数字果园研究现状与应用前景展望[J].农业展望,2015,11(5):61-63.
[2] LI C Y, GERARD W K, JI P S, et al. Gas sensor array for blueberry fruit disease detection and classification[J]. Postharvest Biology and Technology,2010, 55:144-149.
[3] 樊志平,洪添胜,刘志壮,等. 柑橘园土壤墒情远程监控系统设计与实现[J].农业工程学报,2010,26(8):205-210.
[4] 李光林,李晓东,曾庆欣. 基于太阳能的柑桔园自动灌溉与土壤含水率监测系统研制[J].农业工程学报,2012,28(12):146-152.
[5] 张会霞,陈宇晖,望勇. “数字果园”GPS 数据采集系统的设计与实现[J].广东农业科学,2014,41(5):227-231.
[6] 叶娜,钱稷,刘俊峰,等. 苹果园环境监控系统的研究与设计[J].农机化研究,2010,32(10):55-58.
[7] 王新忠,顾开新,陆海燕. 基于无线传感的丘陵葡萄园环境监测系统研究[J].农机化研究,2011,33(11):191-194.
[8] 杨爱洁,沈焱鑫,金丹娜,等. 基于无线传感器网络的果园数字信息采集与管理系统[J].农业工程,2011,1(1):37-41.
[9] 王文山,柳平增,臧官胜,等. 基于物联网的果园环境信息监测系统的设计[J].山东农业大学学报(自然科学版),2012,43(2):239-243.
[10] RAUL M, MIGUEL A, FERNANDES S G, et al. A ZigBee multi-powered wireless acquisition device for remote sensing applications in precision viticulture[J].Computers and Electronics in Agriculture, 2008, 62: 94-106.
[11] 岳学军,王叶夫,刘永鑫,等. 基于GPRS与ZigBee的果园环境监测系统[J].华南农业大学学报,2014,(4):109-113.
[12] 潘鹤立,景林,钟凤林,等. 基于ZigBee和3G/4G技术的分布式果园远程环境监控系统的设计[J].福建农林大学学报(自然科学版),2014,43(6):661-667.
[13] 徐兴,洪添胜,岳学军,等. 山地橘园无线环境监测系统优化设计及提高监测有效性[J].农业工程学报,2013,29(11):147-153.
[14] 常志国,张绍阳,曹金山,等. 交通信息基础数据元XML Schema表示模型[J].现代电子技术,2012,35(18):29-32.
[15]潘峰,刘丹红,杨鹏,等. 国家卫生数据字典XML Schem的构建[J].第四军医大学学报,2009,30(10):869-872.
[16] 戴建国,王克如,李少昆,等.基于 REST 架构和XML 的农情数据共享研究[J].中国农业科学, 2012, 45(20):4156-4165.
[17] 陈宏,赵健,池美香,等. 蔬菜种植元数据模型信息描述研究[J].安徽农业科学,2012,40(3):1288 -1290,1475.
[18] 伍梅霞,李立国,杨小平,等. 自动虫情测报灯在果园有害生物测报上的应用初报[J].山西果树,2012(2):8-9.
[19] 邢东兴,常庆瑞. 基于光谱反射率的果树病虫害级别定量化测评[J]. 西北农林科技大学学报(自然科学版), 2009, 37(11):143-148.
[20] W3C.Extensible Markup Language(XML) 1.0[EB/OL].[2015-03-18]. http://www.w3.org/TR/1998/REC-XML-19980210.
[21] 吉田智一,木浦卓治,南石晃明. 農業生産工程管理データ表現形式FIX-pms の開発[J].農業情報研究, 2013,22 (2):103-116.
[22] MARTINI D, MIETZSCH M. The agriXchange platform as a means for coordination and support on data exchange in agriculture [C]// Proc of the Joint Congress of EFITA 2011 and WCCA 2011,Prague, Czech Republic. Berlin:Springer, 2011:393-399.
[23] KUNISCH M, FRISCH J, MARTINI D, et al. AgroXML-a standardized language for data exchange in agriculture[EB/OL].[2015-03-18].http://www.itfoodtrace.de/dateien/EFITA_Kunisch_et_al.pdf.