王晓丽 胡乾浩 樊景超* 李 壮
(1.中国农业科学院农业信息研究所,北京 100081;2.中国农业科学院果树研究所,辽宁 125100;3.国家农业科学数据中心,北京 100081;4.农业农村部农业大数据重点实验室,北京 100081)
数据库(集)基本信息简介
氮素对苹果树的生长发育、苹果的营养及产量等都有着非常重要的作用。准确高效地估算苹果树中的氮元素含量是苹果树科学施肥的重要环节,也是苹果业优质生产的重要因素。尽管使用传统方法监测叶片氮含量的精度较高,但是破坏性较大,而且时效性较低,尤其是对于大规模的快速监测挑战性较高。
随着光谱技术和图像处理技术的发展,利用光谱和图像分析等技术可建立植物的生化组分估测模型,从而达到快速无损检测目的。国内外很多学者收集了光谱、图像和生化组分的数据集。Laura Rustioni等通过反射光谱法鉴定和鉴别葡萄矿物质缺乏症状,对9 个葡萄品种不同处理的基部叶、幼叶和顶端叶进行光谱采集,采集部位在叶脉、脉间和叶缘处,收集的光谱范围在341 和1025nm 之间,总共945 个反射光谱[1]。徐娟等利用傅里叶变换红外光谱(FTIR)和电感耦合等离子体质谱(ICP-MS)对白色蚕豆和绿色蚕豆进行研究,收集了蚕豆叶中的多种矿质元素和光谱数据[2]。吕海鹏收集了131个普洱茶样品的近红外光谱数据和茶多酚含量等化学成分,建立了近红外光谱定量分析模型[3]。孟庆龙等人通过400~1000nm 高光谱成像系统采集了120 个“富士”苹果光谱图像数据[4]。
在苹果叶片光谱、图像及氮含量数据收集和研究方面,安静等采集了秋末86 组苹果叶片光谱和氮含量数据集[5]。房贤一采集了4个物候期的苹果树冠光谱及代表性叶片氮素含量数据集[6]。李丙智等测定了不同苹果品种350 个叶片自然光下的光谱反射率及对应的72 个氮数据集[7]。夏雪等收集了国家苹果资源圃中种植的170 余个品种8184 张苹果叶片图像数据集,并通过数据论文发表[8],郑艳梅等利用这些数据结合深度学习和引导滤波对苹果叶片图像进行分割,为苹果叶片几何参数的测定提供了一种新的测量方法[9]。
从前人的相关工作来看,多数研究仅获取了苹果叶片近红外光谱数据、矿质元素数据和图像数据的一种或两种,同时测定近红外光谱数据、氮元素及图像数据的数据集较少,本研究以嘎啦、华红、富士以及4种不同树龄的寒富苹果树为例,于2015 年5 月18 日—7 月22 日,每隔一周采集了光谱、图像和氮含量数据,以期为广大科研工作者从三个不同角度联合进行数据挖掘分析工作,进一步提高使用非破坏性手段测定苹果叶片营养诊断的数据支撑能力,并为今后利用高空遥感技术开展精准果业生产提供基础数据。
本研究选用果树为辽宁兴城,中国农业科学院果树研究所资源圃中嘎啦、华红、富士以及分别于2007、2011、2012、2013 年定植的寒富,各随机选取1株,每株树选取树冠外围向阳主枝作为目标主枝,并选取基部、中部和顶部3个部分各5片共15个样品。
考虑到该实验对果树具有破坏性,因此本研究从新梢生长期开始,每周摘取一次叶片(共10 周:2016年5 月18 日—7 月22 日)。每次采集叶片后,将叶片15 个一组放置于干净的袋子中(并做标记),放入带有冰块的恒温箱中,统一带回实验室。在实验室将叶片洗净并用专业滤纸将残留的水吸干后待测。
本实验使用美国ASD(AnalyticalSpectralDevice)公司的FieldSpec3 便携式光谱辐射计进行光谱测量;该仪器的有效光谱范围在350~2500 nm 之间,光谱分辨率为1nm。光谱仪需搭配Windows 系统环境的笔记本,并安装配套的采集软件。本实验使用Field‐SpecRS3(以下简称RS3)软件进行光谱采集、仪器优化和白板校正等。为保证仪器状态稳定,开机预热时间不少于1 小时[10-11]。探头为裸光纤,前视场角25°,测量时固定在样品正上方10cm 处,垂直于叶片的正面;使用光谱仪配套的50W 卤化灯作为室内光源(约3100 K 色温,模拟太阳光),并距离样品45cm 左右,45°的入射角;叶片正面朝上放置,以黑色不反光的棉布为背景[12]。
光谱的采集步骤如下:在确保光谱仪和笔记本电脑充满电的情况下进行。准备好用于校正的白板。打开光谱仪电源,然后再打开电脑电源,并将电脑进行网络连接,确保电脑与仪器连接成功。启动RS3软件,在“Control/adjustconfiguration”窗口上调整光谱平均值、暗电流平均(一般为60)和白板采集次数(一般为30)。在“Control/spectrum save”窗口中选择存储路径、命名规则及其他内容。测量时,镜头首先对准白板,点击OPT 进行优化,此时光谱呈一条直线;然后点击WR 采集参比光谱,此时软件进入测量状态;最后,将镜头移向被测叶片,按空格键保存反射光谱。使用完毕需先关电脑,后关闭仪器。在测量过程中需注意:白板校准时确保白板充满探头视场;每隔10 min 进行一次白板校正和优化,每隔3~5 分钟采集一次暗电流。每次采集10 次光谱数据求平均后存储在指定文件夹生成1 条.asd 数据,每个样本采集10次,生成10 条数据。采集的数据格式为ASCII 文件,后期可通过ASD公司的ViewSpecPro软件查看,并可转化为.txt 等格式,按照约定的协议进行数据分析读取工作。
本实验采用Tecator 凯氏定氮仪法测定叶片全氮浓度,将采集的叶片用蒸馏水洗净后,在105℃杀青10~15min,80℃下烘干。每次将不同样品分三份分别粉碎,经过消煮、蒸馏后,进行滴定,三份结果平均后得到当日每种样品的氮元素平均含量。采集的数据以excel文件格式保存。
本实验使用尼康D90 型数码相机和尼克尔镜头进行叶片图像数据采集。D90 采用了有效像素为1230 的DX 格式CMOS 传感器;感应器尺寸为23.6x15.8mm;感光度为200~3200;具有11点自动对焦区域;快门时滞大约65 毫秒;具有测光控制和自动D-Lighting 功能,可弥补图片中的细节丢失;支持NEF、JPEG、AVI 图片存储格式,文件自动编号;文件最大尺寸4288像素×2848像素,最多可拍1850 张左右。
在采集叶片图像时,将叶片置于配有标尺的黑色平板上,通过标尺可测量叶片的宽度和长度。为避免阴影产生,同时确保光照强度稳定,分别在左右两侧架设一盏摄影灯。将相机无倾斜的置于距离叶片上方40cm 左右,并使用自动曝光模式进行拍摄。图像格式为JPEG,尺寸为4288像素×2848像素[8]。
不同苹果品种或树龄的叶片光谱数据单独保存为一个文件夹,每10 条连续的.asd 数据为同一样本的光谱数据,如:“001_20160518_01_01”~“001_20160518_01_10”为同一叶片的光谱数据。文件夹命名方式为“序号+品种名+日期”,每个光谱数据命名方式为“序号+品种名+日期+样本编号+同一样本光谱序号”。部分样本示例如图1所示。
苹果叶片图像数据中每个品种的图像按日期保存在独立的文件夹中,每张图像代表一个叶片样本。文件夹命名方式为“序号+品种名+日期”,每个图片数据的命名方式为“序号+品种名+日期+序号”。部分样本示例如图2所示。
由于测量矿质元素需要一定数量的叶片,因此同一品种每日的15 个叶片分3 组测试,求平均测得1 条矿质元素数据,excel包含品种名称、采集日期和氮含量等6列,如表1所示。
表1 部分苹果叶片氮含量数据表Tab.1 Data sheet of nitrogen content in some apple leaves
为确保数据质量和可靠性,所有苹果叶片均采集于国家级苹果标准资源圃,由中国农业科学院果树研究所的专业人员进行果树品种鉴别、实验操作规范指导和矿质元素数据测量。采用国际通用的光谱采样方法采集叶片近红外光谱数据。采用高清相机进行图像采集,并使用国际通用的JPEG 格式进行存储。图像采集时使用标准刻度尺作为参考,刻度单位为毫米,可为使用者提取叶片大小提供依据。
数据采集与整理过程中,采用人工核准和仪器检测结合的方式来控制元数据质量。在人工核准时,如果发现某样本叶片存在颜色异常、叶面或叶背有斑等情况,则认为叶片样本数据可疑。随后,使用检测仪器进行确认,如检测结果为带病叶片,则将问题样本数据剔除。
不同苹果叶片在形状、颜色和尺寸等方面会展示不同的图像信息,同时光谱和氮元素值也不同,因此在使用此数据集时可对光谱、图像和矿质元素之间的关系进行分析研究,探索使用光谱和图像分析矿质元素含量的方法。本数据集是每隔一周测试,共10 周,可考虑加入时间元素进行分析。另外,使用数据集时可以对不同品种以及同一品系类别(寒富)中的不同树龄进行对比分析。
数据作者分工职责
王晓丽(1982—),女,河北栾城人,博士,助理研究员,主要从事果园数据获取与分析研究。主要承担工作:数据整理与分类汇总。
胡乾浩(1993—),男,北京人,硕士,助理研究员,主要从事果园数据获取与分析研究。主要承担工作:光谱和图像数据采集。
樊景超(1980—),男,辽宁沈阳人,博士,副研究员,主要从事果园数据获取与分析研究。主要承担工作:总体方案设计与组织实施。
李 壮(1975—),男,吉林蛟县人,博士,副研究员,主要从事果树资源数据集成与共享研究。主要承担工作:数据采集组织实施和氮元素数据采集。