杨军 范辽生
摘要:文章基于吉林一号高分辨率卫星以及中低分辨率卫星资料,利用实例分割法和改进的HRNetV2模型,对西湖龙井茶园进行初步自动提取,在此基础上结合人工解译,进一步获取精细空间分布和面积统计。通过新HRNetV2模型识别出的茶园边界与居住区以及山上林木边界清晰,纹理细腻丰富,茶园面积识别准确率接近92%。研究对西湖龙井品牌保护、数字化管理、精细化气象服务,以及茶树生长环境小气候研究具有重要意义。
关键词:西湖龙井;茶园;吉林一号;新HRNetV2模型
中图分类号:S571.1;S771.8 文献标识码:A 文章编号:1000-3150(2023)09-32-5
Research on Satellite Remote Sensing Identification of
Xihu Longjing Tea Plantation
YANG Jun, FAN Liaosheng
Hangzhou Meteorological Information Center, Hangzhou 310051, china
Abstract: The article was based on the high-resolution satellite data of Jilin-1 and the medium to low resolution satellite data. Using the instance segmentation method and the improved new HRNetV2 model, a preliminary automatic extraction of the Xihu Longjing tea gardens were carried out. On this basis, combined with manual interpretation, accurate spatial distribution and area statistics were further obtained. The boundaries of tea gardens, residential areas, and trees on the mountains identified by the new HRNetV2 model were clear, with delicate and rich textures. The accuracy of tea garden area recognition was close to 92%. The research was of great significance for the protection of the Xihu Longjing brand, digital management, refined meteorological services, and microclimate research in the growth environment.
Keywords: Xihu Longjing, tea plantation, Jilin-1, new HRNetV2 model
龙井茶种植历史悠久,唐代陆羽《茶经》中有灵隐和天竺寺庙僧人栽种茶树的记载。“西湖龙井”之名始于宋,盛于清。目前西湖龙井茶产区包括西湖区、西湖风景名胜区所辖区域,茶树总种植面积约1 440 hm2,土壤以黄筋泥、黄泥土、黄泥沙土为多,少部分潮红土和油黄泥等类型。主产区地形以丘陵山地为主,北高峰和南高峰是浙江杭州两座最高的山峰,海拔分別为314 m和256 m;山地以东北—西南走向为主,南临钱塘江,东北部接西湖,西北部临近西溪和五常湿地。西湖龙井茶茶树品种有龙井群体种、龙井43、龙井长叶等[1]。
近年来,随着以高分系列卫星和吉林一号等为代表的我国高分辨率遥感卫星的相继发射,亚米级分辨率影像上因其可以观测到更为细致的地表覆盖结构,反映真实的地物类型特点,越来越被广泛用于农业调查,尤其是第三次农业普查首次将遥感数据应用于农作物面积普查中[2],大量人工实地测量工作被遥感测量替代。范泽琳等[3]分析了吉林一号视频04 星推扫数据、高分一号以及哨兵二号(Sentinel-2)提取广西甘蔗种植区空间分布,认为基于高分一号数据和Sentinel-2数据的甘蔗种植区提取精度分别为87.76%和84.04%,均低于吉林一号94.06%的提取精度。王长青等[4]基于吉林一号光学A 星和哨兵一号(Sentinel-1)数据,利用SVM支持向量机方法对长春市净月潭国家森林公园进行了分类研究,认为吉林一号光学影像结合Sentinel-1强度数据和有效相干性数据能够提高通过遥感技术获得森林分类产品的精度,为森林保护提供更精确的数据信息。韩睿等[5]使用吉林一号卫星数据结合了深度学习等研究方法,提高了江苏省昆山市重点水体监测精度,为相关部门开展精细监测提供了科技支撑。朱瑞飞等[6]应用多层感知卷积神经网络多光谱影像分类方法,对印度纳西克研究区地表分类进行研究,结果表明吉林一号光谱卫星影像上的总体分类精度可达94%以上。
基于西湖龙井茶产区范围较小,茶园主要分布于坡地、谷地以及洼地,又因其种植历史悠久,缺乏统一规划布局,分布较为零散,本研究使用吉林一号(JL01)卫星0.75 m分辨率融合影像,结合高分6号(GF-6)、sentinel-2以及美国陆地卫星(Landsat8)等卫星资料,弥补中低分辨率遥感影像由于空间分辨率不足、地物空间细节信息有限且受混合像元的影响、单独依靠光谱特征不足以满足业务上对于作物精准分布识别的需求,实现优势互补,提高作物识别精度。
1 数据与方法
1.1 數据
研究使用JL01、GF-6、sentinel-2、Landsat8等卫星资料,相关卫星参数见表1。杭州行政区和水系以及数字高程等基础地理数据由相关单位提供。本文以高分辨率遥感影像为主,以中低分辨率多光谱影像为辅,对茶叶种植区的提取采用不同季节的多期影像。
本研究主要研究范围为119.92—120.22E,30.00—30.30N内,遥感影像时间从2019年秋季到2020年夏季,包括JL01、GF-6、Sentinel-2和Landsat8等卫星在西湖区质量好、云量小的覆盖的影像数据。
JL01有20191111、20191029、20191020、20200819共4期。
GF-6号有20200819、20200801、20200524、20200512、20200503、20200429、20200425、20200409、20200320、20200315、20200220、20191208、20191122、20190925共14期。
Sentinel-2有20200816、2020811、20200801、2020722、20200617、20200513、20200503、20200428、20200413、20200408、20200319、20200218、20191215、20191210、20191120、20191115、20191110、20191031共18期。
Landsat8有20200823、20200722、20200519、20200503、20200316、20191211、20191109、20191024共8期。
1.2 技术方法
本研究以JL01高分辨率遥感卫星为主,辅以中低分辨率多光谱遥感影像,结合杭州西湖龙井茶种植区的综合特征,使用实例分割法和基于改进的HRNetV2(High-resolution net,是2019年微软亚洲研究院提出的一种全新的用于机器学习的卷积神经网络架构,其特点是多种分辨率遥感数据融合,在图像检测分割方面表现优异)基础深度学习模型(以下简称新HRNetV2模型),对西湖龙井茶园进行初步自动提取,在此基础上结合人工解译,进一步获取茶园精细的空间分布和面积统计。
1.2.1 西湖龙井的样本集
新HRNetV2模型关键点在于样本的种类、质量和数量,本研究采用4种方式采集和优化800多个样本,其中茶叶样本200个,其他样本600多个。一是根据杭州市已有龙井茶地物的分布成果数据,从中选取样本;二是对特征简单地物,采用人工目视解译选择样本;对特征复杂、难以确定的地物进行实地人工考察;三是利用多光谱地物分类技术,结合中低分辨率影像丰富的光谱信息提取茶叶栅格产品;四是利用训练好的新HRNetV2模型,对影像进行分割提取,获取西湖龙井地物自动分割结果。
1.2.2 新HRNetV2模型训练并进行优化改进
新HRNetV2模型主体为4个并行的子网络(第一到第四阶段),每个子网络基于ResNet-50进行设计。从第一到第四阶段,特征图的分辨率逐渐降低一半,而通道数逐渐增加1倍。第一阶段为主网络,其逐渐并行加入低分辨率的子网络以建立第二、第三、第四阶段,各子网络之间通过交换单元进行信息交换,从而实现多尺度特征融合与提取。HRNetV2共有8个交换单元,即进行8次多尺度特征融合,最终的特征提取结果在高分辨率的主网络输出。新HRNetV2模型的特点是在整个特征提取过程中特征图始终保持高分辨率,从而得到更高精度的分割结果。
新HRNetV2模型首先在大规模公开数据集(ImageNet)上进行模型预训练,而后在研究人员自己标注的样本数据集上进行模型精调。优化过程中采用交叉熵作为损失函数,并使用分割精度和分割速度等评价指标对算法检测性能进行评价。
2 结果与分析
西湖龙井茶园新HRNetV2模型遥感识别结果见图1,而后通过人工判图的方式对自动提取结果进行一定程度的修正,已达到单个斑块准确率、覆盖准确率等要求。对自动提取结果中存疑的斑块,再次实地核查,将核查的结果补充为样本,丰富样本类型,提高识别精准度。
2.1 实地考察
实地考察的主要目的是对人工核查出颜色和纹理特征类似茶树种植区的疑似斑块的实地查证。核查主要发现:一是呈现颗粒状、梯田状或者稀疏植被的疑似斑块,这类斑块通过实地察看发现往往是稀疏林地;二是与茶叶斑块紧邻的质地均匀接近裸土的疑似斑块,这类斑块在图像中绿色与土色夹杂混合,纹理比较匀称,有明显的条横,经实地勘察发现主要为幼龄茶树;三是纹理特征类似茶树,但颜色呈现黑褐色的疑似斑块,这类斑块往往是黑色的茶园遮阳网。
2.2 识别精度
基于JL01高分辨率遥感卫星为主,辅以中低分辨率多光谱遥感影像,通过新HRNetV2模型识别出的茶园边界与居住区以及山上的林木边界清晰,纹理细腻丰富。卫星遥感识别出西湖龙井茶园面积1 400.63 hm2,与2022年杭州市统计局统计年鉴中西湖区茶园面积1 524.2 hm2相比,遥感识别茶园面积偏少123.65 hm2,识别准确率接近92%。遥感识别的误差,一方面受卫星数据分辨率制约,存在零散微小茶园图斑的遗漏情况,还有某些在高大树木下的茶地无法进行识别;二是受卫星影像“同物异谱,同谱异物”的影响,同一类地物具有不相似的色彩和纹理,或者不同地物具有相似的色彩和纹理;三是对疑似茶园的判断上仍存在不确定性,虽然通过实地调查的方式对疑似斑块进行确认,但仍不能避免某些斑块的误判。
2.3 茶园地块分布
西湖龙井茶园分布较为集中,茶园所在的山地以东南—西南、南—北走向为主,面积在0.067 hm2以上的茶园多分布在海拔30~260 m以及坡度在5°~20°的谷地、坡地和洼地。
遥感反演识别茶园总计约1 540个,其中西湖风景名胜区范围内444个,西湖区范围内1 096个,不同面积茶园分布情况见表2。西湖风景名胜区识别茶园最小面积约40 m2,位于杨梅岭;最大约356 390 m2,位于翁家山。西湖区范围内最小茶园面积约55 m2,位于沈家弄社区;最大约555 055 m2,位于桐坞。在识别过程中,也对茶园的季节差异进行了分析,由于茶树为常绿植物,大多春季采摘,其他季节以灌溉、修剪、施肥等田间管理为主,对秋冬季的识别结果比对后发现,主要差别在茶园的边缘范围,对于新开垦的茶园,特别是两三年以内的植株稀疏,冬季和其他季节相比植被覆盖度差别较大;春夏和秋季相比主要是由于茶园修剪造成的植被覆盖特征差异。
3 小结与讨论
遥感技术是气象信息获取的重要技术手段,为气象信息的全面性、及时性和准确性奠定了重要基础。近几年来,国内发射大量高分辨遥感卫星并进行星座组网,高分辨率遥感技术的快速发展,为精细化的农业监测带来了质的飞跃。本研究使用“亚米级”分辨率的光学遥感卫星影像包含地物丰富的纹理、形状、结构、邻域关系等信息,结合中低分辨率的遥感卫星资料,以新HRNetV2模型提取西湖龍井茶园的空间分布信息,对于西湖龙井茶的精细气象服务提供了技术支持。
数字化西湖龙井茶园分布信息对于龙井茶品牌的保护、产量估算以及田间管理有重要的意义。农业等监管部门可以把更多的资源和注意力放在较大面积的重点区域茶园的保护及监管,还可以对不同面积大小、坡度以及海拔的茶园采用不同的田间管理模式,提高茶园管理的效率。数字化龙井茶园的分布信息,对于农业信息的普查和常规统计,也是一种有益的补充。
参考文献
[1] 中华全国供销合作总社. 西湖龙井茶: GH/T 1115—2015[S/OL]. 2015. [2023-08-17]. http://down.foodmate.net/standard/yulan.php?itemid=49227.
[2] 高园园, 孙畅, 袁如金. 地理国情普查成果在第三次农业普查中的应用研究[J]. 测绘与空间地理信息, 2019, 42(1): 102-105.
[3] 范泽琳, 曲春梅, 朱瑞飞, 等. 吉林一号在广西甘蔗种植区提取中的应用[J]. 卫星应用, 2020(3): 34-37, 46.
[4] 王长青, 李贝贝, 朱瑞飞, 等. 哨兵一号协同吉林一号影像的树种识别研究[J]. 森林工程, 2020, 36(2): 40-48.
[5] 韩睿, 黄鹏, 芦楠, 等. 吉林一号在地表水遥感监测中的应用[J]. 卫星应用, 2020(3): 47-53.
[6] 朱瑞飞, 马经宇, 李竺强, 等. 多层感知卷积神经网络的国产多光谱影像分类[J]. 光学学报, 2020, 40(15): 200-212.