[摘 要]地物分析在城乡规划、土地利用管理及环境保护等领域具有重要意义。然而,传统的人工方法在处理大规模遥感影像数据时存在效率低、成本高、精度不足等问题。随着人工智能技术的快速发展,其在遥感影像分类中的应用为解决这些问题提供了新的可能性。文章针对村镇地物分析任务,采用了7种经典的人工智能模型进行训练,并提出了一种集成方法对多模型结果进行融合。试验结果表明,该方法具有99.05%的分类准确率,显著提高了分类精度,可为村镇地物分析提供可靠的技术支持,也为城乡规划和土地管理等领域的决策提供了重要参考依据。
[关键词]地物分析;人工智能;城乡规划;图像分类
[中图分类号]TG333 [文献标志码]A [文章编号]2095–6487(2024)06–0138–03
Research on Remote Sensing Image Land Feature Classification Based on Artificial Intelligence
FENG Yong,FENG Ming
[Abstract]Feature analysis is of great significance in areas such as urban and rural planning, land use management, and environmental protection. However, traditional manual methods have problems such as low efficiency, high cost, and insufficient accuracy when processing large-scale remote sensing image data. With the rapid development of artificial intelligence technology, its application in remote sensing image classification provides new possibilities for solving these problems. The article focuses on the task of analyzing rural land features, using 7 classic artificial intelligence models for training, and proposing an integrated method to fuse the results of multiple models. The experimental results show that this method has a classification accuracy of 99.05%, significantly improving the classification accuracy. It can provide reliable technical support for the analysis of rural land features and important reference basis for decision-making in the fields of urban and rural planning and land management.
[Keywords]feature analysis; artificial intelligence; urban and rural planning; image classification
在当今社会,随着城市化进程的不断推进,对于村镇建设的规划与管理日益重要[1]。其中,地物分析作为村镇建设中的关键环节之一,其对于提高土地资源利用效率、规划城镇布局、推动乡村振兴等方面起着至关重要的作用。然而,地物识别在村镇建设中的实现却面临着一系列的挑战与难点。例如,由于村镇地块的复杂性和多样性,传统的地物识别方法通常难以满足准确性和效率性的要求。传统的基于规则或特征工程的方法在处理不同尺度、光照条件、遮挡等问题时表现欠佳,导致地物识别的精度难以达到实际需求。
为了应对这一挑战,近年来,深度学习技术作为一种强大的人工智能工具被引入到地物识别领域,并取得了显著的进展。深度学习技术以其优秀的特征学习能力和模式识别能力,为地物识别提供了全新的解决方案。通过深度学习模型,系统可以自动地学习和提取地物的抽象特征,从而实现对于不同地物类型的准确识别。这种数据驱动的方法不仅提高了地物识别的精度和鲁棒性,同时也减轻了人工处理的负担,极大地提升了地物分析的效率和可行性。文章针对人工智能模型在村镇建设地物分析中的应用展开研究。
1 背景
1.1 卷积神经网络
卷积神经网络是专门用于处理图像等网格结构数据的深度学习模型。通过卷积和池化操作,卷积神经网络能够逐步提取输入数据的特征,具备优秀的特征学习和层级抽象能力,在计算机视觉任务中取得了较大成功。在地物识别领域,卷积神经网络直接从原始数据中学习特征,避免了手工设计特征的繁琐过程,为村镇建设地块识别提供了可行的解决方案。
1.2 视觉自注意力模型
视觉自注意力模型是一种深度学习模型,能够处理图像数据并捕捉全局上下文和长距离依赖关系。与传统的卷积神经网络不同,其采用自注意力机制进行计算,具有更好的并行性和可扩展性。在地物识别中,其已显示出与卷积神经网络相媲美甚至超越的性能,为村镇建设地块识别提供了有前景的解决方案。
1.3 卷积–注意力混合模型
近年来,研究者们将卷积神经网络与视觉自注意力模型相结合,形成了卷积–注意力混合模型,以提高图像处理任务性能。在这种混合模型中,卷积神经网络负责提取局部特征,而视觉自注意力模型则捕捉全局信息和长距离依赖关系,使模型能更全面地理解图像内容,提高识别任务的准确性和鲁棒性。在地物识别领域,这种混合模型表现良好,有望进一步提高地块识别的精度和效率。
2 方法
2.1 通用分类网络
文章对现有分类模型进行了广泛的调研,并最终选定了7种神经网络模型用于村镇建设地物分析任务。这些模型包括5种卷积神经网络,即ResNet18、DenseNet121、InceptionV3、Xception和EfficientNet,以及一种视觉自注意力模型(Swin–Small)和一种卷积–注意力混合模型(ConvViT–Small)。
2.2 集成模型
在模型集成领域,常见的算法包括投票、堆叠、袋装和提升等。投票算法通过组合多个模型的预测结果,通过投票来确定最终的预测结果;堆叠算法将多个模型的预测结果作为特征输入到一个元模型中,进行再次预测;袋装算法通过对训练数据集进行有放回抽样来训练多个模型,并将它们的预测结果进行平均或投票;提升算法则通过迭代训练多个弱学习器,逐步提高模型性能。
文章采用了投票集成算法中的一种简单而有效的算法。具体来说,将每个模型对于每个样本的预测概率进行平均,得到最终的集成预测概率。然后,根据集成预测概率确定最终的分类结果。相比于单模型,文章所提集成算法具有以下优势:提高整体的稳健性和鲁棒性及泛化能力,更好地适应未见过的数据。
3 试验
3.1 数据集
文章使用了UCMercedLand–Use数据集,该数据集是一个常用于地物分类和土地利用分类的公开数据集之一。该数据集由21个地物类别组成,涵盖了从城市到农村等不同地区的高分辨率航拍图像。该数据集包括多种不同的地物类型,如棒球场、工业区、居民区、河流、森林等。每个类别都包含100张尺寸为256×256像素图像样本,总共包含了2 100张图像。将数据集随机划分为训练集、验证集和测试集,样本比例为60%∶20%∶20%。
3.2 评估指标
文章采用了准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1分数(F1)、Kappa分数(Kappa)及马修斯相关系数(MCC)等多种评估指标来全面评估地物分类模型的性能。这些评估指标能够帮助文章深入了解模型在不同方面的表现,从而更准确地评估其在实际应用中的可靠性和有效性。
3.3 超参数设置
文章使用了PyTorch Lightning框架进行模型训练,其版本为2.1.2,PyTorch版本为1.13.1。并将批大小设置为32,学习率为3×10–4。此外,还实施了一个停止策略,即如果模型在验证集合上10个周期内的准确率没有提升,则停止训练。所有试验均在一张英伟达3090Ti显卡上完成。
3.4 结果分析
文章通过对7种不同模型进行训练和评估,得到了它们在地物分类任务中的性能表现。模型性能评估见表1。
由表1可知,各个模型在不同的评估指标上表现出了一定的差异性。例如,DenseNet121和Xception模型在准确率和精确率上表现较好,而EfficientNetB0和ConvViT–Small模型在召回率和F1分数上表现更优。基于视觉自注意力的模型及卷积–自注意力混合模型相较于卷积模型在各个指标上没有明显提升。这表明不同的模型在地物分类任务中具有不同的优势和特点。然而,更值得关注的是,文章基于这7种模型的集成模型的结果。由表1可知,集成模型在所有评估指标上都表现出了最佳的性能,均达到了较高水平。集成模型的准确率达到了99.05%,远高于单个模型的表现。这说明通过多模型融合的方法,能够显著提升地物分类任务的性能。
8种不同的地物分类模型混淆矩阵如图1所示。矩阵的对角线元素表示模型正确分类的样本数量,非对角线元素则表示模型错误分类的样本数量。从图1可以看出,集成模型在每个类别上的分类准确性明显优于其他7种单模型。
尽管在试验中取得了一定的成果,但仍存在一些缺陷需要进一步解决;①训练数据和实际乡镇遥感影像数据之间存在一定差别。虽然文章尽可能选择了代表性的真实遥感影像数据集进行训练,但由于地域和环境的不同,模型在实际应用中可能面临新的挑战。②基于图像分类的方法可能存在分类不够细致的问题。在实际应用中,地物的分类可能需要更细致的划分,如像素级分类。
4 结束语
通过在实际遥感影像数据集上进行试验,文章验证了提出的集成模型相较于单模型具有明显更高的有效性。这表明多模型融合是一种有效的策略,可显著提升地物分类任务的性能。在当前社会发展和城乡建设过程中,对地物分类技术的需求日益增加。文章所提模型不仅能够提高地物分析的准确性,还能为村镇建设规划、资源管理和环境保护等方面提供重要支持。文章的成果不仅在地物分类领域取得了显著进展,还对促进村镇建设和社会发展具有重要意义。
参考文献
[1] 王阳,郭开明,苏练练.关于国土空间规划中城乡建设用地统筹的思考[J].西安建筑科技大学学报(自然科学版),2023,55(5):729-738.