刘贾贾,刘志辉,李 凤
(河北省地震局,河北 石家庄 050800)
我国是一个多地震国家,历次地震造成的人员伤亡和财产损失主要是由建筑物遭到破坏引起的。建筑物的结构类型多样,不同结构类型的建筑物抗震性能也不同,尤其是老旧砖结构建筑,其建筑材料及抗震设计较差,存在很大的震害风险。现有的对建筑物结构类型进行数据获取的方式主要为实地调查[1-2],建筑物结构类型实地调查需要耗费巨大的人力、物力和时间,近年来日益成熟的遥感技术为建筑物结构类型的获取提供了一种新的方式。
遥感影像可以客观的反映地物信息,并能快速的采集到地物信息。随着遥感获取技术的快速发展,高分辨率遥感影像的出现,遥感信息提取技术不断完善,遥感影像的研究和应用领域越来越广泛。近年来大量学者致力于遥感影像在建筑领域的研究及应用:高分辨率遥感影像建筑物提取方法研究[3-5],通过遥感影像获取震后建筑物震害损毁情况[6-8],利用遥感影像对建筑物进行解译分类等。在对建筑物分类领域,邓飞、明小娜、张文静等[9-12]通过建筑物的解译标志进行了遥感影像的建筑物解译,与实际调查情况进行对比分析得出遥感目视解译结果与实际调查结果高度一致;党涛[13]基于多尺度分割和多特征对建筑物进行了提取,得出该方法可以得到高精度的建筑物提取成果;于书媛等[14]基于CART 决策树的面向对象的分类方法对研究区建筑物进行了分类提取,得出该方法对建筑物的提取精度较好;刘贾贾等[15]采用面向对象的多尺度分割方法对城镇建筑物进行了分类,得出该方法可以应用于城镇建筑物的分类。
城镇建筑物是以连片、成区的形式出现的,建筑物类型也以群的形式聚集出现,目前基于遥感的建筑物信息提取大多是基于单独建筑物进行提取,虽然精确度较高,但是在建筑物震害风险调查分析领域实用性较差。本文以建筑物群为研究对象,忽略同类建筑物间的少量空地、道路,以及一些零星的建筑物,采用面向对象的分类方法,运用监督分类方法对建筑物进行分类,对得到的结果与目视解译结果进行对比分析,得出此种方法的可行性。
遥感影像分类的方法根据是否需要先验知识分为监督分类和非监督分类两种[16]。监督分类法需要通过选取一定数量样本,对样本进行训练,训练样本的好坏与分类方法会影响最终的分类结果;非监督分类需要依靠影像上地物特征差别进行分类。本文是对怀来县县城进行建筑物提取,为了兼顾准确率和效率,采取了监督分类方法中的决策树(CART)、随机森林(Random Trees)两种分类方法。
决策树(CART)是通过对由测试变量和目标变量组成的训练数据集的循环分析生成二叉树形式的决策树结构[17-19]。通过生成的二叉树能够得到每次的决策过程和分类准则,其基尼系数定义如下:
(1)
(2)
式中:p(j/h)为从训练样本集中随机抽取的一个样本,当某一个测试变量值为h时属于第j类的概率;nj(h)为训练样本中测试变量值h时属于第j类的样本个数;n(h)为训练样本中变量值为h的样本个数;j为类别个数[17]。
随机森林(Random Trees)算法是由Breiman等提出的以决策树为基础分类器的集成分类器,随机森林算法分别为每个训练子集建立一个决策树,以N个生成的决策树构建出一个“森林”,每棵树生成的方式为随机选取样本、随机选取特征,在规则内任其生长,直到自动终止[20]。
怀来县隶属于河北省,东临北京,地处燕山山脉北侧,是连接北京和西北的交通枢纽。历史上该地区地震频发,近年来小震频繁,存在较高的地震风险隐患。因城镇比农村人口密集且建筑物结构类型多,抗震性能差异较大,地震时容易造成更大的震害及损失,以怀来县城为研究区。通过实地调查,研究区的建筑物主要有1层的砖结构房屋,4~6层的砖混结构多层房屋,7层以上的钢筋混凝土结构高层,1~2层大跨度厂房(图1)。该地的建筑物结构正处在新旧更替的过程中,存在大量20世纪90年代及以前的老旧建筑,该类建筑以一层砖结构为主,属于城中村,这些老旧建筑的抗震性能差,地震发生后极易发生危险;还存在少量2~3层沿街门脸和自建住房,该类建筑未做相应的抗震设计或构造措施,抗震性能较差,也存在震害隐患。
图1 怀来县城建筑物结构类型Fig.1 Building structure type in Huailai County
研究区采用谷歌三波段卫星遥感影像,空间分辨率为2.15 m(图2)。通过对怀来县城遥感影像的目视解译及实地调查,怀来县城卫星遥感影像主要分为4类:建筑物、裸地、道路和水体。本文通过ENVI软件在遥感影像上对建筑物、裸地、道路和水体4类地物分别进行采样,采集样本共计1 025个,通过对样本进行波段均值、方差分析得其到光谱曲线(图3)。
图2 怀来县城谷歌卫星遥感影像Fig.2 Google satellite remote sensing image of Huailai County
图3 光谱差异统计Fig.3 Statistics of spectral differences
由图3可以看出,建筑物和裸地在红波段的光谱均值和方差差异较大,道路和建筑物在蓝波段的光谱均值和方差差异较大,道路和裸地在红波段的光谱趋于一致,建筑物、裸地、道路分别和水体的光谱均值和方差均差异较大。通过对光谱差异的分析,可以将裸地、道路、水体合为非建筑类。
我们有以下结论:地球对其内距球心为r的质点P的引力,等效为与半径为r的球体质量相等且位于球心的质点对质点P的引力。即:
怀来县城建筑物在遥感影像上呈片状分布,同类建筑物以群的形式聚集在一起,形成建筑物群。本文所研究的建筑物群是以建筑物结构类型为单位进行的分类。根据实地调研得到的怀来县建筑物结构类型及遥感影像目视解译结果对建筑物的遥感影像特征进行解译分类:
(1)钢筋混凝土结构建筑:高层建筑物群,形状多样,颜色灰色系较多,建筑物阴影较大,楼间距较大,建筑群内有大量空地和绿地。
(2)砖混结构建筑:多层建筑物群(大部分为5~6层),建筑物形状单一,颜色较多,建筑物阴影一般,建筑物群内空地有大有小,有的含有绿地。
(3)砖结构建筑:低矮建筑物群(大部分为1~3层建筑物),低矮建筑物群颜色混杂,部分上覆彩钢板,形状较为单一,建筑群内的空地较小,道路较窄,建筑物阴影很小或基本没有。
(4)大跨度厂房:低层厂房群,厂房间距较大,一般在城镇边缘地带,屋顶颜色一般为蓝色或者红色彩钢板,建筑群内空地较多。
对研究区高分辨率遥感影像进行预处理,得到图像增强的影像,在此影像上对建筑物信息进行提取、分类。根据对研究区的遥感影像分析把遥感影像地物类型分为5类:高层建筑、多层建筑、低矮建筑、厂房和非建筑。本文采用ecogniton软件进行样本的选取、训练及分类。
采用了多尺度分割的方法,多尺度分割方法可以很好的解决“椒盐”和“同物异谱”情况。多尺度分割的尺度很重要,因为建筑物存在不同的类型混杂在一起的情况,分割尺度过大,不同结构建筑物不易区分,分割尺度过小,建筑群容易被分散,经过反复试验,本文设置的分割尺度为400,形状因子为0.3,紧致度因子为0.5。
监督分类首先要选取训练样本,样本选择要根据研究区遥感影像分类地物的特点及类型选取,且样本选取要具有准确性、典型性、代表性、分散性,共选择5类样本共计89个。样本经过光谱特征和纹理特征进行训练,经过多次训练达到了较好的分类效果,分类结果见图4。
图4 遥感影像地物分类结果Fig.4 Remote sensing image feature classification results
2.4.1 遥感分类精度评价
对研究区遥感影像采用决策树(CART)算法和随机森林(Random Trees)算法分类的结果分别进行精度评价,精度评价能够确定分类结果的好坏和可靠性,运用混淆矩阵进行精度评价,结果见表1。对比精度评价结果,两种分类算法在研究区的分类结果总体精度均达到了0.8以上,Kappa系数达到了0.6以上,说明这两种方法均能较好的对建筑物群进行提取及分类,精度评价结果从高到低为:随机森林>CART决策树。
表1 混淆矩阵精度评价对比Table1 Comparison of accuracy evaluation of confusion matrix
2.4.2 研究区目视解译
根据实地调查及遥感影像目视解译,用arcgis软件进行了地物类别标绘,得到研究区的目视解译结果(图5)。对比机器解译结果可以看出,机器提取结果和目视结果基本保持一致,监督分类方法可以满足建筑物群的分类。
图5 研究区地物目视解译结果Fig.5 Visual interpretation results of features in the study area
2.4.3 数据分析
对目视解译及机器解译的结果进行数据分析,分别计算出各类地物的占比情况,见表2。通过各类地物占比情况进行对比,CART决策树和随机森林分类方法中各类地物占比与目视解译方法保持一致。从表中可以看出CART决策树分类算法对高层建筑的提取较差,随机森林分类算法对低矮建筑的提取较差。
表2 解译结果地物占比情况Table2 Proportion of ground features in interpretation results %
本文以河北省怀来县城为例进行遥感影像建筑物群分类提取的研究,通过监督分类算法中的决策树(CART)算法分类和随机森林(Random Trees)算法分类进行试验,并和实际调查结果进行对比分析得出决策树(CART)算法和随机森林(Random Trees)算法均可用于遥感影像建筑物群结构类型的分类,随机森林分类算法的精度高于CART决策树。
对建筑物结构进行分类可用于对建筑物群进行风险分析,根据解译结果地物占比情况表(表2)可以看出低矮建筑在怀来县城建筑物中的占地面积占比超过了50%,经实际调查可知,该地区低矮建筑以单层建筑物为主,多层以6层建筑物为主,高层层数主要分布在11~31层之间,数量不均,可以平均按照20层计算,则很快能计算出怀来县城大致的建筑物比例,从而得到该地区的建筑物风险情况,可用于城镇建筑物的管理和规划,为城镇的防灾减灾提供数据支撑。