人工智能辅助的“基于案例设计”*
——以深圳南头古城周边地区城市肌理织补为例

2023-11-15 03:34刘宇波邓巧明
南方建筑 2023年10期
关键词:城市形态肌理聚类

刘宇波,胡 凯 ,邓巧明

1 引言

1.1 “基于案例设计”的发展简介

关于程序化设计方法或者设计助手的研究可以追溯到20 世纪60 年代的“设计方法运动”,当时整个社会洋溢着“科学将创造美好生活”的乐观主义,在这种乐观主义的影响下,来自不同领域的学者和教育家试图使设计过程变得更加“科学”[1-3]。这一阶段的研究,明显受到了系统论、控制论的影响,都试图将设计过程转化为使用规则、标准、分类的程序化设计系统[4]。20 世纪60 年代中期之后,技术乐观主义逐渐消退,研究者们也意识到设计问题无法简单地通过理性的科学系统来解决,开始反思重视规则和逻辑、缺少人文关怀的设计方法。在此背景下,霍斯特·里特尔提出了“第二代设计方法”研究,他认为不同于基于规则和理性的第一代设计方法,第二代设计方法应该通过互相博弈的、可参与式的进程来识别和搜寻一个满意的解决方案[5]。但是由于当时对设计方法研究的普遍质疑,里特尔的第二代设计方法并没有得到重视,设计方法运动也几乎消亡。直到20 世纪80 年代,随着人工智能第三次浪潮的兴起,基于案例推理系统(Cased-based Reasoning,CBR)[6,7]在军事、医疗、法律等领域迅速发展,也很快成为设计方法研究的热点。

基于案例推理是人类的一种认知行为,即基于过去积累的经验知识来解决遇到的新问题。这种模式在许多建筑学的理论中也有所提及,例如类型学的设计方法,便是从历史文脉中提取原型再加以转化和演绎创造出新的设计。不同于第一代基于规则和逻辑的系统设计方法,“基于案例设计”是里特尔的“第二代设计方法”的延伸,“基于案例设计(Case-based Design,CBD)”通过对历史案例特征的结构化提取,构建案例数据库,当遇到新的设计问题时,通过结构化的特征搜寻和匹配适合的解决方案。这种案例特征可以是案例的量化指标特征,也可以是符号学中的符号关系、句法规则等。Archie-II是最早的CBD 系统之一,Archie-II 通过建筑平面图和建筑不同方面的使用后评价构建案例数据库,它将案例数据的使用后评价分成5 个不同的维度,用户可以通过输入对这个5 个维度的描述性语句来检索相关案例[8]。与Archie-II 不同,CADRE 是一个更加关注案例修改的CBD 工具,但是CADRE 仅仅通过简单的旋转、复制、删减等操作修改案例,无法真正适应复杂的实际条件[9],此外FABEL[10],JANUS[11],SEED[12]等工具都是在建筑领域应用的CBD 系统。随着人工智能技术的发展,国内也有部分学者开始研究CBD 工具,魏力恺结合HTML5和CBD 技术构建了Architable 平台[13],唐芃等人将CBD工具应用在了罗马火车站周边地块城市更新设计[14]。

早期的CBD 工具更加偏向设计案例的检索,对历史案例的自动适应与调整缺乏真正意义上的智能化和自动化。近年来,随着深度学习技术的突破,特别是生成对抗网络模型(Generative Adversarial Networks,GAN)的提出,让计算机自动学习案例数据集中的形态特征,并根据用户输入条件应用这些特征生成新的相似案例成为可能,许多学者也开始结合GAN 设计新的CBD 工具。2018 年,黄蔚欣和郑豪首次将pix2pixHD 模型应用在了公寓建筑平面图的识别和自动生成[15]。此后,Chaillou Stanislas 提出ArchiGAN,实现了从用地到建筑轮廓,再到平面布局、家具布置的全过程自动化生成[16]。刘宇波等人将GAN 的应用扩展到了中等规模的园区生成,实现了基于小样本数据的小学、大学校园和江南园林的自动化生成[17-19]。在城市肌理生成方面,现有基于GAN的CBD 方法多关注于整体式生成,如Jiaqi Shen 等人的研究,利用生成对抗网络实现输入路网生成城市肌理[20]。Stanislava Fedorova 训练了不同的GAN 模型,分别生成米兰、阿姆斯特丹、塔林、图灵、班加罗尔的城市肌理[21]。Yuzhe Pan 等人利用GauGAN 实现了中国北方社区形态的多样化生成[22]。Steven Jige Quan 提出了一个Urban-GAN 的CBD 框架,并将其应用于曼哈顿地区的形态生成[23]。这些研究只考虑不同城市的最具代表性的形态区域,并未同一城市的形态进行研究划分。

1.2 研究目标

综上所述,结合GAN 的CBD 工具表现出了作为智能设计助手的巨大潜力,但是在城市尺度,现有工作方法多为“整体式生成”。然而一个城市的城市形态是复杂多样的,整体式生成方法只能实现城市肌理的“整体挪移”,不能有效实现特定类型城市形态的修复与填补。此外,对于GAN 模型的生成结果,大多数现有工作方法缺乏进一步的评估和筛选。GAN 模型已经展现了短时间生成大量备选方案的能力,而如何评估这些生成结果,筛选出符合设计要求的高品质方案,也是研究者亟需考虑的问题。再者,由于GAN 只能处理和生成图片数据,建筑师需要通过降维和标注的方式将设计案例转化为图像数据集,在得到生成结果之后,再将图片转换为矢量模型进一步深化。这些处理过程都需要有经验的设计师操作,且需要花费大量的时间。

针对这些问题,研究目标可概括为如下三个方面:

(1)探索人工智能辅助的城市形态类型学研究,结合GAN 模型实现指定城市形态类型的肌理织补。

利用图像聚类算法对城市形态类型进行自动识别与分析,并通过掩膜的训练技巧,让GAN 学会特定类型的形态模式,从而实现指定城市形态类型的肌理织补,推进人工智能辅助设计与实践应用的进一步结合。

(2)探索对人工智能生成结果的快速评估方法。

使用GAN 根据城市形态图像特征输出网格化的性能指标,在生成城市肌理织补图像之后,可以直接对生成结果的物理性能指标进行快速评估,辅助设计师对方案进行筛选和修改深化。

(3)构建一个设计师友好,易于操作的设计系统。

通过将python 程序结合设计师广为使用的grasshopper(GH)平台,构建一套自动化的城市形态生成系统DeepCity,实现了案例筛选,数据标注,模型训练和生成,设计评估,数据矢量化的全流程自动化,用户只需操作GH 对部分初始参数进行调整,便能构建自己的人工智能辅助CBD 工具,降低设计师的使用门槛和时间成本。

2 DeepCity: 人工智能辅助的城市形态生成系统

南头古城是深圳市现存最大、保存最完整的古建筑群,在城市建设过程中,古城的肌理也逐渐被现代化建筑蚕食,如何统筹周边城市更新,继承保护旧城肌理,避免城市历史环境碎片化是设计师必须考量的问题。以深圳南头古城周边地区为例,DeepCity 系统辅助城市形态的生成过程主要可以分为3 个步骤:设计认知、设计生成和设计评估。设计认知部分通过图像聚类算法辅助设计师对城市形态进行类型学分析,以更加客观而全面的了解城市区域的形态特征、帮助设计师识别和评估旧城肌理。设计生成部分通过生成对抗网络学习旧城肌理的形态模式,实现对旧城肌理的织补,为设计师提供形态参考。设计评估部分通过生成对抗网络实现对生成结果建筑热环境的快速评估,为设计师提供筛选和优化参考。DeepCity系统依托GH平台,其核心功能组件如图1所示,本文所展示的所有功能组件的代码与GH 电池均已开源,开源地址详见文末注释1)。

图1 DeepCity 系统工作流程图

2.1 设计认知:基于图像聚类的城市形态类型学分析

在“基于案例设计”的系统中,案例的选择直接决定了系统输出设计成果的类型和质量。在传统工作流程中,对城市形态进行类型学分析,往往依靠有经验设计师的感性判断,难以进行客观而全面的评估,DeepCity系统通过图像聚类算法对城市肌理进行自动聚类,同时对聚类结果以形态量化指标进行量化评估,辅助设计师对城市形态进行类型学的分析。

2.1.1 聚类数据集的制作

DeepCity 系统使用预训练的VGG19 模型与KMEANS 结合的图像聚类算法,对城市形态进行自动分类与评估。VGG19 是常用的图像特征提取模型,多用于图像识别与分类任务中。KMEANS 是一种自动聚类算法,用户只需输入聚类数,算法即可自动将数据分为相应的类别。由于VGG19 提取的图像特征较为复杂,DeepCity系统还使用了PCA 主成分分析技术提取图像的主要特征用于自动聚类,以减少计算量。图像聚类算法只能处理栅格数据,因此首先需要将三维矢量的城市数据转换为栅格图像数据,参考Jinmo[24]等人的研究,首先计算数据集中所有建筑基底面积的平均面积,以其平方根取整后作为基本长度,然后在上下左右分别扩展3个基本长度,以此确定合适的栅格化的范围。经计算,最终以建筑为中心105m x 105m 矩形范围的建成环境作为判断该建筑形态类型的依据,并将建筑高度映射为不同的颜色。为了保证图像的清晰度,栅格化之后的图片大小为256 像素x 256 像素,其转换过程如图2 所示。为了方便建筑师的使用,DeepCity 系统结合GH 平台实现了自动化数据处理,用户只需准备带有高度信息的CAD 数据,输入GH 平台并设定好相关参数,即可自动制作聚类数据集。

图2 聚类数据集的标注(左)与自动聚类流程(右)

2.1.2 城市形态聚类与量化评估

DeepCity 系统会根据用户输入的聚类数,自动将周边建成环境相近的建筑分为同一个类别,并以不同颜色标记不同类别的建筑以直观呈现形态分析结果,同时系统根据平均建筑基底面积、平均建筑面积、平均建筑层数等指标对各类别城市形态进行量化分析。图3 对比了南头古城建筑年代分布[25]与聚类数为3 时人工智能的自动聚类结果,从图中可以看出,在没有建筑年代信息,仅依据建筑肌理图底关系与高度信息的情况下,人工智能的分类结果有较为明显的圈层关系,较好地区分了外围肌理差异较大的新建建筑肌理与内部的老城肌理,但对于内部肌理差异较小的50~80 年代建筑与90 年代建筑则并未进行有效区分。

图4 展示了深圳南头古城周边地区聚类数分为别3、6、9 的城市形态自动聚类结果,以及各类别的形态量化评估结果。从自动聚类结果可以看到,当聚类数为6 和9时,算法对不同形态的区分更加细致,当聚类数为6 时,古城形态的圈层结构更为明显,当聚类数为9 时,现代建筑形态也出现了规整形态和不规整形态的区分。基于图像的形态聚类算法,综合考虑了建筑轮廓,周边建筑分布,建筑高度等信息,可以辅助建筑师在方案前期对设计区域了解较少的情况下,辅助建筑师对城市形态进行类型学分析研究,最终类型的确定需要用户根据建筑风貌,建造时间等实际情况结合自动聚类结果进一步研究,以适应不同的设计需求。

图4 深圳南头古城周边地区城市形态自动聚类与量化分析结果

2.2 设计生成:基于生成对抗网络的城市形态生成

2.2.1 生成数据集的制作

DeepCity 系统使用pix2pix 模型训练和生成城市形态,掩膜的训练技巧被用来让模型学会指定类型的城市形态特征,即在制作数据集时,用掩膜将需学习的形态区域进行遮盖作为输入条件,完整的城市形态图像作为输出图像,让模型学会根据周边建筑分布生成指定形态填补肌理。为了增加样本数量,提高生成结果的清晰度与多样性,采取随机采样框的方式制作数据样本,在研究范围内随机布置105m x 105m 的采样框制作数据集,采样框之间允许局部重叠,以此增强数据。人工标记需学习的形态区域将耗费大量的人力和时间,DeepCity 系统通过GH 平台实现了生成数据集制作的自动化,用户只需根据形态聚类分析的结果,输入需学习的形态类别,便可自动制作生成数据集。以深圳南头古城为例,选取聚类数为3 的分类结果中的旧城肌理制作数据集,数据集的采样及制作过程如图5所示,最终获取128 个有效训练样本。

图5 随机采样框(左)与生成数据集的标注(右)

2.2.2 生成模型的训练

DeepCity 系统结合GH 平台制作了控制pix2pix 模型的训练和生成的电池,用户只需在GH 平台中调整训练参数,即可完成模型的训练和生成。除了正常训练次数(n_epochs)和学习率训练次数(n_epochs_decay)外,DeepCity 固定了pix2pix 模型的其他超参数,以减少复杂的超参数设定过程(图6),方便建筑师的使用。图6也展示了深圳南头古城肌理数据集的训练参数和训练过程,在总共迭代了300 次之后,模型已经能生成较为清晰的图像。

图6 深圳南头古城肌理的训练参数(左)与训练损失变化曲线(右)

2.2.3 城市形态的生成与矢量化

DeepCity 系统辅助的城市形态的生成过程可分为四步:第一步设计师评估并划分需要织补肌理的更新范围;第二步DeepCity 系统用训练好的生成模型生成织补图像;第三步系统利用OpenCV(一种常用的图像处理工具库)和GH 将二维图像转换为三维模型;第四步设计师根据生成结果进行调节和深化。以南头古城周边地区为例,可利用DeepCity 系统织补城市肌理的能力,连接碎片式的古城肌理,将南头古城及其周边地区打造成更加完整,更具文化特色的历史文化步行街。图7 展示了DeepCity 的生成与矢量化过程,出于展示目的,其生成与矢量化结果并未经过设计师的深化加工。

2.3 设计评估:基于生成对抗网络的热环境快速评估

2.3.1 模型架构

在得到智能生成的备选方案之后,结合物理性能的模拟,可以有效评估设计方案的合理性,辅助设计师进行方案筛选及优化。DeepCity 系统将城市形态转换为图像数据,使用生成对抗网络提取图像特征作为输入并输出网格化的性能指标。DeepCity 评估模型的架构如图8 所示,其基本结构与pix2pix 模型一致,但为了提高模型预测精度,输出部分不再以图像颜色来标记不同数值,而直接以保存为Json 文件的单通道模拟数值矩阵作为输出。

图8 DeepCity 系统评估模型架构图

2.3.2 预测结果评估

评估模型的有效训练样本为300 个,为了验证模型的准确性,采取回归模型常用的评价指标平均绝对误差(MAE),平均加权百分比误差(wMAPE)和拟合度(R2)对模型进行评估,其计算公式如下所示:

50 个测试样本被用来统计DeepCity 预测结果与ladybug 模拟结果的误差值。如表1 所示,在经过恰当的训练之后,DeepCity 对太阳日照辐射强度的预测取得了不错的效果。在这50 个样本中,DeepCity 预测的平均绝对误差(MAE)为0.1018,平均加权百分比误差(wMAPE)为7.08%,拟合度(R2)为0.975。图9 对比了DeepCity 对太阳日照辐射强度的预测与利用Ladybug 软件模拟的空间分布结果,结果显示模型预测结果在空间分布上也较为准确,尽管使用人工智能算法进行性能预测的误差不可避免,但对比计算时间(Ladybug软件的模拟时间大约为30s 左右,而DeepCity 仅需2~3s),DeepCity 评估模型在方案前期辅助设计师进行方案筛选与评估优化仍拥有巨大潜力,且基于生成对抗网络的快速评估方法可以扩展到更加复杂的性能模拟计算上,如室外热舒适、能耗计算等,为设计师提供更加综合的评估结果。

表1 DeepCity 太阳辐射强度评估模型准确度评估

3 讨论和结论

文章提出了一个人工智能辅助的基于案例设计系统DeepCity,这个系统主要有三大功能模块:设计认知部分可以评估并量化不同城市形态,辅助设计师对城市形态进行类型学研究;设计生成部分可以自动学习设计师指定城市肌理类型的形态模式,并应用到新的城市环境,帮助设计师对特定类型的城市形态进行织补;设计评估部分可以对设计方案的物理性能进行快速评估,辅助设计师在设计前期进行方案修改和深化。DeepCity 系统为设计师提供了额外的视角认知和理解城市,相比第一代基于逻辑和理性的设计系统,DeepCity 系统从历史案例中自动提取形态原型供建筑师参考,其生成形态的复杂性和有机性更胜一筹,生成的形态肌理可以很好的继承历史案例的特征,避免了第一代设计系统与历史文脉的割裂,展现了人工智能作为自动化设计助手的巨大潜力。同时与GH 平台结合的使用方式,也让该系统的可操作性更强,便于设计师在实践中的使用。但是人工智能辅助的设计系统目前仍处于研究的初期,受技术条件限制,仍存在很多不足之处:

(1)基于图像聚类的城市形态类型学研究,由于深度学习算法的黑箱机制,自动聚类结果的精准性与可解释性不足,只能辅助建筑师对城市形态的类型进行初步判断,实践应用中,仍需建筑师基于实地调研与自身经验进行判断。

(2)基于人工智能设计生成方法,生成结果的质量严重依赖案例数据集的数量和质量,尽管本文采取随机采样框的方式扩充数据,取得了不错的效果,但是其应用也有一定的局限性,并不适用于研究范围太小或者肌理分布不集中的情况。

(3)生成对抗网络只能处理图像数据,城市数据降维处理和矢量化过程中均会导致数据的丢失,例如栅格化的建筑高度使得建筑高度信息离散化,而矢量化过程中,图像的毫厘之差可能导致真实环境的巨大差异,亟待更加强大的矢量数据处理的人工智能算法的突破。

(4)人工智能算法只能为设计师提供形态参考,并不能真正做到创新。最近兴起的文生图大模型,虽已能产生令人惊奇的艺术效果,但其本质仍是现有图像模式的组合。人工智能辅助设计工具的初衷是导向更加科学,更加智能的设计,然而滥用人工智能的模仿学习能力,很可能导致个性、创新的缺失,智能设计与个性、创新的边界,需要使用者仔细把握。

从历史的视角看,当今时代与20 世纪60 年代非常相似,技术的进步给人们生活的方方面面带来了巨大的改变,社会上都洋溢着对技术将会创造美好生活的乐观主义,20 世纪60 年代建筑方法运动的先驱们试图让设计过程变得更加“科学”,而我们正试图让设计过程变得更加“智能”。尽管如今对设计方法的研究仍旧没有达到人们所期望的“科学”或者“智能”,但这些探索的过程,也在不断地改变设计师的工作方法,为设计师创造更多可能性。希望本文的研究,能为此领域的研究者带来些许启发,促使人工智能辅助设计往实践应用的方向更进一步。

图、表来源

图3(左):作者基于对参考文献[25]的信息进行整理绘制;其余图、表均由作者绘制。

注释

1)DEEPCITY 开源地址:https://github.com/kekehurry/DeepCity。

猜你喜欢
城市形态肌理聚类
肌理的感受与表达
渗入肌理,豁然其妙——以2019年高考全国卷为例谈古诗如何细读
感受肌理
器之肌理,物之温度
基于DBSACN聚类算法的XML文档聚类
基于高斯混合聚类的阵列干涉SAR三维成像
高密度城市形态下的规划探索
抽象与现实
长三角地区城市形态对区域碳排放影响的时空分异研究
一种层次初始的聚类个数自适应的聚类方法研究