杨 楠,孟庆林
“大数据”概念是通过2013年维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》被大家所熟知,近些年各个企业、组织在其行业建立自身的“大数据”,但对城市建设方面还没有一个公共性、可应用的“大数据”。现阶段城市建设中,设计行业最重要的设计依据还是“经验”,如何摆脱“经验”,让设计具备“科学性”是当下城市建设中需要解决的主要问题之一。同时在高速发展的社会中,城市建设对于设计错误的包容度越来越低,当下需要一个客观、真实的设计依据来支撑“科学性”的设计活动,由此可见城市基础数据研究的必要性和重要性。
在理论研究层面,2004年赫勃特·西蒙著,武夷山译的《人工科学——复杂性面面观》书中提出设计具备“科学性”的观点[1],后期沃尔夫·劳埃德、张钦楠、胡越等学者也在其对应的设计方法论研究著作中对设计的“科学性”进行重点研究,但多集中于“设计方法”的探索[2],众多学者的研究都表明“科学设计”是必要的,也是必然的[1-3]。如同沃尔夫·劳埃德(Wolf,Reuter)在其《建筑设计方法论》中提出:除对实践建筑师的适应性以外,在对设计过程的观察、探索和解释中通过把设计作为人质的对象,它提供一种设计科学,“科学”旨在提出与现实世界某些现象一致的理论,在这里就是设计[3]。但在“大数据”概念未普及之前“科学设计”就像是没有根基一样,近些年随着BIM、GIS、手机及智能化汽车等科技技术的进步以及CIM概念的产生,“科学设计”具备落地性[4-6]。
城市建设过程中,设计活动是重中之重的环节,从设计活动看,设计活动是在接收外部输入条件后转向内部梳理和决策,最终形成设计成果[7]。虽然内部可以通过自我调整来改善、优化,但决策的依据在设计过程中多是依靠设计师个人“经验”[2],不可控的外部环境是要无条件接受的。随着社会发展,外部影响因素的量级是以指数方式增长[8],其中建筑技术的进步、规章制度的调整等因素虽然可以明确,但客户日益增长、变化的需求和城市建设不断变化的状态等这些不可控的输入条件是对设计成果影响最大的因素[9],因此明确设计基础决策环境是优质设计成果形成的前提。面对这种设计环境,如何做好设计不仅仅是要设计师有优秀的艺术天分和设计经验,更需要用科学的态度去面对设计。“科学设计”是主张在不考虑人的因素下,让设计更客观、合理,利用完备设计管理体系和真实的城市基础数据通过设计活动得出具备“科学性”的设计成果的过程。城市的发展是必然的,其合理性、高效性、高质量是必要的基本要求,科学设计也就是必然的。
“科学设计”的框架主要包含两个方面,一是管理方面,主要体现在完善的流程、标准、管控工具;二是为设计提供依据的数据。数据不同于管理,需要在时间尺度、规模范围尺度和纵向深度方面不断积累才能形成可应用的数据形式[10],在性质上数据也不同于管理,数据是“科学设计”的基础。任何的设计过程都是依据数据分析,通过合理的设计过程管控和科学的设计方法加工,产生设计成果。设计成果也是新的数据[11]。由此可见数据是设计的基础,那么客观、真实的城市基础数据则是“科学设计”的前提,也是“科学设计”的基础。
数据从收集到应用之间的转换需要路径,各种路径的组合,形成数据框架,城市基础数据很多是专题性的,定制性的,特别需要探索数据之间的关联关系[10],框架就是数据的必经之路和数据之间关联的“翻译器”[12]。数据之间的关联能够互相影响,起到叠加效应,带来的价值也能够超越原有单一数据的价值[10]。关联是把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别[10],例如2019年某小区人数为1000人,2020年为1200人,这些都是显性数据,但增长率20%则是隐性数据,需在后续数据关联过程中依据需求进行数据生成,并且很多隐性数据是依据需求在显性数据已经存在或者完善的基础上才能进行提出和生成。为实现数据共享和提高处理效率,必须遵循约定的分类原则和方法,按照信息的内涵、性质及管理的要求,将系统内所有信息按一定的结构体系分为不同的集合,从而使得每个信息在相应的分类体系中都有一个对应位置。明确数据的特性后,可见数据应用的基本路径是输入、转换、承载、输出(应用),城市基础数据的基本框架也要围绕着这个基本数据路径建立(图1)。
图1 城市基础数据逻辑框架总图
科技的进步使得数据收集及建立得到质的飞跃,在数据收集方面已不同于以往依靠人工收集为主方式进行,智能化、全覆盖的数据收集基础已经建立,当信息总量达到一定的层级,其信息的质量、效益、价值都会由量变的变化引发质变,这也是城市基础数据具备落地性的基础条件[10,13]。在收集数据前首先应对数据的范围进行界定,然后依据特性进行分类,因为是城市基础数据,那么首先应该按照城市建设的逻辑进行划分,这里主要分为城市级数据和建筑级数据,然后再次进行划分,划分的末端是具备数字或是明确性指标。最后依据划分的框架明确数据来源的渠道。在对数据划分两次后可初步总结出数据来源主要有以下几个渠道(图2)。
图2 城市基础数据收集与梳理框架图
(1)政府机构:政府机构是数据的主要来源和组织管理者,能够直接准确的依据城市规划类和建筑类相关规范作为分类依据[14]提供城市规划类、专项规划类、人口、历史、文化、产业、市政、气候等城市级别的数据。
(2)建筑开发机构:建筑开发机构提供的数据是政府机构提供数据的细化与扩展性数据,多是建筑级的数据,例如建筑的功能、面积、地形等。
(3)物业机构:在建筑物方面通过物业建立智能化社区,完成数据收集。在商业方面利用手机终端和金融终端收集数据,多是动态数据,例如建筑的使用人群、商业的户主变化等。
(4)交通管理机构:在智能化科技基础上,在城市层面利用城市公共区域摄像头、交通摄像头等信息收集,在交通方面依靠智能化汽车作为交通方面的终端数据收集。交通由于其性质特殊,数据庞大,数据动态变化性强烈,因此需要单独提出和专业研究。
(5)银行、工商机构:利用工商、银行、互联网商业平台等渠道收集并整理商业、金融数据。不同于政府的宏观数据,银行、工商机构提供的金融类数据是专题类数据收集。
(6)调研数据:利用技术手段收集的数据是客观的,但对于使用者主观意识的数据是收集不到的,因此要利用调研方法针对使用者进行主观意识数据收集,例如住宅客厅宽度多少是在实际使用过程中最受欢迎的。
在数据的挖掘过程中要注意两点,一是数据的准确性和真实性,一个不准确的数据会产生连锁反应,数据关联的过程中不确定的数据会导致其他准确数据无法应用,对于任何一个单一的数据其准确性要建立验证机制,例如用两种方法对数据进行收集比对,或者对数据进行推导应用,用另一可收集结果数据进行验证等方法,这种验证的方法是必要的。另外对于准确性也是要有对应层面的,例如民用导航的精准度达到米的级别就可以,但对于自动驾驶的精准度要达到厘米级别才可以,数据中要有健全的数据,以对应不同级别精准度的使用需求。二是数据的合法性与保密性,很多基础数据其特性是具备公开性的,但在数据互相关联之后其衍生数据就很可能涉及到一定保密性,因此对于数据生产的过程中要时刻对数据的保密性进行确认。
数据的转换并不是简单的归纳、梳理,首先要明确建立数据分类的原则,然后明确数据分类的方法,最后明确数据输出的形式。
在数据分类的原则方面,2015年孙静娟的《统计学》第三版中对数据分类提出五点基本原则,稳定性、系统性、可扩展性、综合实用性和兼容性[15]。城市基础数据的转换过程也是建立数据的过程,因此也要遵循数据建立的五个基本原则。
(1)在稳定性方面,城市基础数据可划分为固态数据和动态数据,其中城市建筑数据虽然是变化的,但建筑数据是城市基础数据的基础,主要建筑数据的体现形式是可物质化、视觉化的。物业数据、交通数据、商业经济数据和调研数据都是随着时间变化而变化的,是划分到动态数据中。这种建筑物数据可视为城市基础数据的基础和依据,从而确保在建筑数据基础上再产生和引入的数据具备稳定性。
(2)在系统性方面,将选定分类对象的特征(或特性)按其内在规律系统化进行排列,形成一个逻辑层次清晰、结构合理、类别明确的分类体系。城市基础数据的系统性应依据城市原本的设计系统进行数据分类,这样的系统性是便于后续依据不同需求在寻找相应数据时实现最佳效率。
(3)在可扩充性方面,城市基础数据在类目的设置或层级的划分上按照从大至小的方式进行划分,并且在每个层级上都有其对应的扩展空间,以保证分类对象增加时,不会打乱已经建立的分类体系。
(4)在综合实用性方面,城市基础数据从实际需求出发,综合各种因素来确定具体的分类原则,使得由此产生的分类结果总体是最优、符合需求、综合实用和便于操作。
(5)在兼容性方面,有相关的国家标准则应执行国家标准,若没有相关的国家标准,则执行相关的行业标准,若二者均不存在,则应参照相关的国际标准。这样,才能尽可能保证不同分类体系间的协调一致和转换。
对数据的分类方法主要有三种,一是按计量层次分类,二是按照数据来源进行分类,三是按照时间状况进行分类[15]。城市基础数据由于其体量庞大,并且数据还要随着时间的变化要对数据进行更新,因此主要采用按计量层次分类和按照时间状况进行分类相结合的分类方法,城市基础数据需经过加工才能使用,并且框架的搭建就是数据加工的核心思路,因此城市数据不能够按照数据来源进行分类。
(1)在定类方面,城市数据的基础数据要依据城市设计的逻辑进行设定。先从城市的宏观层面出发,从宏观到微观进行深化分类,例如城市的建筑、交通、经济、公共设施等这一城市级层面的;然后在建筑级这一层面再次进行划分,例如商业办公建筑、居住建筑、工业建筑等;再依据其建筑功能属性再次进行划分,面积、车位数、功能配比等,这里需要注意的是不同的建筑其再一次划分的框架不同,例如医疗建筑有病房,但居住建筑是没有病房的。划分的最终目标是这个数据不能够再进行划分,这一层级是基础平等并列关系的数据类别。
(2)在定序方面,因定序数据与定类数据最主要的区别是定序数据之间还是可以比较顺序的。例如,建筑使用人群的划分,男人设定为数字1、女人设定为数字2。这方面更多的是在应用阶段要利用的比较方法,在框架搭建的过程中是不存在的,但是需要说明的。
(3)在定距方面是基于基础数据的再次数据生成,这里主要有两个方面的关联,一是同一类别的数据再生,例如2019年深圳市居住建筑建设量为100万m2,2020年居住建筑建设量为110万m2,那么2020年较2019年增加的10万m2居住建筑建设量和2020年较2019年居住建筑建设量增长10%就是再生数据。
(4)在定比方面不同于以上几点,因输出端的需求需要人为的介入相关的起始点或者干预点才能使数据具备应用价值,例如2019年深圳市居住建筑建设量为100万m2,那么2019年1月1日到2019年12月31日就是100万m2数据的介入点。在划分的时间维度上,在输入端,整体尽量满足数据的全周期,即有数据的开始就要进行记录并保留,没有起始数据的要利用科技手段完善。在输出端则不同于输入端,要依据应用的需求找到对应的时间轴,提供与其时间轴数据成果。
对于数据的输出结果,在没有明确应用需求对象的情况下首先要依据数据的特性进行划分,这个划分也是在数据应用前,对于数据的最后一步数据形势转换,这种转换有利于后期数据应用的梳理效率提升,主要有两种数据形式。
(1)固态数据方面:固态数据并不是数据不会变化,固态数据可以看作为这个城市的骨架,例如城市层面的建筑物、绿化广场、道路交通和农业用地等方面,其中数据集中于建筑物,在建筑物层面依据设计的体系可划分为几个重点数据点:功能、面积、交通流线、建筑信息、车辆信息[12]。固态数据多是可视化数据,主要依托城市模型而展示。
(2)动态数据方面:区别于固态数据,动态数据方面的分类在大类别上主要有流量数据和特性数据,像是在骨架上流淌的水,例如人流量、金融数据,不同功能类别的使用频率流量。在这个流量的基础上再依据特性进行划分,例如人流量方面,可依据年龄进行划分:儿童、青少年、中年、老年,金融流量方面可依据商业属性进行划分:服务消费、物质消费、大宗商品消费等,使用频率流量可依据功能属性进行划分:商场人次频率、绿地广场人次频率等[12]。动态数据大部分是可以依托城市模型进行展示的,但部分数据的属性为非可视化数据,例如GDP,这种数据是依托于数据看板进行展示的[16]。
依托“大数据”成熟体系,城市基础数据的储存主要由数据、非可视化数据的模型看板和承载可视化数据的城市模型,看板和模型是数据体现的工具。其中城市模型依托于BIM、GIS等技术实现数据承载的落地性,城市模型是城市基础数据在大数据模式下一个特殊的存在形式[17]。城市模型与城市数据之间本身就是共生体,城市模型也就成为城市数据分类的最佳模式[13],例如想了解100m高层建筑量,这种数据可以直观的反应在模型上,如果需要从数据上来辨别则需要引入其他的数据影响因子,增加复杂度。从读取数据的便捷性方面来看,利用城市模型承载城市数据在读取的便利性、准确性、可视性方面都有很大的效率提高,并且在数据储存方面对储存空间并没有特别的空间需求及空间占用[18]。
在数据收集的过程中对数据的准确性、真实性、合法性与保密性要进行初步的验证与纠正,但并不是在应用的背景下。数据承载是城市基础数据框架的核心,联系着输入端与输出端,因此数据承载的板块就要按照需求针对性的对数据进行整理,这里就包含对数据的准确性、真实性、合法性与保密性的专项验证与纠正。工作的前提是需求端先明确数据需求框架,经过数据的初步分析后先应进行AI分析,解决工作量繁重的节点,然后再经过人工的分析与验证即可提供数据。由于数据很多是关联的,在给用户的使用过程中要明确,非可视化数据的模型看板和承载可视化数据的城市模型之间要产生联动,这样才能完整的体现数据的应用价值(图3)。
图3 城市基础数据载体模式图
数据载体不仅仅是硬件堆积的数据库,更是数据传输的逻辑。数据的储存、数据的传输逻辑、数据的展示工具等共同构成数据载体,也是城市基础数据框架的核心所在。
城市基础数据在设计上的应用主要分为两部分,第一部分是策划阶段的应用,第二部分是设计阶段的应用。应用前按照设计活动的属性先提出数据需求框架和梳理数据,然后依据数据自身的属性分成直接应用和决策应用,数据在策划和设计两个阶段应用的区别在于验证环节,随验证环节只存在于设计阶段,但其结果也是验证策划阶段。
对于策划阶段,数据应用的价值主要体现在为决策提供论据,其需求的数据更多是城市级的,例如经济、人口等方面,推导出的结论也是数据类的,例如面积、功能、高度等。在设计上的应用技术路线为:数据需求框架、数据提炼整理、数据应用、数据验证。重点在于数据需求框架、数据应用和数据验证三个节点(图4)。
图4 城市基础数据设计应用技术路线图
第一步数据需求框架,通用性质的数据框架,例如周边的道路数据、交通流量数据;周边的建筑功能数据、面积数据、立面色彩数据等;周边的人群数据、人群的年龄结构、男女比例、工作性质等。依据项目自身的功能特性而定制的专业性数据,例如设计电影院,那么周边建筑具备电影院功能属性的建筑有多少、面积是多少、分别的定位是什么等这些数据就是专业性数据。
第二步数据提炼整理,这部分的关键点在于数据的准确性,并不是设计过程中讨论的,而是数据搭建过程中的重要工作。
第三步数据应用,主要有直接应用和决策应用两个方面。在直接应用方面主要体现在因果关系上,例如周边的建筑高度和占地面积数据明确后,可以利用日照软件推算出具备最佳采光的新建筑的建筑空间范围。在决策应用方面主要体现在决策论据上,例如周边的交通数据明确后,在地块的出入口设计方面依据数据可以评判各个可能性出入口的优劣势,结合出入口的功能属性进行二次判断,进而确定出入口的位置与功能。
第四步数据验证,验证的过程是将设计成果在虚拟的环境中建立,并将成果数据输入虚拟环境中建立新的数据,再与原有数据融合的形式进行验证。这里的验证分为两个部分:一是将新建筑的数据独立,只考虑新建筑的输出数据,验证输出的数据对原有环境数据的影响;二是新建筑的数据完全融入环境,重新模拟整体环境数据,验证新环境数据的整体效果。依据影响与效果的矛盾点进行设计修正。
城市基础数据不仅能应用于房地产设计行业自身,因其数据的特性,可实现数据的延伸应用[13,19]。在城市基础数据建立后,依据其特性从城市的角度出发可应用于以下几个方面:
(1)在宏观层面上可提供给政府作为城市决策的数据依据:随着科技的发展,城市体系中各类的数据体系也在逐步建立,城市基础数据也是其中之一,其重要性按照需求等级也是排在前列的,特别是在城市建设过程中对于城市各类的决策是有其必要性的[20,21]。
(2)商业办公建设:数据在商业方面的应用价值是比较明显和明确的,通过数据能够更加的应对客户需求,控制商业建设规模,减少资源浪费。但数据对于商业建设也是有利有弊,部分商业发起者会利用数据来控制消费者,因此在商业建设方面数据的应用应该给其使用者建立应用规范[10]。
(3)居住建设:居住建设的应用主要有两个方面:一是在宏观层面上对居住建设量、职住平衡和居住建设与其他方面城市建设配合关系设计等城市级设计的应用;二是对于居住产品方面的应用,例如几房几厅、卧室的进深与面宽的设计[19]。
(4)道路交通建设:现阶段我国已经存在的百度地图、高德地图等交通数据应用类软件,同时还有北斗导航等基础建设已经完善,但并不是一个可以闭环的数据体系,城市类数据在名义上是包含交通类数据的,但在实际的数据关系中交通类数据要结合城市建筑类、商业类数据等数据才能够形成更准确、更完善的交通类数据,这样的数据才能够在交通应用和城市交通建设方面提供准确有效的决策依据[19]。
(5)物流仓储建设:物联网的建设近些年已经上升到国家战略层面,并且我国已经有比较完善的建设基础,在数据类方面如同道路交通类数据一样,也是要结合城市数据中其他类数据才能够更完善、更精准,也因此才能更好的给物流仓储提供建设依据[19]。
(6)工业建设:工业的建设主要集中在建设量、与物流相结合的效率提升和工业与环境保护之间的关系。数据的应用在这三个方面都是有其重要的应用价值,并且能够在质的方面给予大幅度的提升[19]。
(7)公共管理与服务建设、公用设施与绿地与广场等数据对于城市公共类的城市设施:公共类的建设除大家日常使用的绿地广场、公共设施之外,还有医疗系统、教育体系等,数据的应用能够使这些公共资源更合理、更公平、更有效率的利用[19]。
(8)城市与建筑运营:不同于点式的应用在宏观层面,给政府机构提供城市决策依据,在日常的城市及建筑运营中城市基础数据也是可以持续性应用的,例如BIM运维就是典型案例,如果BIM运维过程中有城市基础数据的加持就会提高效果和质量。
数据实际应用中,典型案例为房地产住宅项目(因建筑项目涉及范围广,牵涉专业众多,案例限定范围为设计线条,运营、成本采购、工程、报建、财务融资、营销和投资发展等专业线条不纳入案例范围。案例研究阶段为强排策划、设计和后评估三个阶段,施工图和施工配合阶段属于设计阶段工作。因建筑类项目数据指标层级较多,为便于快速理解,案例仅列举第一层级部分数据),例如XX地产公司,东莞XX项目。按照数据应用技术路线可划分为三步:
第一步:强排策划阶段,对应技术路线中策划层面数据应用,按照居住建筑属性建立需求框架。例如经济、人口、产业和上位规划等,依照前文对应渠道获取数据,并明确数据属性及展示模式,将数据给到策划人员应用,得出策划阶段的结论。例如用地及空间限制条件、产品(户型及配比、功能构成及占比)、价值分析(商业、景观等)和盈利可行性等。结论作为后期设计阶段输入条件,同时结合各方愿景,提出多个不同设计理念的初步方案(表1)。
表1 城市基础数据设计应用案例策划阶段计划表
第二步:设计阶段对应技术路线中设计层面数据应用,结合策划阶段结论,按照居住建筑属性建立需求框架。例如规范、交通、环境和日照等,依照前文对应渠道获取数据,并明确数据属性及展示模式,将数据给到设计人员应用,得出设计阶段的科学设计成果(表2)。
表2 城市基础数据设计应用案例设计阶段计划表
第三步:验证阶段对应技术路线中验证层面数据应用,验证的数据包含策划阶段数据和设计阶段数据,通过输出验证和融入验证得出对应结论。结论包含了四种情况,不同情况下修正点不同。
第一种情况是输出验证有矛盾点,融入验证无矛盾点,例如案例中在输出验证中发现人口增加后,周边建筑商业功能不能满足人群使用需求,融入验证将新建筑放到城市模型中模拟,新建筑商业功能弥补了缺失部分的需求,得到合理的商业功能需求,这种情况下可以判定设计成果在商业功能需求方面是具备“科学性”的结论。若新建筑商业融入后虽在需求上满足了,但设计中由于交通流线等设计阻碍,外部城市空间依然缺少商业功能,这种情况下就需要修正设计。第二种情况是输出验证无矛盾点,融入验证有矛盾点,例如案例中新建筑数据对原有城市交通没有产生压力,融入验证时新建筑内部产生了交通堵塞,说明外部交通对新建筑内部交通产生影响,需调整新建住方案的交通设计。第三种情况是输出验证有矛盾点,融入验证有矛盾点,两个矛盾点无关联关系,这种情况下针对不同矛盾点进行设计修正。第四种情况是输出验证有矛盾点,融入验证有矛盾点,两个矛盾点有关联关系,则对应相同问题进行修正即可(表3)。
表3 城市基础数据设计应用案例验证阶段计划表
设计过程中采用了数据应用进行设计推导,在完成设计成果后用数据进行验证与设计修正,为新建住设计排除设计缺陷,使设计更合理,实现科学设计概念,为城市、实用者提供科学的设计成果。
回顾历史,数据是体现城市发展质量、效率的最佳途径[10]。近些年我国社会形态由分散式增长向集中式增长转变,或者说在统一发展思路下,由形式上无序的增长向有质量的增长转变。城市基础数据不能决定城市的未来,但能提高城市发展决策正确率,进而提高城市发展质量和效率。设计活动对于城市发展起着决定性作用,依据数据在应用中输入、转换、承载和输出的特性,结合设计过程,建立数据输入、数据转换、数据承载和数据应用的城市基础数据框架,依据数据的可视化属性在承载节点中明确数据载体,在应用节点依照数据需求框架、数据提炼整理、数据应用、数据验证的技术路线将数据应用到设计过程中。这种提供客观事实依据,减少经验判断的模式,使设计具备“科学性”。这种模式是必然的,同时在质变后的社会发展中,城市基础数据承担着核心决策依据的角色,也体现其重要性。
城市基础数据框架并不是一成不变,需根据社会发展,城市建设进度进行调整。上述框架是依据现阶段客观环境建立适应其社会阶段的城市基础数据框架雏形和搭建城市基础数据框架的基本方法,后续随着社会发展,在不同社会发展的不同阶段应该有与其相适应的框架,甚至改变搭建城市基础数据框架的方法,因此城市基础数据框架和城市基础数据框架建立方法与社会发展阶段之间的关系还需进一步研究。另外城市基础数据与设计方法关联研究也有待进一步研究,不同类型建筑的设计有特殊的设计方法,在不同的设计方法中如何引入数据的应用是关键问题,城市基础数据引入后会给设计方法带来更多可能性,并且会激发出更多的设计认知和设计方法论。
图、表来源
文中所有图、表均由作者绘制。