吴保宽
(华侨大学 建筑学院, 福建 厦门 361021)
应用ANN与CA构建GIS模型的城市非正规商业行为分析
吴保宽
(华侨大学 建筑学院, 福建 厦门 361021)
基于神经网络算法(ANN)和元细胞自动机(CA),建构台湾逢甲夜市商圈的地理信息系统(GIS)模型,并对非正规摊贩商业行为进行数值模拟与实证分析.研究结果表明:非正规摊贩分布模拟结果为平均正确率84.1%,而目标模式的平均正确率可达94.2%;在环境因子影响性分析方面,街道位置类型是发生非正规摊贩最具影响性的环境因子,而背景建物宽度则是最不具影响性的环境因子;在环境因子相关性分析方面,街道位置类型因子是所有假设环境因子中最能吸引非正规摊贩聚集的正相关因子. 关键词: 城市非正规商业行为; 神经网络算法; 元细胞自动机; 地理信息系统; 环境因子
数值模拟分析技术是城乡规划相关研究的重要发展领域.通过数值模型与研究对象的现实状态进行比对实验,能帮助研究者解析研究对象的深层知识[1-2].近年来,由于地理信息系统(GIS)的发展,大幅提升数值模型技术的图像与数值信息的同步整合能力[3].因此,各类数值模拟分析技术与GIS的合并应用成为近年城乡规划相关研究的重要趋势[4-5],尤其是与各种人工智能算法结合的应用研究[6-8].神经网络算法(ANN)[9-10]能依据研究者所观测环境因子与目标模式数据,通过训练程序建构研究对象的专家知识数值模型[11].基于元细胞自动机(CA)原理建构的GIS模型,能以CA单元细胞格式与增生规则,体现城市非正规商业行为的碎形不规则发展特性,也能藉GIS技术记录各项环境观测数据,以图像同步展现各阶段研究成果[12].城市非正规商业行为是城市街道具有自发性的复杂行为,结合ANN与CA技术的GIS模型,不仅能模拟分析与描述城市非正规商业行为,也能预测其未来的发展趋势.本文应用ANN和CA建构台湾逢甲夜市商圈的GIS模型,进行非正规商业行为的数值模拟,以及进行环境因子的分析实验,解析非正规摊贩在夜市街道上的分布状态,揭示各环境因子对此非正规商业行为的影响性与相关性.
1.1 神经网络算法ANN
ANN算法具有许多特性,如目标优化能力、输入信息的误差容忍能力、因子分析能力、目标模式的预测能力等[10-11].ANN基于模式辨识与分类功能,在城乡规划相关研究领域有许多成果[6-8].多层ANN基于非线性技术难以解析目标模式数据与输入因子数据的关联性[13],而单层ANN不仅能执行目标模式辨识与分类任务,也能通过ANN因子权重值分析与统计图表分析方法,理解各因子对目标模式的影响性及相关性.文中采用的就是单层ANN技术,ANN算法通过训练程序可降低输出数值与现实目标模式值的误差,以达成最佳目标模式分类结果.完成训练程序的ANN,最终模式输出值为
(1)
式(1)中:Yj为ANN模式值输出结果;Xi为第i项输入因子;Wi,j为ANN因子权重值;δ为转换函数;β为偏压值.
1.2 以CA原理建构的GIS模型
应用GIS进行城乡发展相关研究时,一般采用“宗地图”作为基础图形单元.然而“宗地图”属于规范化基础土地轮廓,无法充分表达城乡发展过程的非正规行为模式.因此,相关学者采用碎形图形(fractal graphics)作为应用GIS的基础图形单元,以表现城乡发展过程有如生命自组织的演化状态.应用CA原理建构的GIS模型即属此类技术[5,12].以CA原理建构GIS模型具有有机性、相似性、自组织发展性、由下至上的发展逻辑等特点,很适合应用于研究城市非正规商业行为的数据记录、分析与成果展现等工作执行.
传统的CA程序有设定单元格式、设定单元模式状态、设定邻近关系、制定演化规则4项.随著CA技术多元发展及与其他算法的结合应用,上述CA程序在操作上变得更加多元灵活[1-2,5].文中研究的CA应用操作主要在设定单元格式和设定单元模式状态两CA程序上,可藉GIS模型的建构过程进行设定;而设定邻近关系与制定演化规则两个CA程序,则能在ANN程序中以相关环境因子的方式进行设定,并由ANN最终判定各CA单元的模式状态.
文中研究实证材料为台湾逢甲夜市商圈的非正规摊贩群.逢甲夜市是典型沿街发展夜市[14],时常可见非正规摊贩占据街道两边的人行道及骑楼区域.这些非正规摊贩群属不合法商业行为,然而其聚集所产生的热络氛围,是逢甲夜市成为知名夜市区的主要原因.实验区域为逢甲夜市各街道区域.为记录非正规摊贩的分布现况,将实验区域以CA网格单元形式建构GIS模型.CA网格化过程,如图1所示.图1(c)中:深色标记表示被非正规摊贩所占据的CA单元.
(a) 原始街道状态 (b) CA网格化街道区域 (c) 被非正规摊贩所占据的CA单元图1 以CA网格单元形式建构GIS模型的非正规摊贩分布Fig.1 Distribution of informal vendors by GIS model with CA grid formation
实验区域共有10 940个CA单元.经现场调研,其中被非正规摊贩占据1 717个CA单元(图2)为文中研究目标模式(称T1模式并以数值1记录);另外的9 223个CA单元则是未被占据(称T0模式并以数值0记录).由相关文献资料整理出7个环境因子,用于描述各CA单元所处位置与相关街道特征的属性与距离关系,如表1所示.这些街道特征是有关学者归纳出具有吸引非正规摊贩聚集的潜在效应[14-15],而所有环境因子数值都是经过归一化,设定在0~1之间.有关算法的各程序都是以MATLAB语言所编写,GIS模型则是以ArcGIS软件来操作执行.
表1 描述CA单元的环境因子Tab.1 Environmental factors to describe CA units
图2 目标模式分布的现况调研结果Fig.2 In-situ investigation of distribution of target pattern
首先,进行ANN判定CA单元发生目标模式的GIS模拟结果.有关训练ANN设定方面,是将所有CA单元分为1/2训练集和1/2测试集进行ANN训练程序.ANN转换函数为Logistic Sigmoid 函数,使ANN模式输出值限制在0~1之间.完成ANN训练后,各CA单元可由式(1)产生最终ANN模式输出值,并依此来判定CA单元是否发生目标模式.
实验共执行20次ANN程序以测试ANN结果的稳定性,如表2所示.由表2可知:实验模拟结果为平均正确率84.1%,而T1目标模式的平均正确率可达94.2%.
表2 ANN目标模式模拟结果Tab.2 ANN simulation results of target pattern
续表2 Continue table
图3 以GIS展现ANN模拟结果Fig.3 ANN simulation result demonstrated by GIS
ANN判定CA单元发生目标模式的GIS模拟结果,如图3所示.图3中:深色CA单元式是ANN所判定的目标模式.将图3与图2进行比对,观察ANN模拟结果与调研现况的相似性.平均模拟正确率代表环境因子设定(表1)对目标模式的掌握与描述能力,下一实验阶段将以此模拟表现为基础,进行环境因子的分析工作.
ANN模式分类逻辑源于数学回归技术,单层ANN的训练过程是一种线性函数的最优求解过程.完成训练的ANN函式其因子权重值(式(1)的Wi,j),表示ANN在多维空间进行模式分类时,对各输入因子的依赖程度[11,16].因此,对单层ANN因子权重值进行分析,能观察出哪个环境因子对目标模式具有较高影响性.表3为已训练ANN的因子权重值,其数值绝对值越高者,代表其所对应的环境因子对目标模式的影响性越高.各环境因子其ANN因子权重绝对值高低排列如下:SL,C2,C3,C1,SW,IntF,BBW.由此可知:SL是所有假设环境因子中,对非正规摊贩的发生最具影响性;而BBW则是最不具影响性的环境因子.
表3 以ANN因子权重值分析环境因子的影响性Tab.3 Impact analysis of environmental factors by ANN weight values
(a) SL
(b) IntF (c) SW
(d) BBW (e) C1
(f) C2 (g) C3图4 应用散点图来进行各环境因子的相关性分析Fig.4 Correlation analysis of each environmental factor by scatter diagram
环境因子的相关性分析工作,则须搭配统计图表分析方法的散点图和皮尔森相关系数来进行.所有CA单元的ANN模式输出值与各环境因子变数值的散点图分析结果,如图4所示.图4中:AnnV为ANN模式输出值;NFV为经过归一化的环境因子变数值.各环境因子变数值与ANN模式输出值的皮尔森相关系数分析结果,如表4所示.
由表4及图4可得,正相关环境因子为:SL,IntF,BBW和C24个环境因子,其余则为负相关因子.由以上ANN因子权重值分析与散点图、皮尔森相关系数分析后可得:街道位置类型因子是所有假设环境因子当中最能吸引非正规摊贩聚集的正相关因子.
比较表3,4可知:SW(街道宽度)与BBW(背景建物宽度)在表3属对目标模式影响性偏低群,但在表4属相关系数偏高群.进一步由图4发现,这是因为此两数据在散点图上的分布极不均匀造成的. 因此, 高相关系数并不一定表示该环境因子对目标模式具有较高影响性,具有数学回归理论支持的ANN因子权重值分析,才能客观判断环境因子对目标模式的影响性.然而,上述环境因子分析方法的共同使用与比对分析,才能全面挖掘环境因子信息.
表4 各环境因子变数值与ANN模式输出值的皮尔森相关系数分析Tab.4 Correlation analysis of Pearson correlation coefficient between different kinds of environmental factor values and ANN outputs of target pattern
另外,由ANN因子权重值分析辅以散点图、皮尔森相关系数的分析结果,可作为下一步修正环境因子实验假设的依据.如BBW是对目标模式最不具效益的环境因子,因此,在未来的环境因子实验假设可考虑以其他因子替换.
应用ANN与CA技术的GIS模型进行以下两阶段实验操作:1) 以ANN模式辨识与CA细胞增生形态来模拟逢甲夜市非正规摊贩的分布;2) 通过ANN因子权重值分析与散点图、皮尔森相关系数等分析方法,解析各环境因子对于发生非正规摊贩的影响性与相关性.通过实验,非正规摊贩分布模拟结果为平均正确率84.1%,而目标模式的平均正确率可达94.2%.
在环境因子影响性分析方面,SL是发生非正规摊贩最具影响性的环境因子,BBW是最不具影响性的环境因子.在环境因子相关性分析方面,与发生非正规摊贩现象呈正相关因子为:SL,IntF,BBW与C2,其余为负相关因子.因此,街道位置类型因子是所有假设环境因子中最能吸引非正规摊贩聚集的正相关因子.上述环境因子的分析结果,可进一步作为未来修改环境因子实验假设的依据.
[1] THAPA R B,MURAYAMA Y.Urban growth modeling of Kathmandu metropolitan region, Nepal[J].Computers Environment and Urban Systems,2011,35(1):25-34.
[2] SANT I,GARC A A M,MIRANDA D,etal.Cellular automata models for the simulation of real-world urban processes: A review and analysis[J].Landscape and Urban Planning,2010,96(2):108-122.
[3] BOLSTAD P.GIS Fundamentals: A first text on geographic information systems[M].3rd ed.White Bear Lake,Minn: Eider Press,2008:15-36.
[4] 胡永进.地理信息系统在城市规划中的应用[J].江苏城市规划,2010(5):32-37.
[5] BATTU M.Modelling urban development with geographical information systems and cellular automata[M].Boca Raton:CRC Press,2009:11-27.
[6] PIJANOWSKI B C,TAYYEBI A,DOUCETTE J,etal.A big data urban growth simulation at a national scale: Configuring the GIS and neural network based land transformation model to run in a high performance computing (HPC) environment[J].Environmental Modelling and Software,2014,51:250-268.
[7] GREKOUSIS G,MANETOS P,PHOTIS Y N.Modeling urban evolution using neural networks, fuzzy logic and GIS: The case of the Athens metropolitan area[J].Cities,2013,30(1):193-203.
[8] BASSE R M,OMRANI H,CHARIF O,etal.Land use changes modelling using advanced methods: Cellular automata and artificial neural networks. The spatial and explicit representation of land cover dynamics at the cross-border region scale[J].Applied Geography,2014,53:160-171.
[9] HAUPT S E,LAKSHMANAN V, MARZBAN C,etal.Environmental science models and artificial intelligence[C]∥Artificial Intelligence Methods in the Environmental Sciences.Netherlands:Springer,2009:3-13.
[10] DUDA R O,HART P E,STORK D G.Pattern classification[M].2nd ed.New York:Wiley,2001:25-61.
[11] BISHOP C M.Neural networks for pattern recognition[M].New York:Oxford University,1995:76-93.
[13] ZHANG G P.An investigation of neural networks for linear time-series forecasting[J].Computers and Operations Research,2001,28(12):1183-1202.
[14] HSIEH A T,CHANG J.Shopping and tourist night markets in Taiwan[J].Tourism Management,2006,27(1):138-145.
[15] YATMO Y A.Perception of street vendors as out of place urban elements at day time and night time[J].Journal of Environmental Psychology,2009,29(4):467-476.
[16] MARZBAN C.Basic statistics and basic AI: Neural networks[C]∥Artificial Itelligence Methods in the Environmental Sciences.Netherlands:Springer,2009:15-47.
(责任编辑: 陈志贤 英文审校: 方德平)
Analysis of Urban Informal Business Behavior Based on GIS Model Constructed by ANN and CA
WU Baokuan
(College of Architecture, Huaqiao University, Xiamen 361021, China)
Based on the artificial neural network (ANN) algorithm and the cellular automation (CA), the geographic information system (GIS) model of the Fengjia night market in Taiwan was constructed, the commercial behavior of the informal street vendors was simulated. The results show that: the average simulation accuracy of the informal street vendor distribution is 84.1%, but the average simulation accuracy of target pattern is 94.2% high. In the environmental factor impact analysis, the street location type is the most influential environmental factor of the informal vendors. The background building width is the least influential environmental factor. In the environmental factor correlation analysis, the street position type factor is the positive correlation factor that is the most attractive environmental factor for attracting informal vendors.
urban informal business behavior; artificial neural networks; cellular automation; geographic information system; environmental factors
10.11830/ISSN.1000-5013.201704010
2016-10-17
吴保宽(1976-),男,讲师,博士,主要从事人工智能技术应用于城乡建筑设计与规划的研究.E-mail:py1006@hqu.edu.cn.
国家自然科学基金资助项目(41401224); 福建省自然科学基金资助项目(2016J01238)
TU 17
A
1000-5013(2017)04-0497-06