张琳 白云庆
天津市市政工程设计研究院 天津 300000
交通小区的划分是开展交通调查、交通预测、交通规划等工作的基础。传统的交通小区常以城市道路为边界,将研究区域划分为若干个等大的分区。蒋萌露等学者以马德里市为研究对象,研究结果表明基本单元面积越小,得到的数据精度越高,越能反映出细节问题。宋小冬、易嘉对城市交通分区合理性进行了探究,发现分区越多,结果偏差越小。 同时,如果研究区域过大,那么传统的手段将面临巨大的数据处理压力,数据精度也难以保证[1]。
以现状城市道路围合而成的封闭区域作为初始小区。
采用POI点样方密度法描述各小区特征。利用TF-IDF算法辨别各区的主导功能。
采用二阶聚类分析,对各小区进行分类分组。
对同组且相邻的小区进行合并,对个别小区进行人为修正。
以现状道路为基础,道路围合而成的区域即为一个初始小区,共计490个。
POI兴趣点是现实情况在地图上的反馈,包含信息有行业类别、地理位置、名称等,是分析城市功能的有效数据。
因各小区大小不同,分布的POI种类、数量不同,无法直接描述各初始小区内POI分布特征。故采用点样方密度法来量化各小区的POI分布特征。
考虑到各类POI对城市功能的影响程度不同,对其进行权重赋值。首先将POI根据功能划分为大、中、小三类。针对大类的权重系数,采用专家打分和模糊评价的方法确定[2]。
针对中类的权重系数,采用因素两两比较法。各因子所有得分的平均值则为其权重。
针对小类的权重系数,采取层次分析法进行权重赋值,采用百分制。
将POI的大类、中类、小类权重系数综合起来即为综合权重系数:
表1 POI分类及权重系数一览表
为避免数据描述过于复杂,选取中类数据为统计对象,来描述各初始小区的POI分布特征,则:
得到各类POI的综合权重系数后,可进行各小区的POI点密度分数计算:
各小区内的POI种类、数量都各不相同,故不能采用传统的描述统计判别其主导功能。因此引入TF-IDF模型算法,来识别各区的主要功能。
TF-IDF具有良好的分类能力,赵家瑶等学者采用TF-IDF算法,对北京重要交通枢纽空间的城市功能进行识别。
研究方法是将区域内某类POI的分值看作一个词语,全部POI分值总和看作整篇文章[4]。
计算各小区内各类POI分值所占的权重,权重最高的POI类别则为该小区的主要功能。若权重最高的值小于0.1,则认为该小区为无明显主导功能。
其计算公式如下:
图1
图2 交通小区的初步划分
根据POI功能识别结果,研究区域内配套功能为主导的初始小区占大多数,如果将这些初始小区合并为一个交通小区,得到的交通小区面积过大,违背此次研究的初衷,即尽可能将交通小区划分得精细,以得到准确的交通预测结果[5]。
故此引入聚类分析的概念,聚类分析法是将特征相似的对象划分为一个族群,各个族群之间差异明显。本次分析基于SPSS软件,采用二阶聚类算法。二阶段聚类算法可以同时处理连续变量和分类变量,快速处理大数据集并自动得到最佳分类结果。对不同功能小区的POI点密度分数进行二阶聚类计算。
根据聚类结果将同一功能的小区分为不同的组别,将同功能同组别且相邻的交通小区进行合并。为保证交通小区的唯一性和完整性,不能发生重叠或遗漏,且不能产生 “回”字形的形状,对分区进行人为修正。最终得到交通小区187个,削减了303个,此方案为最终交通小区的划分方案[6]。
表2 聚类分组一览表
图3 最终交通小区划分方案
基于POI功能识别和聚类分析来划分交通小区的方法,考虑了城市空间的实际功能和特点。在互联网飞速发展的时代,大数据能为决策提供更为科学、合理的支撑。对比传统划分交通小区的方法,本文的研究方法突破了人为工作的局限。基于GIS平台和SPSS软件分析,便于大数据处理。分析结果更加科学合理,分析手段具有普适性,易于推广。