基于大数据的成都市培训机构聚集模式探讨

2021-09-23 14:05杨山力
山西建筑 2021年19期
关键词:香农行政区域成都市

杨山力 张 诚 吴 伟 陈 晗

(成都市规划设计研究院,四川 成都 610041)

1 概述

教育作为城市发展的“动力源”,是城市发展现代化的重要标志之一,要求越来越多不同类型的培训机构。成都市作为全国教育的重镇,根据《2014年—2018年中国教育培训行业市场调查与发展前景分析研究报告》表明成都市的教育培训市场位居全国前五。随着成都市人均收入的提高和对教育的重视,成都市的培训机构市场将会越来越大,越做越强。相关调查报告显示,成都的培训机构已经实现了“从一条街到一座城”的转变。面对市场的大量需求,如何确保培训机构的便利化和公平化,最大程度的推进教育的均衡发展,满足全民对于培训机构的需求,需要我们对成都市中心城区的培训机构的发展水平和数量进行研究分析,发现不足,取长补短,来不断优化培训资源,最终实现培训机构的多元化合理分布。

2 数据源

本文以成都市中心城区(11+2)为研究区域,利用网络爬虫技术获取研究区域中大众点评的教育模块[1]上的所有培训机构数据,包括店名、类别、经纬度、详细地址、培训效果、培训环境、师资、分店数量、评论数等属性信息[2],数据爬取时间为2020年8月,原始数据共计8 006家培训机构店铺。为了确保结果的准确性和真实性,首先对原始数据进行预处理,去掉非餐饮的点位和重复的点位信息,然后采用坐标转换技术将其转为CGCS-WGS84通用坐标系,最终筛选出的有效培训机构点位个数为7 976家(见图1)。同时利用爬虫技术基于百度地图对研究区域中的小区大门位置信息进行获取包括大门名称、大门地址、经纬度信息。数据爬取时间为2019年12月,通过数据清洗和整理,小区大门数据的最终有效数据为18 389条(见图2)。

3 研究方法

为了研究成都市中心城区各行政区内的培训机构空间聚集特征,分别从环境品质、品牌效应、便利指数、香农—威纳指数(该指数主要用于衡量各行政区域内不同类型的培训机构的丰富程度和均匀程度)四个维度,共计7个指标体系来进行综合评价分析(见表1)。然后对这7个指标进行系统聚类[3],通过矩阵运算计算出各个行政区域之间的欧式距离,最终识别出成都市中心城区各行政区域内培训机构的空间聚集模式特征。

3.1 便利指数

便利指数主要用来衡量各行政区内各个住宅小区从小区大门到最临近的培训机构的平均直线距离,间接反映居住小区到培训机构的便利性[4]。

表1 指标体系与描述

其中,i为不同行政区内不同住宅小区的位置坐标;j为不同行政区内不同培训机构的位置坐标;c为各个行政区域内培训机构的类型总和。

当D值越小,表明该研究区域内的居住小区到对应的培训机构越近。当D值越大,表明该研究区域内的居住小区到对应的培训机构越远。

3.2 香农—威纳指数

本文利用香农指数来研究成都市中心城区各行政区内的培训机构类型是否丰富、是否均匀分布[5]。香农—威纳指数(H)[6]的计算公式如下:

其中,s为群落物种丰富度指数,即物种类型总数;pi为物种i的相对丰度。

当群落完全均匀,即群落中所有物种丰富度完全一致时,香农—威纳指数的值达到最大[7]。

3.3 系统聚类

本文采用系统聚类分析法(Hierarchical Cluster)对成都市中心城区各行政区内的培训机构按照对应的评价指标体系进行分类统计。由于指标之间量纲不同,会使得不同指标的影响权重存在差异[8]。因此,需要对所有指标统一进行标准化处理。其中各个类别之间的欧式距离计算公式为:

数据标准化计算公式为:

4 结论分析

通过对成都市中心城区各行政区域的数据进行收集,并利用上述计算公式对成都市中心城区各区域的便利指数和香农指数进行计算,结果如表2所示。

利用SPSS软件对表2中评价成都市各行政区域内培训机构发展水平的指标表进行标准化处理,然后进行系统聚类分析,结果如图3所示。发展水平空间位置聚类图见图4。

根据系统聚类树状图进行划分,当不同类别间的距离等于5时,成都市中心城区的各个行政区域具有较好的分类效果,大致可以将成都市中心城区分为六个等级。金牛区、成华区、锦江区、青羊区和高新区被归为同一等级,武侯区被单独划为一级,郫都区、温江区和龙泉驿区被归为同一等级,双流区和天府新区被归为同一等级,新都区被单独划为一等级,青白江区被单独划为一等级。

表2 成都市中心城区各区域餐饮评价指标表

结合成都市的产业规划定位与中心城区的产业功能区划分,金牛区、成华区、锦江区、青羊区和高新区都属于成都市的老城区,教育资源和对应的消费水平都比较高[9],所以它们被聚为了同一级。而武侯区因为在连锁店数量和便利指数上与其他老城区差距比较大,所以被单独划为了一级。郫都区、温江区和龙泉驿区同属于二圈层,在培训机构的连锁数量、便利指数和香农指数上都比较相似,并且这些区域的房价和消费水平都比较低,辖区内的培训机构数量也相对较少,因此它们被聚为了同一级。双流区与天府新区被划为了同一等级,天府新区是从双流区中剥离出来的区域,所以两者无论是在教育资源的配置和人均消费水平上都比较相似,区域内的培训机构数量、类型和连锁店数量等等指标都比较相似。但是随着天府新区被定义为国家级新区,政府和其他企业不断加大对该区域的资金与资本投入,所以天府新区的培训机构在未来肯定能发展的更好。最后就是新都区和青白江区都被单独划为了一级。新都区因为在培训机构的效果、师资和环境指标中都比较低(趋近于1),其对应的便利指数也超过了2 km。相比青白江区,其对应的培训机构的效果、师资和环境指标都是中心城区域中最低的(<1),但其对应的便利指数却小于1 km。所以新都区和青白江区都被单独划为了不同等级。

总而言之,利用系统聚类法对成都市中心城区的培训机构聚集模式进行分析,结合实际情况验证,聚类结果与实际情况比较吻合,这为补足成都市中心城区各行政区域的公共服务设施配套能起到对应的指导作用,也能为合理的规划城市产业布局提供丰富的数据支撑和理论指导。

猜你喜欢
香农行政区域成都市
中共成都市第十四届委员会常委简历
行政区域突发环境事件风险评估研究
大卫,不可以
行政区域微界线的精细与割裂
学术与政治:民初中国地学会的行政区域研究
2019年1~9月 成都市经济运行情况
2019年1~6月成都市经济运行情况
2018年1—12月成都市经济运行情况
《中华人民共和国测绘法》释义(之十三)
香农说:跟着好奇心走