基于R 语言的城市地理学课程可视化教学探究

2024-06-01 15:42陈思锦刘钰刘岱宁余卓芮
电脑知识与技术 2024年10期
关键词:R语言可视化教学改革

陈思锦 刘钰 刘岱宁 余卓芮

摘要:现有城市地理学教学中的多媒体展示大多局限于教材内容和实例图片,难以充分发挥可视化教学的优势。基于R语言扩展包ggplot2的可视化功能,依托广东省土地城市化案例,探索了基于参考线、图层叠置和前置数据转换为代表的可视化教学途径。这些可视化途径,可将抽象的概念、模型和统计方法转换为直观的视觉元素,使其更容易被学生理解和掌握。教学实践表明,可视化教学模式可有效地对理论讲解和分析建模等教学模式进行辅助和支持,从而实现教学效果的提升。

关键词:R语言;ggplot2;城市地理学;可视化;教学改革

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2024)10-0146-04

0 引言

城市地理学是城乡规划专业的一门主干课程,通过从地理的视角讲授城市发展的特征、过程和规律,使学生能够针对城市发展中的问题,提出初步的规划引导策略。长期以来,城市地理学课程的授课主要包括理论讲解、分析建模和可视化3种模式。其中,理论讲解模式主要通过概念界定、逻辑演绎和案例介绍等手段对城市发展的理论进行讲述和解析。分析建模模式主要采用统计分析和数学模型等定量化工具对城市发展进行模拟和预测,并在此基础上对其发展特征和规律进行讲解。可视化模式主要通过线条、形状和颜色等易于识别、理解的视觉元素来表征难以理解的抽象信息,从而将抽象的教学内容以较为直观的形式向学生讲授[1]。因此,可视化模式可将理论讲解和分析建模两种授课模式中讲授难度较大的内容转化为易于理解的形式,是一种具有突出优势的授课模式[2]。

随着教学研究和实践的进步,城市地理学课程教学中的理论讲解和分析建模模式都取得了长足的发展。例如,万庆等采用翻转课堂的形式优化了“城市规模分布”的理论讲解模式[3]。对于分析建模模式,随着地理信息系统等分析工具的引入,大量具有较高可操作性的案例被引入教学[4]。但是,城市地理学课程教学中可视化模式的发展仍然较为滞后。在教学实践中,虽然以PowerPoint为代表的多媒体工具被广泛用于教学,但往往只是将教材内容和实例图片投放到多媒体屏幕上,使得可视化教学模式的优势难以体现在教学实践中。为推动城市地理学课程可视化教学模式的发展,亟须引入新的教学辅助工具。

随着大数据时代的到来,数据可视化工具也趋于成熟,其中代表性的工具包括Tableau、Splunk和Car?toDB等商业软件以及ColorBrewer、D3.js和R等开源软件[5]。其中,R语言是面向统计分析以及数据可视化的开源编程语言。由于具有开源免费、功能丰富和使用灵活等优点,R语言被众多教师应用于教学实践[6]。例如,荣民希等基于R语言的可视化功能进行了概率统计的教学研究与实践[7]。但在城市地理学课程教学中,依托R语言进行的可视化教学研究还很鲜见。本文拟基于R语言ggplot2扩展包的强大可视化功能,依托广东省土地城市化案例,探索城市地理学课程的多种可视化教学途径。

1 基于R 语言的可视化教学途径

数据可视化是R语言的核心功能;特别是Wick?ham等基于图形语法(Grammar of Graphics) 开发的gg?plot2扩展包,使得R语言的可视化功能得到了极大的强化[8]。在ggplot2包的图形语法架构中,绘图可以分解为多个要素。其中的核心要素是图层,图层包含了从数据到形状、颜色等视觉元素的映射信息。映射的精确控制可通过标尺(scale) 函数来实现。字体和版式等修饰性内容,可通过主题函数来进行调整。基于图形语法架构的ggplot2包具有组件丰富、支持图层叠置和前置数据变换等优势,可为多种途径的可视化教学提供支撑:

1) 基于参考线的可视化教学。ggplot2包具有丰富的组件,除了散点图、折线图和雷达图等常规的数据可视化组件,还可以绘制各种形式的参考线。例如,城市发展往往是不平衡的,各城市在发展上的差异程度可用Hoover指数等指标来测度[9],但测度结果只是较为抽象的单一数值,使得学生难以直观地理解其不平衡程度。通过R语言,可以先行假设各城市处于相同的发展水平,并绘制其累积分布曲线作为参考线。通过该参考线与现实城市的累积分布曲线进行对比,可对城市间的不平衡发展程度进行直观展示。可见,依托参考线,可将城市不平衡發展概念以更为直观的形式呈现出来,从而实现抽象理论概念的可视化教学。

2) 基于图层叠置的可视化教学。ggplot2可将数据映射到多个图层,并叠置显示。例如,回归拟合是对城市发展规律进行探索的最为常见的分析模型之一。ggplot2不仅可以绘制回归拟合曲线,还可以基于图层叠置功能,在回归曲线图上进一步叠置散点图,从而为回归模型中异常点位的识别提供便利。此外,还可以将更多信息映射到散点图的颜色和形状等视觉要素上,从而为异常点位的形成原因提供线索。可见,依托图层叠置,可在分析模型的可视化图形上叠加更多的信息,从而以可视化的形式辅助抽象分析模型的教学。

3) 基于数据变换的可视化教学。ggplot2支持前置数据变换,可将数据进行变换处理后再以图形的形式展示。例如,在城市地理学教学中经常需要对不同分组的城市进行比较,常用的统计方法包括基于最小(大)值、均值等基本统计量的描述性统计,以及基于概率论的推断性统计[6]。基于前置数据变换功能,可以先在程序底层进行描述性统计的计算,再以箱线图的形式直观展示多个统计量。此外,还可以进一步计算不同分组数据的中位数置信区间,通过不同分组数据的置信区间的位置关系可以形象地表达推断性统计结果。可见,依托前置数据变换功能,可以更为便捷和直观地展示统计分析的结果,从而辅助抽象分析方法的可视化教学。

2 基于R 语言的可视化教学案例

如前节所述,R语言扩展包ggplot2具有强大的可视化功能,可以支持参考线的绘制、图层叠置和前置数据变换,从而对抽象的理论概念、分析模型和统计方法进行直观的可视化展示。通过将ggplot2引入教学,可将讲授难度较大的概念、模型和统计方法转化为直观的可视化形式,使其更容易被学生理解和掌握,进而提高教学效果。本节基于广东省土地城市化案例,对城市地理学课程可视化教学途径进行具体介绍。本案例基于不透水地表遥感数据提取了城市用地范围[10-11],并通过高金龙等提出的土地城市化计算方法[12],计算了广东省124个县级行政单元(包括县、县级市及市辖区)的土地城市化率。依托R语言,可对土地城市化教学中较为抽象的概念、模型和方法进行可视化教学。

2.1 基于参考线的可视化案例

区域各城市的土地城市化程度是不平衡的。以广东省为例,广州市天河区已有超过87% 的土地被开发为建成区,而韶关市翁源县仅有10% 的土地被开发为城市。土地城市化的不平衡态势,对区域协调和可持续发展有着深远的影响[12],也是城市地理学课程的重要授课内容。现有教学中往往采用Hoover指数等定量指标来表征各城市土地城市化的差异程度[9],例如广东省土地城市化的Hoover指数为0.35。这种以单一数值为媒介的教学形式,很难形象而全面地展示区域土地城市化的差异特征,从而制约了学生对区域发展不平衡概念的深入理解。

为支持抽象概念的教学,教师可将带有参考线的可视化图形引入教学。首先,绘制124个行政区土地城市化的累积分布曲线(图1(a)中的实线),并通过与参考线(图1(a)中的虚线)的对照向学生直观地展示土地城市化的不均衡水平。如参考线所示,当各行政区土地城市化水平相等时,位序达到40和80时的累计百分比应分别达到32% 和64%;但由于各地城市化水平具有明显差异,现实中土地城市化较低的前40个和80个城市的累计百分比仅为8% 和30%;由此参考线和现实累积分布曲线之间形成了图1(a)中的灰色凹陷。各位序的实际累计百分比与参考值的差异越大,灰色凹陷的面积就越大,区域内各城市土地开发的不平衡程度也越严重。其次,广东省土地城市化的均值也可作为其不平衡水平的重要参考。以土地城市化均值为基准(图1(b)中的虚线),可将广东省的行政区分为土地城市化较低和较高的两组。其中,土地城市化率较低分组的均值为14%,较高分组的均值为62%。两个分组在平均水平上4倍有余的差距,可以使学生直观地感受到广东省内部各地区之间在土地城市化上的显著不平衡。

本案例通过在可视化图形中加入参考线,可将理论假设的平衡数据与现实数据进行比较,通过两组数据累积分布曲线之间的差异来形象地展示土地城市化不平衡的总体水平,还可以将各行政区进行分组,以揭示土地城市化在区域内部的不平衡特征。基于参考线的可视化教学,可以直观地表达较为抽象的区域发展不平衡概念,既有利于教师从整体和区域内部两个视角依次讲解,也降低了学生对抽象概念的理解门槛,从而推动教学质量的提升。

2.2 基于图层叠置的可视化案例

中心城市的辐射作用对土地城市化有重要影响。以广东省为例,中心城市广州的土地城市化率达到了69%;临近广州的江门市,土地城市化率为36%;而远离广州的梅州市,其土地城市化率仅为11%。中心城市的辐射作用已成为区域土地城市化最为重要的影响因素之一,也是城市地理学课程教学中需要重点讲授的城市发展机制。现有教学中往往采用回归模型分析来讲解中心城市辐射对土地城市化的影响机制。但回归模型是建立在复杂的矩阵运算基础上的,如果学生没有良好的数学基础,很难通过回归模型的结果来深入理解中心城市的辐射机制。

为深入讲解中心城市的辐射机制,教师可将多图层叠置的可视化图形引入教学。以土地城市化率为因变量、到中心城市广州的距离为自变量绘制回归拟合曲线,如图2所示,学生可以观察到回归曲线呈明显的下降趋势,说明随着到中心城市距离的增加,中心城市辐射作用随之衰减,周边地区土地城市化水平也逐步降低。由此可见,中心城市的辐射对周边地区的土地城市化具有显著影响。此外,回归曲线在200公里附近下降到最低点后,开始逆向上升,说明还存在其他因素在影响土地城市化。为进一步深入讲解影响机制,可在回归拟合曲线图层上叠置散点图并将行政层级信息映射到散点的颜色上。图2显示,在回归曲线逆势上扬的区间,高于回归曲线的点位绝大多数是市辖区,而县级城市基本低于回归曲线。由此推断,在中心城市辐射效应较弱的外围地区,会依托市辖区形成当地的发展中心,这些发展中心往往土地开发程度较高,从而造成了回归曲线的异常上扬。

本案例通过将回归模型进行可视化展示,学生可以通过回归拟合曲线的走势来探讨中心城市的辐射对周边地区土地城市化的影响机制,而且还能直观地观察到在远离中心城市的地区,拟合曲线的走势会出现异常。通过结合行政層级信息的散点图,本案例还进一步引导学生对拟合曲线的异常走势做出了解释。可见,基于图层叠置的可视化教学,可以在不依赖复杂数学计算的前提下,较为深入地向学生讲授抽象的城市地理学理论机制,相对于抽象的分析模型,可视化教学具有明显优势。

2.3 基于数据变换的可视化案例

政府政策对土地城市化有重要影响[12]。例如,珠三角作为我国对外开放最早的地区,长期得到国家政策的重点支持。广东省土地开发程度最高的广州、深圳等城市都位于珠三角核心区内,而广东省外围地区的土地城市化水平普遍较低。在我国现行的土地制度下,城市土地的调控由政府主导,政府政策对城市土地的影响也成为城市地理学课程的重要教学内容。现有教学中往往采用各类统计方法来对不同的政策地域进行对比分析,基于统计结果来讲解政府政策对土地城市化的影响,但较为抽象的描述性统计量和推断性统计判断,很难让学生对不同政策地域的差异形成全面而深入的认知。

为推动学生全面理解政策差异的影响,教师可将结合数据变换的可视化图形引入教学。首先,对珠三角6个核心地级市与其余外围地区土地城市化率的分布进行可视化。如图3所示,外围地区的分布呈金字塔形,除个别城市的土地城市化率较高外,大部分都位于25% 以下;而核心地区的分布呈橄榄型,土地城市化率以65% 为中心向两侧延伸。其次,从基于描述性统计变换绘制的箱线图来看(图3(a)) ,外围和核心地区在最大值上的差异并不突出。由于外围和核心地区在分布类型上有所不同,两者的差异主要体现在低值部分。具体来看,外围地区土地城市化率的75%分位数(31%) 比核心地区的25% 分位数(53%) 还要低得多,甚至外围地区的均值(22%) 仅略高于核心地区的最小值(16%) 。最后,从基于推断性统计变化绘制的箱线图来看(图3(b)) ,外围地区中位值的95%置信区间为11%-18%,核心地区的相应置信区间为58%-77%,两者中位数的置信区间存在明显错位,说明两者中位数相等的概率极小,由此推断两个地域的土地城市化率具有统计意义上的显著差异。

本案例通过土地城市化率分布的可视化,使学生对广东省外围、核心地区的土地城市化水平差异形成了整體认知,并进一步通过前置数据变换,以箱线图的形式对其描述性统计和推断性统计结果进行了可视化。在可视化图形上,可以同时展示多个描述性统计量。不仅可以表现单一统计量之间的差异,例如两个地域最大值的对比,还可以呈现不同统计量之间的比较,例如外围地区的均值与核心地区最小值的对照。此外,还能通过两个地域中位数置信区间之间明显的错位,直观地解读推断性统计的结论。可见,依托前置数据转换的可视化,可将抽象的统计分析结果进行直观的表达,为学生深入理解统计结果提供了极大的便利,从而支持教学效果的提升。

3 结论

现有的城市地理学课程教学实践虽然已广泛采用了以PowerPoint为代表的多媒体工具,但大多只是将授课内容和实例图片投放到多媒体屏幕上,难以充分发挥可视化教学的优势。基于图形语法开发的R 语言可视化扩展包ggplot2,支持参考线的绘制、图层叠置以及前置数据变换等功能,可将抽象概念、模型和分析方法转换为直观的视觉要素,有效地降低学生对相关教学内容的理解门槛,从而提高教学效果。依托广东省土地城市化案例,对基于R语言的可视化教学途径进行了探索,包括:1) 通过添加参考线,在区域整体和内部对比两个视角进行了区域发展不平衡概念的可视化教学;2) 通过图层叠置,在对回归拟合曲线趋势呈现的基础上,进一步对回归模型异常区间的成因开展可视化教学;3) 通过前置数据转换,可在土地城市化率数据分布的基础上,直观展示多个描述性统计量和推断性统计的结论,极大地便利了统计分析方法的教学。教学实践表明,R语言强大的可视化功能可有效地支持抽象概念、分析模型和统计方法的教学。通过与以逻辑演绎为基础的理论讲解、以定量计算为基础的分析建模等教学模式相结合,基于R语言的可视化教学可以极大地推动城市地理学课程教学质量的提升。

除了城市地理学课程,本研究提出的可视化教学途径还可应用于城市经济学、城市社会学等相关学科。此外,研究表明,人类虽然可从多个渠道获取信息,但通过视觉系统获取的信息占到80% 以上。相对于逻辑概念和数学模型,将教学内容以可视化的形式进行展示,可更为有效地将相关信息传达给学生并降低其认知理解的门槛[5]。因此广大一线教师应积极尝试将可视化模式引入教学,并结合理论讲解和分析建模等教学模式,进一步推动教学质量的提升。

参考文献:

[1] 吴磊,雷田,方浩.大数据背景下信息可视化课程教学模式与策略研究[J].艺术教育,2017(16):128-129.

[2] 周曰志,祝顺和.以地理特征为中心的区域地理可视化思维建模教学[J].地理教育,2016(5):23-24.

[3] 万庆.面向理解的《城市地理学》翻转课堂教学设计研究——以“城市规模分布” 章节为例[J].湖北经济学院学报(人文社会科学版),2018,15(12):143-145.

[4] 尹海伟,孔繁花.城市与区域规划空间分析实验教程[M].3版.南京:东南大学出版社,2018.

[5] 陈小燕,干丽萍,郭文平.大数据可视化工具比较及应用[J].计算机教育,2018(6):97-102.

[6] 潘逵,谭莹.基于R语言的“统计学” 交互式教学探索[J].科教导刊,2022(27):117-121.

[7] 荣民希,黄士国,曲双红.基于R语言Shiny包的概率统计交互可视化教学研究与实践[J].数学学习与研究,2021(6):146-147.

[8] MOULIK D T.Applied data visualization with R and ggplot2:Create useful, elaborate, and visually appealing plots[M]. Bir?mingham,UK:Packt Publishing Ltd.,2018

[9] 刘钰,李登辉,余卓芮,等.城市人口与服务业空间协同的多维机制——以福建省为例[J]. 地理科学,2021,41(8):1354-1363.

[10] ZHANG X,LIU L Y,ZHAO T T,et al.GISD30:global 30 mimpervious-surface dynamic dataset from 1985 to 2020 using time-series Landsat imagery on the Google Earth Engine plat?form[J].Earth System Science Data,2022,14(4):1831-1856.

[11] LI X C, GONG P, ZHOU Y Y, et al. Mapping global urban boundaries from the global artificial impervious area (GAIA) data[J].Environmental Research Letters,2020,15(9):094044.

[12] 高金龙,包菁薇,刘彦随,等.中国县域土地城镇化的区域差异及其影响因素[J].地理学报,2018,73(12):2329-2344.

【通联编辑:王 力】

猜你喜欢
R语言可视化教学改革
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
基于GPS轨迹数据进行分析改善城市交通拥挤
基于R语言的Moodle平台数据挖掘技术的研究
基于人才培养的技工学校德育实效性研究
现代信息技术在高职数学教学改革中的应用研究
以职业技能竞赛为导向的高职单片机实践教学改革研究
微课时代高等数学教学改革的实践与探索