罗富智
(四川大学计算机学院,成都 610065)
教育兴则国家兴,教育强则国家强。高等教育是一个国家发展水平和发展潜力的重要标志。高等院校是立德树人、培养人才的场所,而学科是大学教书育人、科学研究与社会服务的基础。教育部为提高我国大学的办学水平和国际竞争力,不仅设置了双一流背景下的一流大学和一流学科建设计划,近乎同时对全国高校学科开展了评估工作[1]。学科评估量化了该学科目前的发展实力和竞争力,学科建设计划则指引了高校未来发展的方向。高等教育作为我国人才的摇篮,该两项相关工作引发社会各界的关注。
部分即将毕业的本科生做出了国内继续读研深造的选择。该类人群已经隶属于某个专业门类,大部分同学会直接报考对口或相近的研究生专业。相比于本科的通识教育,院校学科实力对研究生的学习科研更为重要。然而,面向实力各有所长的众多高校,高年级本科生们虽然初步了解自身专业的内容,却对学科建设和评估难以有系统性的认识,也容易忽略一个学科群内学科间的相互带动作用,更无法将自身对学校城市的偏好与之对比,因而在报考时过于盲目。
因此,本文综合一流高校建设名单、一流学科建设名单、第四次学科评估结果,对城市、学科实力、发展前景等进行量化评估[2],设计并实现了一个完整的可视分析系统。该系统能够基于学科建设评估指标,主要为面临择校的高中、本科毕业生提供含有用户偏好的院校对比排名,使之择校决策有专业依据可遵循。基于Web端的系统可提供交互手段供用户调整指标权重,从而生成具有用户偏好的排名。系统以计算机新兴工程科学群为例进行分析,使对比结果更客观,用户决策更合理。
本文使用的数据来自于所写爬虫从中国教育在线网站、中国学位与研究生教育信息网上获取。包含高校概况、高校学科群实力评分及高校学科大类概况三个部分。
用于描述一所高校的基本信息,包含学校编号、学校名称、学校各评级学科数量、省市、经纬度等。学校编号(招生代码)用于唯一标识一所大学,如四川大学的高校代码为10610。学校学科评级包括A+~C-,反映学校的学科建设情况。
用于评价一所高校的实力,包含城市评分、知名度评分、双一流评分、第四次学科评分。城市评分来自于上文获取的城市排名数据。知名度评分参考“2019中国最好大学排名”。双一流评分表征高校在一流学科建设中是否存在“电子科学与技术、信息与通信工程、控制科学与工程、计算机科学与技术、软件工程”,如果存在则代表二十分值。第四次学科评分:将电子科学与技术、信息与通信工程、控制科学与工程、计算机科学与技术、软件工程五个学科的学科评估等级映射为分数进行加和,表示该校学科群的发展实力。
用于描述高校的学科完整度,包含学校简介、各学科门类名单等信息。学校简介为该校的主要标签,学科包含文史、理工、经管、医学、农学、艺术等大类与哲学、理学的、工学等一级学科。
基于章节1中的数据描述,本文综合一流高校建设名单、一流学科建设名单、第四次学科评估结果,对城市、学科实力、发展前景等进行量化评估,提出了三点可视分析任务[3],使用户能够基于Web系统对感兴趣的院校进行对比分析,从中加入自己的情感偏好。具体的可视化任务定义如下:
任务一:不同地理粒度的高校分布:
(1)按省份划分的高校数量;
(2)高校地理空间分布;
(3)筛选院校范围;
(4)基于学科评估的学校发展现状。
任务二:基于学科群的竞争力排名:
(1)学校的整体竞争力排名;
(2)学校的固有属性、学科群实力与前景;
(3)定义排名属性权重。
任务三:学校学科门类竞争力:
(1)学科门类实力和前景;
(2)相似发展模式院校的探索。
基于以上可视化任务,本文完成了可视化视图设计与系统实现。
根据本文获取的数据和本文所定义的可视化任务来设计可视化系统方案,本文基React[4]、Echarts[5]、Pandas[6]等技术进行方案实现。本文设计的可视化能够清晰地解决定义的三个可视化任务,帮助用户完成高校的对比与选择。
高校本身的地理位置属性是重要的分析因素,基于地理分布的分析能够帮助我们发现全国的高校分布,从而发现学科建设较为完善的省份。如图1所示,显示了学校在全国15个省级行政区的数量分布情况。
图1 高校分布统计
进一步地,采用地图与玫瑰图叠加的方式可以对大学的地理信息进行展示,如图2所示。通过地图上叠加的南丁格尔玫瑰图的半径编码某高校从“A+”到“C-”九个学科评级上的学科数量,并用颜色区分不同的级别。在控制面板中对学校进行筛选后,可观察到某省符合条件学校的地点信息。通过对学校间学科评估的分布情况进行分析,可以实现学校间的比较。在图2中可以发现,四川大学和电子科技大学在第四轮学科评估中差异明显。同时用户可以通过对拖拽、缩放、单击双击等操作于其他视图联动进行进一步分析。
图2 地图视图:高校学科评估
本文要分析的高校信息是多维度信息,包括“城市”,“知名度”,“双一流评分”以及个学科实力等纬度。为了支持同时对多维度信息的可视化分析,采用雷达图[7]与热力图矩阵[8]相结合的方式。如图3和图4所示,热力图矩阵详细展示了学校之间的排名情况。其中,行代表对应高校,列代表高校的某个属性,通过颜色深浅编码对应行高校在对应列属性上的表现的优劣。雷达图中,用五个坐标轴展示高校在五个纬度的归一化表示的优劣信息,离中心点距离越远代表在对应属性上表现越好。雷达图可以同时展示多个高校,不同高校用不同色相区分。
图3 雷达图
图4 热力图矩阵
在图4中,可以发现南开大学和四川大学排名很接近,同时各项分布得分也基本一致。通过在控制面板对第四次学科评估权重进行调整,会发现四川大学的排名有所上升。
如图5所示,在学科门类建设和评估视图中,通过双向横向柱状图展示高校在“理工”、“文史”等六类学科分别在学科评估和一流学科建设方面的实力,柱状图的高低编码对应属性强弱,从而对所选学校的学科评估分数和学科建设数量进行展示。在图5中可以发现,四川大学在理工和医学领域学科评估分数较高,同时所入选的学科建设数量也十分众多。
图5 学科门类建设和评估视图
在学科评估基础上,采用散点图的方式展示学校之间的相似性,如图6所示。将学校属性降维映射到二维坐标中,每个散点代表一个学校,散点相近代表这两所学校的发展模式相类似,如发展程度相当的综合性大学。通过对图6的探索,我们发现投影的结果符合人们对于学校的基本认知。强工科学校如合肥工业大学、北京交通大学、华南理工大学、西安电子科技大学等聚成了一簇。
图6 高校投影视图
结合以上三小节中的可视化视图设计,最终形成的系统界面图如图7所示。用户通过在地图上点选自己感兴趣的学校,可以在学校属性视图和学科门类建设和评估中对学校的详细信息进行查看。同时,用户通过鼠标悬浮操作,可以查看该校的一流学科建设名单。在高校对比视图,用户通过鼠标点击删除自己不感兴趣的学校,也可以通过鼠标悬浮查看各个学校在不同维度的评分情况。
图7 系统界面图
本文从高校一流学科建设与学科评估的角度出发,提出了高校学科分析中应关注的三大可视分析任务,并且从这三个任务层次(地理分布、学科群排名、学科竞争力)出发进行不同维度的解析。通过交互联动的方式,使视图之间进行交互探索,从对高校学科信息提供了全方位、多角度的理解。基于本文实现的系统,用户能够从自身需求出发完成院校对比、专业选择等任务。此外,系统也可面向高校工作人员,鲜明呈现校内外学科建设的差异,为学科群发展政策提供建议。