杨 佟,张利辉,马嘉蓉,杨东虎,于新朋,许宝洁,游婷婷
(天津城建大学地质与测绘学院,天津300384)
京津冀一体化是国家确立的一项重大经济发展战略,京津冀城市群是新的经济增长极,是当下社会关注的热点.统计年鉴是开展京津冀协同发展研究的数据基础,可视化让数据分析更加便捷,更直观地获取知识.在具体的可视化实现方面,包括传统的医学、天文地理和新兴的社会媒体等各个领域,国内外仍在继续进行深入的研究.
目前国内地理信息可视化新技术研究热点主要集中在虚拟现实技术、增强现实技术、自适应地理信息可视化技术以及地理信息全息显示技术4 个方面[1].在国外许多大型企业、科研机构都会有相关部门进行数据可视化研究,如数字图书馆.媒体和政府机构也对掌握的数据进行可视化分析,如犯罪地图.互联网行业,掌握了大量用户活动信息、用户关系网或语料库的网站,比如Digg,FriendFeed,Flickr 或大型电子商务网站等,都开展实验性的可视化项目.
但目前,数据可视化技术的发展仍存在一些局限性.鉴于数据可视化有很高端的技术要求,只有技术人员才能发现价值,用户群仅限于数据可视化领域的专家和技术人员.同时,地理空间数据可视化平台对数据存储和数据处理的技术还不够完善[2].然而,在信息化时代,需要进行可视化数据应用的人群迅速扩大,促进了更加智能的数据可视化工具的出现.较新的技术工具允许非技术用户在不必学习如何使用复杂的模型和多媒体软件的情况下,能够对任意学科进行数据的可视化呈现.
京津冀统计年鉴是反映北京、天津、河北国民经济和社会发展情况的最具权威性的资料.早期统计年鉴资料主要以纸质图书为主,近些年提供了电子版本,主要是文字和图表的形式,同时应用多年数据信息,整理工作繁琐,数据不能与研究区域直接关联,图表表达不够直观.而数据可视化技术能够缩短用户获取数据时间,同时使用户有效地发现隐藏在数据背后的复杂关系,更利于人们对信息的接受[3].比起使用纯文本数据,可视化技术更能帮助用户理解和应用数据.通过对京津冀地区统计年鉴的数据可视化,可以很直观看出行业、人口、资源利用等信息,还可以对将来的人口老龄化、行业发展等进行预测,对社会经济和国民发展会起到积极作用[4].本论文主要研究国民经济和社会发展相关数据的专题图表达及统计年鉴信息数据的空间信息化,为京津冀协同发展的科研、政策制定、宏观决策等提供数据支撑.
京津冀统计年鉴系列数据的可视化,可使用户更直观地分析其近年来各个方面的发展变化,从而能更好预测未来几年的变化,其提供了一种非常清晰的沟通方式使用户能够更快、更方便地理解和处理信息,为社会各界提供了丰富的信息资源[5].作为人们了解信息的窗口,为更好地传播信息,服务大众,统计年鉴可视化势在必行.
本文基于GIS 平台和专题地图的表达方法,来研究国民经济和社会发展相关数据,采用动态与静态相结合的方法进行可视化表达,实现地图与统计数据的集成表达,使统计年鉴资料应用简单、方便、直观、形象.
由于3 个地区的统计年鉴各章节目录大体一致,但河北年鉴涉及的领域更多,3 个地区的年鉴数据不统一,为了方便形成对比,选取京津冀共有的指标进行整合分类.依据国民经济行业分类标准,从行政、人口、国民经济、人民生活、固定资产投资和房地产、批发和零售业及住宿和餐饮业、对外经济贸易和旅游等这些方面进行区县制图的划分,如表1 所示.从人口、国民经济、固定资产投资和房地产、能源生产和消费、资源环境和公共设施、财政、农业等方面进行省市制图的划分,如表2 所示.
表1 以区县尺度划分的专题指标
表2 以省市尺度划分的专题指标
从时间尺度来说,京津冀统计年鉴分别开始记载于1980 年,1983 年和1985 年,年鉴跨度非常大,时间序列长;从空间尺度上,年鉴记载的内容十分丰富,大到国民经济、固定资产投资,小到人口就业、卫生环境,以数据的形式呈现,所包含的数据量大,方便管理,作为数据支撑,便于其他人进行各项研究.
对于海量的统计数据,对其建立数据库,不仅能减少数据冗余,还便于数据的管理.基于制定的专题,按照不同的时空尺度来构建京津冀年鉴数据库[6].由于政策、法规等原因,行政区划的空间范围会发生某些变化,空间范围发生变化之后,为了实现空间范围和属性的统一,就需要在时间尺度上,对空间数据重新进行划分,也就是需要构建新的时间尺度的时空数据库.例如,2009 年天津市调整部分行政区划,撤销天津市汉沽区、塘沽区、大港区,设立天津市滨海新区.1986 年河北省定县撤县设市,改名为定州市.以区县尺度划分时,天津市蓟县和宁河县在2015—2016 年的统计年鉴里改名为天津市蓟州区和宁河区,与2012—2014 年的统计年鉴不一致.所以以2012—2014年和2015—2016 年分别对其进行分期构建数据库.在建立数据库之前,先收集了京津冀统计年鉴数据和基础地理数据.在设计专题属性时,根据国民经济和社会发展状况选出具有代表性的专题要素,并且基于数据尽可能完备的原则进行数据库的建立,如图1 所示.
图1 构建京津冀年鉴数据库流程图
对于专题属性的变化,按时间尺度对空间进行划分.同一个时间尺度按省市和区县对3 个地方进行专题属性的设计.在统一不同地区相同指标的字段名时,区县的命名方式采用“拼音首字母_年份”,省市的命名采用“拼音首字母_0_年份”,对于拼音首字母缩写相同的两个字段,区县按“英文_ 年份”进行命名,省市按“英文_0_年份”命名.例如,“MANRK_ 年份”代表区县级别的男性人口,“WOMANRK_年份”代表区县级别的女性人口,“CZRK_0_年份”代表省市级别的常住人口,“CITY_0_年份”代表省市级别的城镇人口.具体的命名规则如表3 所示.
表3 字段命名规则
专题地图内容分为底图信息和专题信息,统计信息是专题信息的重要组成部分.京津冀统计数据包含了3 个地区丰富的信息资源,涉及了人口、资源、农业等方方面面.对繁多的数据进行可视化表达,能更直观地反映地区的社会经济信息.而科学性和美观性是衡量专题地图表达的重要因素.因此,依据不同的数据类型和专题内容对统计数据的指标类型进行筛选,选择合适的可视化方法进行表达[7].
基于省市和区县级别,采用底色填充和定点符号法来对各个省市及区县进行分类.采用底色法时,遵从颜色由深至浅、冷暖变化,给人以视觉上的连续性.采用定点符号法时,设计不同的形状、纹理、尺寸和颜色来表示空间实体的地理位置、分类信息等.例如:对于北京市,采用红色五角星来突出它的重要性.
对于多个统计区域的数据,采用的是分区统计图法[8].统计单元采用不同高度或角度的图形来显示分量的差别.基于区县尺度,对于京津冀常住人口数这一专题要素,采用的是柱状图的分区统计图法.分别对2012—2014 年和2015—2016 年的常住人口数据进行制图,依据柱状图的高矮就可以度量近几年京津冀地区常住人口数的差异,从图上可看出近几年来京津冀常住人口数涨势平稳,如图2-3 所示.对于房地产开发投资数据,北京市的房地产开发投资在2012—2015年呈上升趋势,在2016 年略有下降.天津市和河北省的房地产开发投资呈稳步上升趋势(见图4).
图2 2012—2014 年京津冀常住人口数专题图
图3 2015—2016 年京津冀常住人口数专题图
图4 2012—2016 年京津冀房地产开发投资专题图
对于分布不均匀的专题要素[9],例如人口分布、资源分布、专利申请量专题图,卫生机构数量等,采用点值法、分级色彩、分级符号、比例符号等几种方法来表现.基于区县尺度,对于专利申请量数据采用点值法,用点的聚集程度来体现3 个地区的学术发展状况(见图5).由图5 可知北京各区的专利申请数最多,可推知北京地区的学术研究比其他两个地区发展迅速.这几种数量显示方法既可表示专题要素的分布,又可表示专题要素的数量指标.
对于周期性发生变化的专题要素,如水文的季节变化、气候变化、降水量等,可采用定位图表法[10].定位图表法是把某些地点的统计资料,用图表形式描绘在地图的相应位置上,以表示该地某种专题要素的变化.另外,也可做成趋势图,如折线图、面积图、卡吉图等,来表现统计数据在时间上的波动变化,以及预测未来的可能趋势[11].
图5 2016 年京津冀专利申请量专题图
运用动画技术制作地图,也是可视化方面研究的一个重要内容.动态地图分为时间动态地图和非时间动态地图两种.制作时间动态地图时,通过增加时间序列,使得与时间有关的专题属性随着时间的变化而变化.时间动态地图能使用户更加直观地理解时空数据.时间动态地图只随时间改变而非时间动态地图是由于一些其他因素变化而变化,如位置、属性的变化.动态地图能够更好地调度用户的视觉感受,好的视觉感受对事物的认知更加有帮助[12].由于在纸质材料上难以显示动画效果,所以截取了两帧用于展示,如图6-7 所示.基于区县数据,选取全社会固定资产投资这一专题,采用分级色彩的方法来显示京津冀地区全社会固定资产投资量的变化趋势.颜色越深,则全社会固定资产投资量越多,颜色越浅,则全社会固定资产投资量越少.用动态效果进行展示,更能直观反映出京津冀地区全社会固定资产投资近年来的动态变化.
图6 2013 年京津冀全社会固定资产投资
图7 2016 年京津冀全社会固定资产投资
本文研究了京津冀统计年鉴可视化表达方法,通过专题分类,对各个专题内容进行可视化制图,从而提高统计数据在各个行业领域的利用率.但仍然存在部分数据缺失或3 个地区的专题指标不统一的问题,目前采用的方法是把所有数据放在一起,加以对比,进行细致筛选后选取了所需的数据.
总之,通过对京津冀统计年鉴历史系列数据的可视化的研究,揭示出京津冀地区近几年各方面的发展现状,为相关部门提供宏观调控和相关决策的依据.