亢大麟,张 君
(西安财经学院a.统计学院;b.管理学院,陕西 西安 710100)
基于网格GIS的旅游统计数据可视化研究
亢大麟a,张 君b
(西安财经学院a.统计学院;b.管理学院,陕西 西安 710100)
针对统计数据可视化这一热点研究问题,以旅游统计数据为研究对象,选择2010年陕西省入境游客接待人数数据,在网格GIS技术的支持下,首次提出基于加权求和综合得分的分割法,即借助旅游资源普查数据的旅游统计数据可视化研究方法,实现了陕西省入境游客人数的空间可视化表达。与传统可视化方法及效果相比,此方法具有思路清晰、科学性更强等特点,更能有效表达入境游客接待人数在区域内的分布差异,这为旅游学及相关学科的研究提供了很好的数据基础和研究思路。
统计数据;可视化;旅游;网格;地理信息系统
社会经济统计数据作为一个国家或地区可持续发展中最基本、最重要的信息资源,是国家或地区进行国民经济宏观调控的决策依据,是社会公众了解国情国力和社会经济发展情况的主要信息来源,在生产生活、科学研究中起着无法替代的作用。统计数据的可视化展示既是让普通大众形象地了解统计数据含义的途径,也是在宏观管理上形象地把握多种统计数据之间相互关系的重要方法。而利用地理信息技术,把统计数据的可视化展示与GIS技术相结合,则是统计数据可视化研究的新领域。这一领域近年来的研究(包括相关软件的开发)主要集中在如何采用地理信息技术将多种不同类型的统计数据形象、动态、集中地展现在与该数据对应的不同级别的行政区域上,从而更直观地为管理和决策提供参考[1-2]。
然而,中国的统计指标空间体系是以行政区域划分的,从宏观到微观依次划分为国家级、省(直辖市、自治区)级、市(地区)级和区(县)级,区(县)级以下(即乡镇、街道、村、经济活动单位),而且,上一级空间区域的统计指标是其所属的下一级空间区域内相应指标的汇总或综合,即是更细一级的行政单元上相应的经济社会活动数量特征的汇总或综合。这种按行政区域划分的指标体系存在两个明显的问题:首先,由于中国行政区划经常会有局部调整或重新划分,如重庆市1949—1954年为西南大区代管的中央直辖市,1954—1997年降为四川省辖市,1997年3月,又将原四川省的重庆市、万县市、涪陵市、黔江地区合并为重庆直辖市。这种调整必将导致统计数据在空间分布上面临重新分配,致使相关统计指标在时间序列上的可比性大大降低;其次,无论各行政区域内部还是行政区域之间,每一个单元内的各类经济社会活动的指标数值的实际分布都是非均匀的,上一级行政单元的相关统计指标对下一级行政单元的综合掩盖了下一级空间单元统计指标之间的差异,而这一差异正是我们发现和研究经济社会发展在区域间和区域内部空间上分布特征的重要参数。显然,这种掩盖不利于观察和研究社会经济活动在空间上的实际分布特征,在一定程度上影响了统计数据的作用。因此,针对上述统计数据的空间特征及存在的问题进行探索性研究,就显得尤为必要和迫切了。
本文主要探讨采用网格GIS技术对现有统计数据在空间上的细化并展示的方法,并以2010年陕西省入境游客人数为例进行实证性验证。
对于网格技术,学术界主要有两种观点,一种是指将统计数据空间可视化的计算机技术,另一种是指借助计算机网络来实现资源分级共享的技术[3-4]。本研究基于第一种观点,主要思想如下:将统计年鉴中按行政单元提供的各类统计数据,分别按其在行政单元内匀质性将其在地图上表达出来,若视为均匀,则直接将该类数据赋值为行政单元的属性后图形化表达,若视为不匀质,即该类数据在行政单元空间上分布不均匀,则按一定的规则或要求,将行政单元进行细分为更小的单元,即网格,然后综合权衡该类数据空间分布特征,将该类数据分配到各网格里,置于格子中心位置,代表该格子的数值所进行的处理,即为网格化数据,从而为后续的多领域研究提供数据基础。当前,这一技术在地理学、统计学、管理学等领域广为应用,如城市网格化管理。
统计数据在空间上的可视化包括细化和融合两个方面。细化是指按照研究需要,将统计数据按照某种划分方法进行更为细致的分配,从而得到较小尺度下的同种统计数据,以反映不同空间统计单元内部的细微差异,属于微观研究;融合是指按照研究需要,将统计数据分区域合并为较大尺度下的同种统计数据,或将细化后的统计数据重新归并,以反映较大范围下或区域重新划分后的统计数据差异,属于宏观研究。融合相对细化而言,在技术实现上要简单得多。
细化的核心是将一个较大空间区域的统计指标值(统计数据)按照一定的规则在空间尺度上进一步缩小,分解成更小空间区域的统计指标值(统计数据),用于揭示统计数据在特定区域中的内部差异。因此,如何使统计数据在统计单元中细化并使细化后的数据更贴近实际,是该技术研究的重点和难点内容,已有专家学者分别从基于面积比例分割法、借助土地利用数据分割法,借助遥感数据分割法等进行了探索和尝试[5-7]。我们的思路是在对区域进行网格化处理的基础上,采用相关指标空间加权比例分配法将区域统计指标细分为每个网格的统计数据,从而实现区域统计数据的细化。
旅游统计数据作为统计数据的一种,反映统计区域内某一时段旅游业的发展状况,其中入境游客接待人数是反映区域内旅游资源(包括旅游景点、宾馆、酒店等)对境外游客吸引力和容纳量大小的一个重要标志,能说明该区域内旅游资源在境外的影响力,这一类数据对于该区域旅游业的发展、定位及旅游资源的开发都具有重要意义。
入境游客包括过夜游客和一日游游客,指报告期内来中国(大陆)观光、度假、探亲访友、就医疗养、购物、参与会议或从事经济、文化、体育、宗教活动的外国人、港澳同胞等游客(即入境旅游人数),统计时,入境游客按每入境一次统计1人次。当前,对入境游客接待人数这一类统计数据的应用更多地局限在不同区域该类数字的大小对比,很少有人对其空间可视化后从空间差异方面来分析研究,并且,统计数据可视化研究的对象也主要集中在人口和GDP这两大数据[5]。因此,本研究基于网格GIS技术,对入境游客接待人数进行了可视化表达,有助于数据的进一步分析利用,实现数据挖掘。
本研究针对旅游统计数据,以入境游客接待人数为例,提出依据旅游资源等级高低对各旅游资源进行赋权,并以该权重比例在标准网格间分配游客接待人数的综合权重比例分配法。第一步,通过专项调查建立某一行政区域的旅游资源数据库。旅游资源是指自然界和人类社会凡能对旅游者产生吸引力,可以为旅游业开发利用,并可产生经济效益、社会效益和环境效益的各种事物和因素的总和。在掌握这些旅游资源的空间位置分布特征的同时对各旅游资源以国家标准《旅游资源分类、调查与评价》(GB/T18972-2003)为依据进行分级并按级别高低进行赋权;第二步,按照可视化的要求,借助GIS软件生成该行政区域的规则网格并将旅游资源点分布与该网格进行叠加形成旅游资源网格分布图,同时对各网格内旅游资源的权值求和,得到各网格内旅游资源的综合得分;第三步,计算这一得分与该行政区域内所有网格旅游资源综合得分之和的比例;第四步,按此比例将该行政区域旅游接待游客人数逐一分配在每个网格内,最终获得各网格内接待的游客人数、旅游收入等相关指标值。具体的技术路线见图1。
对统计数据进行基于网格GIS技术的可视化,实质上是空间尺度缩小后对原空间尺度上统计数据的一种重分配,即对统计单元内部进行细化,从而将统计单元划分为更为细致的单元,然后再按照统计数据与某一种或多种具有空间分布特征的要素之间存在的相关关系,通过一定的数学模型,将统计数据重新分配到该统计单元的各个细致单元内。本研究采用与入境游客接待人数有较高相关关系的旅游资源单体空间分布和等级数据(分别以地图形式存储和以属性表形式存储),采用如下模型,实现入境游客接待人数的空间细化和可视化展示:
图1 技术路线图
本式将旅游资源单体等级换算,实现对各旅游资源单体赋权值,f(c)为旅游资源单体的权值,c为旅游资源单体等级;在GIS软件的支持下,生成10Km×10Km大小的网格图层并覆盖整个研究区域,再通过空间叠加分析等操作实现网格图层与旅游资源单体图层以及行政要素图层的叠加。
计算各网格内旅游人数,采用如下模型:
本研究的可视化对象数据为2010年陕西省各地级市(包括杨凌区)入境游客接待人数,来源于统计年鉴,其中西安市1 117 308人次,咸阳市266 127人次,渭南市193 436人次,宝鸡市212 556人次,汉中市43 581人次,铜川市26 024人次,延安市110 961人次,安康市21 283人次,商洛市25 748人次,榆林市19 646人次,杨陵区85 051人次。用于可视化研究的基础数据,来源于自2003年8月开始历时2年多的陕西旅游资源普查工作数据,包括旅游资源的空间位置数据和等级数据。截至2005年9月,陕西省旅游资源有9 972个,按等级可分为六级,5级154个,4级409个,3级1 165个,2级1 378个,1级2 373个,未获级4 493个[8]。
按照上述研究思路,运用拟定的研究方法,在ArcGIS地理信息系统平台软件的支持下即可实现基于网格GIS的陕西省入境游客接待人数可视化,结果见图2。具体实现过程均在ArcGIS软件中进行,大致分为以下五大步骤:
图2 基于网格GIS的可视化结果
1.使用弧段工具箱(Arc Toolbox)中的生成格网工具(Create Fishnet),输入相应参数后即可获得一个覆盖陕西省的格网,再使用裁剪工具(Clip),用陕西省行政范围空间数据对刚生成的格网进行裁剪,得到符合研究需要的基本格网数据。
2.在Arc GIS软件的Arc Map环境中,采用模型(1)对旅游资源单体空间数据的属性表进行编辑,将旅游资源等级换算成得权值,并通过属性表的追加、编辑等方式对陕西省市域空间数据的属性表内容进行扩充,使其包含各地市的入境游客接待人数。
3.使用弧段工具箱(Arc Toolbox)中的相交运算工具(Intersect),对第一步生成的格网、第二步编辑后的旅游资源单体空间数据和陕西省市域空间数据这三个数据图层实现叠加分析运算,得到属性表内容扩充后的旅游资源单体空间数据,其属性表中包含各旅游资源单体的权值、所处网格编号、所处地市及地市入境游客接待人数等信息。
4.再在ArcGIS软件的Arc Map环境中,对第三步新生成的数据图层属性表分别按所处网格编号字段和所处地市进行统计,分别得到各网格里旅游资源单体权值之和、各地市内旅游资源单体权值之和,然后利用模型(2)及基于网格编号字段的属性表追加,即可计算得到陕西省内每个网格里的旅游接待人数。
5.仍在ArcGIS软件的Arc Map环境中,将第四步计算结果追加到第一步生成的格网数据属性表中,然后在数据视图(Data Viewer)中显示,并可在制图环境(Layout Viewer)制作分级专题图,即可得到可视化结果。
为了便于直观说明基于网格GIS方法的特点,特运用传统可视化方法将陕西省各地市入境游客接待人数进行了数据可视化,结果见图3。此处提到的传统可视化方法,是指以统计口径一致的行政区域(本研究中特指地级市)为可视化最小单元,将其各自对应的入境游客接待人数通过属性表追加、连接形式与图形数据关联,最终以专题图形式展示。由于此法非本研究的重点,并且也常见,在此不再赘述。
对本研究采用的方法和图2、图3进行分析,可得出以下结论:首先,基于网格GIS的可视化方法虽比传统可视化方法在实现步骤上稍显复杂,涉及的数据也较多,但这一方法的思路清晰,科学性更强,能有效地缩小研究的空间尺度,在对旅游统计数据的空间表达效果上可以实现比传统可视化方法更细腻的可视化表达,这是传统方法所无法比拟的。通过基于网格GIS的可视化展示,可以清晰地观察到来陕的入境游客多数集中在关中地区各旅游景点参观、游玩,特别是以西安为核心的旅游人数密度明显高于其他地区。分析其原因,主要是因为陕西省级别较高从而权重较高的旅游资源如兵马俑、华清池、乾陵、法门寺等均集中在关中地区。这直观地反映了由于陕西省旅游资源分布的地区差异而导致的旅游业发展的地区差异。其次,采用同样的方法,也可以很方便地将其他相关旅游统计数据(如旅游外汇收入、游客旅游花费等)进行网格化细化展示。再次,当行政区域边界发生变化时,基于这一网格化的数据很容易对新的行政区域的历史数据进行重新整合,从而保证旅游统计数据在行政区域变动后的历史可比性。最后,以此形成的网格化分布地图,也为进行基于GIS的网格化旅游业相关发展状况抽样调查研究工作提供了重要的依据。
图3 基于传统方法的可视化结果
至于该可视化结果与可视化指标实际分布的一致性,需通过抽样调查来进行检验和评价,这将在后续的研究中进一步完善。
[1] 陈生,曾行吉,梁军.基于GIS的统计数据可视化研究[J].计算机工程与技术2008,29(14).
[2] 赵荣,董春.统计信息与空间信息按地理格网集成的方法研究[J].测绘科学,2007,32(4).
[3] 王振龙,朱文琦,亢大麟.网格技术与统计未来[J].统计研究,2005(11).
[4] 朱文琦.基于网格技术的统计调查前景展望[J].统计与决策,2006(10).
[5] 刘宇,李成名,刘德钦,马维军.空间信息网格研究进展[J].测绘科学2007,32(4).
[6] 肖科.网格GIS及其关键技术研究[J].中国新技术新产品,2009(15).
[7] 王喜,王大中,王萌.地理信息技术发展的新方向——网格GIS初探[J].测绘与空间地理信息,2006,29(4).
[8] 张君.基于GIS的陕西旅游资源群开发潜力研究[J].旅游学刊,2007,22(4).
Study on Tourism Statistics Visualization Based on the Grid GIS
KANG Da-lina,ZHANG Junb
(a.School of Statistics;b.School of Management,Xi'an University of Finance and Economics,Xi'an 710100,China)
According to statistics visualization as hot research issue,having tourism statistics as research object,this paper selected tourist traveler receptions toll of 2010 and firstly proposed the method of redistributing statistics based on composite scores of weighted summation by use of grid GIS,which is actually the research method of visualizing tourism statistics with census data of tourism resources.And the paper achieved spatial visualization about tourist traveler receptions toll in Shaanxi province.By contrast with the traditional method of visualization,the method of grid GIS have the some characteristics,such as clean thinking,scientific stronger.And the research results have more effect on distribution difference of the toll.All these will provide the research of tourism and the related subjects with good data foundation and study ideas.
statistics;visualization;tourism;grid;geographic information system
(责任编辑:张治国)
C815
A
1007-3116(2011)12-0070-05
2011-02-23;修复日期:2011-10-05
西安财经学院科研项目《基于网格GIS的陕西居民生活质量评价方法探讨》(09JD08)
亢大麟,男,山西临汾人,讲师,研究方向:经济统计分析,统计信息系统;
张 君,女,陕西西安人,硕士,讲师,研究方向:统计管理与信息系统。
【统计应用研究】