兀 伟,邓国庆,黄 琛,王焕萍
(1.国家测绘地理信息局测绘标准化研究所,陕西 西安 710054)
当前,我国正在实施“互联网+”行动计划和国家大数据战略,而地理空间信息是其重要的时空参照,没有标准化的地理空间和时间序列数据支撑,大数据则无法充分发挥其作用。随着信息技术与地理信息技术融合的不断加强,特别是全球卫星导航定位服务的广泛应用,使得一些新的地理信息服务业态不断涌现,如滴滴打车、神州专车、共享单车和网上交友等。这些服务的便利性和优越性得到人们的广泛认可,并被迅速推广和发展,成为信息时代的热点。定位、寻址和位置服务技术的普及,使得人们对地理空间位置信息的关注度越来越高。地名地址是基础性地理信息,是地理位置的一种文字描述方式,可作为大数据时代地理位置的标识;同时,它蕴涵在各种大数据信息中,是多源大数据信息的泛在属性,不仅具有定位功能,而且可描述各类信息,是各类信息资源沟通的“桥梁”,以及多源信息整合、交换与共享的基础。因此,地名地址在推进社会信息化进程,提高社会管理和公共服务水平方面发挥着不可或缺的作用。近年来,许多发达国家为实现地名地址数据集成、管理和服务,建立了统一的地名地址数据库与服务系统。
在日常生活中,如果地名地址仅用文字描述,不与空间地理坐标相关联,往往不能很好地发挥空间参照作用,既影响其在定位、寻址和基于位置服务中的应用,又影响其沟通各类信息资源“桥梁”作用的发挥。因此,为文字描述的地名地址增加地理空间位置坐标是更好地发挥其空间参照作用的关键,能更好地发挥其在信息集成、融合,定位,位置服务等社会化应用中的作用。本文根据国外地名地址系统建设与标准化现状,探讨了地名地址系统需解决的问题和对标准化的需求。
为实现地名地址信息集成、融合,解决社会化服务需要,国外许多国家制定了统一标准,建立了地名地址文件或数据库,以公共平台的方式提供应用服务,实现了数据的空间化、统一化和规范化。
1)澳大利亚地址系统建设与标准化。澳大利亚公共制图机构(PSMA)为了统一地址实体的地理空间位置描述,并与空间数据进行融合,在AS/NZS 4819:2011《地理信息城乡地址标准》的指导下建立了国家地址地理编码文件(G-NAF)。AS/NZS 4819:2011《地理信息城乡地址标准》是为满足构建统一城市和乡村寻址系统需求而制定的,规定了地名地址实体确定、街道和地理位置地址命名、地名地址相关信息记录与制图以及地名地址标识方法等方面的内容,满足了地址地理空间位置规范化描述的需要[1]。
G-NAF文件提供了澳大利亚全国区域、街道和宗地3个等级的地址。为了避免重复或同址异名问题,PSMA将全国各地提供的3 000万条地址信息整理合并为1 350万余条作为G-NAF地址,并将同一地址的其他名称确定为别名,以属性的方式存储[2]。
2)英国地名地址数据集建设与服务。英国地形测量局(OS)为实现全国范围定位、寻址和位置服务,建成了由地址数据层和地址数据二层构成的地址数据集,并作为地理空间框架数据库的4个数据层之一。OS制定了面向地址数据的系列技术规范,规定了地址数据模型、属性内容、生命周期、输出格式和服务等。
OS地址数据层包含约2 900万条地址实体数据,分别为:住宅和商业点的皇家邮政地址(PAF)实体数据约2 700万条;教堂、会堂、停车场和公共设施等的非邮政地址实体数据约150万条;多用途住宅或建筑物地址实体数据约20万条[3]。这些地址实体可能有OS大比例尺地图所采集的房屋或建筑物与之对应,也可能没有地理实体与之对应。
3)美国地名地址数据库建设与标准化。美国联邦地理数据委员会(FGDC)制定了美国街道、地标和邮政地址数据标准(FGDC-STD-016-2011)。该标准由格式、各种状态的地名地址数据组成,为推进全国范围基本地名地址数据库建设而制定。FGDC-STD-016-2011标准提供了街道、地标、邮政投递地址和地址参考系统等地名地址数据的定义、数据分类、数据质量和数据交换[4]。在地理编码方面,FGDC-STD-016-2011标准规定了基于平面直角坐标、经纬度坐标、美国国家格网(USNG)和高程坐标的地名地址地理位置编码规则。
美国人口调查局为了便于地名地址地理实体空间位置定位和人口调查员调查,进而实现人口普查相关数据与地理实体和空间位置的关联,建立了拓扑集成地理编码和参照数据库(TIGER)。TIGER对美国范围内的街道、河流、铁路、住宅单元等地址实体的地理空间位置以及这些地址实体间的关系进行有组织、精确的描述[5]。
由国外地名地址系统建设与标准化现状可知,制定统一标准,规范地名地址信息,既是地名地址数据采集和规范化处理,建立统一数据库与服务系统的基础;也是实现地名地址数据与地理空间坐标、空间数据中对应地理实体相关联,满足社会化应用服务要求的前提和保障。地名地址数据库与服务系统建设需要解决地名地址定义、对象分类、数据模型和地理空间位置描述等标准化问题。
地名地址数据库与服务系统首先需界定其概念、明确对象范围,以实现统一认识。国外标准中对地址概念进行了明确定义和说明:
G-NAF文件对地址的定义为“描述、标注或确定一个实际或虚拟的空间参考位置点”[2]。OS地址数据层对地址的定义为“定义一个有一定使用期、所有权或功能,且有一定占地面积、从属关系和固定位置的现实世界对象,其位置用代码点(CPLC)或多个兴趣点描述”[3]。FGDC-STD-016-2011标准对地址的定义为“指定一个特定大街或地标的参考位置或指定一个邮政投递点的位置”[4]。
由此可见,国外地名地址数据库与服务系统面向地址。地名与地址是两个有区别且联系密切的概念,均具有社会化特征。地址是对人们生产、生活和各类活动场所空间位置的结构化描述和指称,是描述地理空间位置最常用的一种方式;其所描述对象往往是具体位置点,在实地可能有也可能没有地理实体与之对应。地名是人们区别指位性和社会性地理实体的语言描述,所描述对象具有一定占地面积和固定位置;在现实世界有地理实体与之对应,是地址准确描述的重要组成部分。
国外地名地址数据文件均面向其要素建立了统一的分类体系,其要素分类细化到具体门牌地址;但由于现实状况、数据来源、处理方式、认识差异和应用服务需求等原因,国外地名地址要素分类有所不同。国外具有代表性的地名地址要素分类见表1。
表1 国外具有代表性的地名地址内容分类
地名地址是经过多年发展演变而形成的,各地方各部门因应用目的不同,描述地名地址信息的方式、结构和状态也千差万别,因此如果没有统一的数据模型,既不利于地名地址信息的完整性、通用性和易读性,又很难对信息进行整合集成。国外地名地址数据库多基于统一的数据模型构建,具体情况为:G-NAF文件基于XML建立了有组织的数据模型,内容包括地址分类、地理空间位置描述、所属各级地名与相关文字描述、各类代码标识。OS地址数据层也构建了统一的数据模型,确定了地址内容分类、相关标识、名称属性完整描述、地理空间位置描述等内容。FGDC-STD-016-2011构建了由地名地址数据元素内容、数据属性内容、坐标参考系统、数据类型与相应语法规则、XML模式描述等信息构成的数据模型。
数据模型是对人们生产、生活场所(即地名地址)地理空间位置的结构化描述,有利于信息的无歧义标识和定位。
地名地址与地理空间位置匹配,并与地理信息数据对应实体相结合,是地名地址空间化,满足定位和位置服务需求的关键。地名地址地理空间位置描述基于空间参照系和地理编码实现。空间参照系提供位置基础,地理编码将地名地址与地球表面位置以及对应地理实体相结合,实现地名地址信息空间化定位和实体化。为规范地名地址地理空间位置描述,国外地名地址数据库多基于空间参照系,构建了地名地址的地理编码规则,具体情况为:
1)G-NAF文件基于GDA94空间参照系和经纬度坐标对地址进行地理编码,实现对数据文件中地址地理空间坐标的统一描述。G-NAF地理编码由地址点实体和地理空间坐标组成,地址点实体地理编码的基础位置是“质心”,即一个有边界地理实体多边形的几何中心。考虑到不同使用者对同一地址所关注位置点可能不同,地理编码也可选择具体兴趣点,地理编码位置见图1[2]。
图1 G-NAF地理编码位置
2)OS地址数据层基于英国国家格网(BNG)或经纬网参照系进行地理编码。它以地址对象的几何中心或兴趣点为地理编码位置,其中兴趣点包括一般内部点、西南角100 m BNG点、所在街道起点、邮政单元通用位置点和行政管理区域中心。OS地址通过地理编码与地球表面上地理位置对应,实现地址位置的显示,并与地图上的房屋或构筑物等地理实体对应。
3)TIGER数据库基于轴线、非轴线性和区域系统等间接空间参照进行地理编码。其地理编码分为定位到街道和区域两种,其中定位到街道是将住宅单元按门牌位置以点位的形式在街道上定位;定位到区域是将行政区域、邮政区域或街道辖区地址与空间数据库中对应地理实体进行匹配,再定位到地理实体中心按地址点进行地理编码。由于现实生活中地址数据来源复杂,因此在大多数情况下,TIGER数据库多采用定位到街道和定位到区域混合的方式实现定位,地理编码示例见图2[5]。综上所述,地名地址应满足结构化、唯一的地理标识和确定位置信息的要求,以实现位置信息描述的稳定,便于读取和易于理解。
图2 TIGER地理编码示例
地名地址信息为政府规划、管理和应急响应提供服务,并为社会经济信息的管理、调查、统计、分析和可视化表达提供支撑,也是导航、路线设计、位置服务、市场分析等商业活动的关键数据。地名地址标准化不但提高了政府的管理水平和效率,而且为社会公众服务提供了便利,对于现代服务业和公共文化服务体系的发展具有重要支撑作用。从地名地址应用服务需求来看,其标准化应解决以下问题:
1)明确地名与地址的定义,实现对其概念的统一界定和认识;
2)统一规定地名地址分级、分类,形成完整的分类系统(系统类别),便于地址数据管理和使用;
3)规定地名地址数据的构成元素、属性以及数据库和文件中需储存的内容;
4)确定地名地址位置描述所需的定位参照系、地理位置坐标、地理编码等,实现其空间化;
5)实现地名地址与街道、建筑物等地理实体的对应,使地名地址实体化,而不是仅加载在地理空间坐标上,以利于数据层的建立和兼容共享;
6)规定统一的地名地址数据模型和XML描述架构,实现民政、住建、公安、测绘、邮政等部门数据的互联互通,为数据采集、管理、交换共享,进而汇聚成大数据提供依据;
7)规定地名地址数据质量内容、测试方法(错误提取和缺陷识别)和程序;
8)在“互联网+”、大数据时代,实现地名地址与多源大数据的结合,推动信息服务的规范化。
地名地址是政府部门和公众使用最广泛的位置描述方式,已应用于人们生产、生活的各个领域,其描述方式包括文字、地理标识符、数字等。对于特定地理实体或地域位置的描述始终受社会各方面的制约,
并随着人类文明和社会经济的发展而不断演变。如果地名地址描述不规范,就不能形成互联互通、交换共享的数据,因此地名地址建设需要标准先行。本文基于对国外地名地址系统建设与标准化的分析提出了急需标准化的对象,但地名地址存在描述多样、构成复杂和应用广泛等特点,其标准化建设是一项基础性工作,还需做好顶层设计,构建标准体系,以便为系统进行标准化工作提供依据。