公安地名地址数据库建设初探

2014-06-19 03:10
江苏警官学院学报 2014年4期
关键词:警务名称编码

陆 娟 石 丽

一、概述

地名地址,无论是对于政府管理,还是行业应用以及人们日常生活,均有着极其重要的意义。地名地址的规范性和可理解性,将直接影响其使用的效率和作用。我国政府各级部门历来都非常重视地名地址管理工作,相关机构先后制定了地名地址的系列规范、标准及管理条例等,在一定历史时期对地名地址的规范化及信息化起到促进作用。但是,由于历史沿革和区域差别,目前各地对地名地址的管理方式、数据规范仍然存在较大差异,甚至在不同行业之间、不同地区之间对地名地址概念内涵的理解也存在不同认识,造成我国在信息化水平及信息共享程度越来越高的今天,对地名地址数据的共享与交换仍然存在较大的困惑。

对警务工作而言,地名地址无疑是极其重要的要素之一。在公安信息化进程中,警务信息一般归纳为“五要素”,即“人、地、物、事、组织”,事实上,除了“地”本身外,其他四类警务要素无不与“地”密切相关。各级公安机关也意识到地名地址在公安信息化建设应用中的地位和巨大意义,开始在警务综合平台、打防控系统等综合性警务工作系统中着手建立地名地址库及相关业务应用。自PGIS 平台在全国公安机关强力推进以来,使得以“地”为核心的各类警务信息关联应用需求更加迫切。但是,与其他行业相似,公安机关现有警务信息系统中的“地”要素也存在诸多问题,如概念理解不统一、录入不规范、维护不及时等,使得不同的警务业务系统之间、不同地区之间对地名地址的关联共享显得尤为困难,各类警务信息在依赖PGIS 空间化过程中,更加意识到建设统一、规范的地名地址库对警务工作的重要性和迫切性。①陆娟、蒋平、吴伟:《PGIS 支持下的警务信息地图位置采集方式探讨》,《地理信息世界》,2011年第6期。

二、相关概念及主要内容

(一)基本概念

根据新华字典、辞海等典籍解释,“地名”一词的含义为“地方(如城市或城镇)的名称”;“地址”一词的含义之一为“找到某人或某机关或与其通信的指定地点”。从词典解释来看,“地名”一词似乎更偏向于一个区域范围,而“地址”一词则倾向于一个详细位置。实际上,“地方的名称”自然也包括“某一指定地点的名称”,也就是说,“地址”应该是“地名”的一个子集。根据我国《地名标志》②《中华人民共和国国家标准GB 17733-2008 地名标志》,中国标准出版社2008年版。、《数字城市地理信息公共平台地名/地址编码规则》③《中华人民共和国国家标准GB/T 23705-2009 数字城市地理信息公共平台地名/地址编码规则》,中国标准出版社2009年版。等国家标准,以及相关行业标准和我国一些省、市地方的地名管理办法,“地名”是指“表征地理实体的专有名称”,“地址”的含义为“具有地名的某一特定空间位置上自然或人文地理实体位置的结构化描述”,从这个层面上则可以看出,“地名”包含了“地址”含义,“地址”是对某一特定位置“地名”的“结构化”描述,即“地址”强调其结构性。事实上,当前我国许多城市的地名办,也同时负责对“地址”的编制与管理工作。在我们日常应中,“地名”则偏向于指某个地方的名称,如城市名称、街巷名称、山名、河流名称等,一般具有历史、文化内涵和浓郁的人文气息;而“地址”倾向指那种附着于建筑物、院落或独立门户标示编号的文字描述,也称为“门楼牌址”,一般不具特定含义。为了不引起对两者理解的歧义,当前一般用“地名地址”来统一表达传统意义上的“地名”和“地址”的含义。

从是否符合特定地址标准的角度分析,一般将那些符合标准命名规则、包含特定层次关系的地址称为“标准地址”,而将那些不符合特定层次关系和标准结构的地址称为“非标准地址”。另外,在实际应用过程中,还可以通过“兴趣点”来实现对地名地址的描述。“兴趣点”是指那些具有一定知名度的建筑物、机构、场所、区域等名称。一般而言,“兴趣点”应该容易被公众所熟知,具有相对地理位置不变性,能够起到定位作用。在当前公安信息化系统中,人员地址、机构地址等可以纳入“标准地址”范畴,接处警地址、案发地址等被认为“非标准地址”,而机构、场所以及桥梁、码头、公交站台等名称被认为“兴趣点”。

(二)主要内容

根据上述对地名地址的理解,结合目前公安对警务信息管理流程和实际业务工作需求,地名地址库主要有以下几个部分组成:

(1)标准地址表,存放符合特定规则的结构化地址,一般包含地址标识、地址名称、地址生命周期、地址元素、地址类型等信息。

(2)机构表,存放各类机构、场所信息。主要包括机构代码、机构名称、标准地址标识以及其他机构本身属性信息。这里的“机构名称”具有地名地址中“兴趣点”的意义,同样可以起到定位目的。

(3)兴趣点,这里主要是指机构、场所、行政区划以外的特定标志性建筑物信息,如桥梁、码头、公交站台、广场等。具体包括标识码、兴趣点名称等信息,并以一定的行政区划概念进行限定。

(4)地名地址索引表,存放各类地名地址的索引,以满足公安机关对地名地址的引用、搜索等需求。

(5)字典表,存放特定信息的字典代码和名称,如行政区划代码及名称、街路巷代码及名称等,用以规范地名地址相关要素的录入和引用。

除了地名地址索引表、字典表外,其余地名地址信息表中,除了自身文字描述信息外,在建立空间地名地址库时,还需根据实际需求,存放其空间定位信息。

三、地名地址数据库设计

(一)总体设计

标准地址表,存储那些按照一定规则进行结构化表述的规范地址。它是其他业务系统对“地址”要素的最主要和核心的引用和参考依据,在警务工作中起到非常重要的基础性信息资源作用。标准地址表只记录最后一次更新后的标准地址状态,其历史变更情况可以通过“标准地址历史表”来记录并追踪。

在当前警务信息管理应用中,一方面由于“机构”以及“公交站台”、“路灯杆”、“桥梁隧道”等都有其自身特定的管理要求和应用场景,一般均作为独立的业务信息进行采集管理,而另一方面,由于在日常生活和应用中,除了可以通过标准地址来代指和定位某个特定地方外,也可以通过机构、公交站台、桥梁等名称来对某地进行描述与定位。因此,地名地址库中也应该包含“机构表”和“兴趣点表”,当然,这里的“兴趣点表”应该是根据警务工作管理实际而形成的若干类具体的相关信息表,如公交站台表、桥梁隧道表等。另外,对“机构”而言,它与标准地址之间有其特定的关联关系,一个机构的注册地址、实际办公地址等一般均可以通过引用某条标准地址来表述。

“地址图层”是指一系列的空间图层信息,如根据标准地址类型,可以分为标准地址的点图层信息、线图层信息及面图层信息,另外也包括了若干类兴趣点的图层信息、机构的图层信息等。

“其他空间定位资源”主要是指从社会上获取的一些空间信息资源以及警务工作中一些空间信息,如固定电话、警务分区等信息。这些信息与“标准地址”、“机构”以及“兴趣点”等共同构建总的“地名地址索引”,以供所有警务信息进行地址引用、匹配及位置定位使用。在地名地址索引中,标准地址优于其他一切地名地址,机构、兴趣点名称优于其他空间定位资源。地名地址的数据库模型总体设计如图1所示。

(2.标准地址表的描述

在标准地址表中,地址标识是表征、引用某条地址的特定编码,一般用流水号表示,它不具任何含义,作为地址的主键,用以实现标准地址与其他信息的关联;地址编码是基于地址元素、空间坐标等信息并根据一定规则形成的编码,具有明确含义,系统能够根据地址编码而直接译出地址名称、位置等信息。地址状态表示地址的产生、注销、停用、启用、变更、消亡等一整套过程。地址更新日期仅记录该地址最后一次更新的日期,其余维护情况可以通过标准地址历史表进行记载。标准地址类型应该分为行政区划类地址、街路巷地址、小区地址、门楼址地址以及户地址等。根据标准地址类型,其空间特征可以通过面状、线状及点状等空间对象进行描述。

地址元素是构成标准地址的最小语义单元,标准地址正是通过相关地址元素分段组合方式进行描述,按照巴科斯范式(BNF 范式)定义如下:

标准地址::=<行政区域>[基本区域][局部位置],其中:

行政区域::=<省级>[地级]<县级>[乡级][村级]

基本区域::=[开发区、工业园区]<{[街路巷]|[自然村、组、队]|[小区]|}>

局部位置::=[门址][楼址][单元][室]

行政区域包括了省、市、县、乡、村五级,实际使用中可能仅用到其中的几级。在基本区域中,开发区及工业园区是相关政府部门为了行政、经济及其他目的管理需要,设置的一种特定区划,它不同于行政区划。基本区域的所有元素,均可以嵌套使用,如××路××巷、××小区东一区等形式。门址是相对封闭空间的一个编号牌,代表了一个小区、建筑物或户址。当小区有名称时,其门牌就是一种冗余;小区没有名称时,则需通过其所挂门牌来定位,小区可以嵌套。楼址是建筑物的一种代表,当建筑物有名称时,可以用其名称或楼牌号表示,如果建筑物没有名称,则只能通过其楼牌号定位,楼址不可嵌套。需要说明的是,在实际应用标准地址时,原则上门址、楼址优于小区、建筑物名称。

(三)标准地址名称及编码组成

在实际采集标准地址名称时,应遵循特定的层级关系。为了尽可能避免人工录入带来的错误信息,针对比较明确、相对固定的一些信息,应该事先制作相应的字典表,如行政区划、街路巷、小区等字典信息,并按照一定规则进行编码,供用户在录入一条完整的地址信息时选择使用。一般而言,对标准地址中行政区域和基本区域元素,均可以制作字典。局部位置是对门、楼、单元、户信息的描述,一般由数字及对应量词组成,如100号、1幢、1单元、101室等,这里的“号”、“幢”、“单元”及”室”即是局部位置的“量词”。在采集标准地址时,应该根据本地区对地址的描述规则,制作这些量词的字典表,如针对楼址,其量词可能包括了“幢”、“栋”、“楼”等信息。

根据标准地址名称的描述及实际采集管理需要,一个完整的标准地址可以由表1所示的相关要素组成。当然,对某一条具体的地址来说,可能仅包含其中的一部分要素。

(表1 标准地址的地址要素组成)

其中,行政区划按照省、市、县、乡、村五级进行存储,除了省、市、县应该按照国家行政区划编码统一存储外,对乡、村可以按照一定规则自行编码。同样,对开发区、街路巷、小区以及各类量词都需要按照某种规则进行唯一编码,一般使用纯数字型编码方式。实质上,编码过程即是制作字典供用户选择的过程。由于门址、楼址等号码本身为数字型,因此,在实际存储某一标准地址名称时,其相关组成要素可以全部以对应的编码表示。基于此,可以设计出该标注地址名称的地址编码(不含空间信息)如下:

标准地址编码=行政区划代码+开发区代码+街路巷编码+……+室号号码+室号量词编码

对于具体的某条标准地址而言,大多数情况下只包含了表1所示要素中一部分,那么在形成该地址编码时,缺少的部分可以用一定位数的“0”代替,这里的一定位数与其对应地址要素的编码位数相同,即可保证地址编码的唯一性和长度确定性。

(四)标准地址表的一些约束规则设计

为了尽可能保证标准地址采集时的准确性,可以指定一系列约束规则,实现标准地址录入时的校核,主要包括以下几个方面。

(1)地址要素是否符合最基本的完整性要求。对城市地名地址而言,如果具备了基本区域、局部位置中任何要素,那么省、市、县(区)等行政区划要素为必要要素;楼址、户址类地址,至少必须包含街路巷、小区或门址要素中一类;门楼址、单元、户址必须包含对应的量词,同样,其量词前也必须包含对门、楼、单元、户信息的描述信息;对那些具有分支要素信息,如门址号,不能仅含有门址分支或门址副号信息,而不含门址信息。

(2)地址要素的选择是否满足唯一性要求。录入门、楼、单元、户信息信息后,选择对应的量词时,要保证其一致性,如对同一门址信息,不能既包括××号,又包含××号楼,对同一楼址,标准地址库中不能既含有××幢,同时又含有××栋信息等;由于门、楼等要素的量词可能相同,因此标准地址库中,在其他地址要素一致的情形下,不能包含“门址”与“楼址”等完全一致的地址。

(3)保证同一空间实体位置、不同地址表述的对应性。在公安实际工作中,由于不同的信息应用系统及日常对某一地址的描述,可能会存在同一位置而地址描述不同的情形,如某一位置,可以用“行政区划+街路巷+门牌号”的方式描述,也可以用“行政区划+街路巷+小区名称”等表述,对同一建筑物,也存在“行政区划+街路巷+门牌号”及“行政区划+街路巷+建筑物名称”等不同描述,这些描述均符合标准地址结构,为了保证标准地址的一致性,需要通过技术手段,建立上述标准地址之间的对应关系,确保这些不同的标准地址描述实质对应同一空间实体,并避免不同信息应用系统、对外证件发放与登记等方面对标准地址使用方面的歧义。

四、结语

地名地址数据库建设,是公安信息化建设中基础工作之一,也是政府“数字城市”公共地理框架数据建设中的重要组成部分,在提供数据空间匹配、共享交换、查询定位等多方面发挥重要作用。本文对地名地址数据库包含的主要内容、数据库建设技术路线特别是标准地址数据库的建设进行了初步研究,以期引起更多专家学者对此领域的关注。同时,我们也认为,地名地址建设内容十分广泛,不同地区、不同行业对地名地址的理解、管理及应用也有较大差别,因此,包括数据库建设在内的各类地名地址建设研究,其任务依然任重道远。

猜你喜欢
警务名称编码
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
沪港通一周成交概况
沪港通一周成交概况
沪港通一周成交概况
沪港通一周成交概况
HIV感染的警务预防与处置
警务训练中腹痛的成因及预防