李飞
(山东省国土测绘院,山东 济南 250102)
地名地址数据[1-3]是政务信息与地理信息联系的载体,是人们工作、生活不可或缺的内容,是“智慧城市”框架数据建设的重要组成部分[4-5]。随着地理信息公共服务平台应用的日益广泛和深入,对平台各类数据,尤其是地名地址数据的现势性和准确性提出了越来越高的要求,同时为了节省财政资金,提高地名地址数据采集更新的效率,减少省市数据融合工作,使数据能够快速上图,对地名地址数据的作业模式也提出了新的挑战[6-8]。
目前,地名地址数据采集更新工作大多是将作业区进行简单的网格划分,作业人员利用纸质底图外业进行数据采集更新,然后内业进行数据汇总和数字化,这种方式存在采集效率低、实时性差、定位精度差、准确率低、资源浪费大等问题[9-11],同时也不利于数据上图发布。
因此,为了解决传统地名地址数据采集更新工作中存在的问题,提高数据采集更新的效率和准确度,该文提出了一种基于移动GIS技术的地名地址数据采集和更新方法,建立了地名地址数据采集更新的内外业一体化作业流程,利用“天地图·山东”地图服务、数据服务及二次开发API,设计并实现了地名地址数据采集系统。
系统采用B/S架构设计,分为数据层、中间层和应用层3层框架体系(图1)[12-14]。
(1)数据层主要负责数据的存储和管理,包括地名地址基础数据库、地名地址下发数据库、瓦片缓存库、文件库等。地名地址基础数据库即山东省已有的地名地址数据库,其由基础测绘、导航、国情、及时更新、市县大比例尺数据及其他合作部门(如民政、信用等)的多源数据融合而成。地名地址下发数据库即根据市县范围从地名地址基础据库中抽取的需要各市县采集更新的数据库。
(2)中间层提供了系统的开发框架及所必需的中间件,包括“天地图·山东”提供的地图服务、开发API,Android开发框架,.Net平台提供的asp框架和WebService服务,Oracle Spatial空间数据库引擎和SqlLite数据引擎等。
(3)应用层主要负责系统业务功能及界面的实现,包括手机或平板等移动终端的数据采集和Web端的业务管理功能。
图1 系统总体框架图
地名地址采集系统分为Web端地名地址数据管理子系统和移动端地名地址数据采集APP两部分(图2)。
图2 系统功能结构图
(1)Web端地名地址数据管理子系统主要包括项目管理、任务管理、内业核查、数据质检、统计分析和系统管理等功能模块。
项目管理模块包括创建项目、数据抽取建库、数据下载和数据更新。其中数据抽取建库是通过行政区划自动提取区划范围、手动在地图上绘制范围、导入shp数据范围等方式,利用空间分析服务从地名地址基础数据库抽取数据建立下发数据库。任务管理模块提供任务区网格划分、任务分配和任务编辑等功能。内业核查模块主要用于对外业上报数据进行数据组合查询、数据编辑及数据核查功能。数据质检模块主要是提交的任务数据进行质量检查,包括数据审核、数据批量退回、照片核验和外业核查等功能。统计分析模块包括进度统计、任务统计、数据预览、报表输出等功能。系统管理模块提供用户管理、权限管理、通知公告管理和日志管理等系统维护管理功能。
(2)移动端地名地址数据采集APP包括任务列表、数据采集、GIS功能和其他辅助功能模块。
任务列表模块包括任务查询、任务下载及任务更新功能。用户登录移动端APP后,如果网络处于连通状态,将从Web端服务器下载最新的任务列表信息,并将每个任务项与本地缓存的任务数据进行比对,如果本地没有缓存任务数据,任务项提示该任务需要下载,如果服务器任务的版本号大于本地任务缓存版本号,任务项将提示该任务数据有更新,需更新任务数据。
数据采集模块是移动端地名地址数据采集APP的核心模块,包括数据查询、数据采集与更新、拍摄照片、数据离线保存和数据上传等功能。数据查询有分类查询、组合查询、最小距离查询等多种查询方式,并可将查询结果进行汇总统计,统计出当前未核查、已核查、已上传、新增等状态下的地名地址数据量。数据采集与更新提供了地名地址数据的采集、更新和编辑,同时为了方便作业员进行野外作业,还提供了复制上一条道路记录、复制上一条位置记录、复制上一张地名照片记录、复制上一张地址照片记录等操作。
GIS功能模块提供了地图放大、缩小、平移、旋转、矢量影像地图切换、地名注记层开启/关闭等地图操作,GPS定位、跟随、导航等定位操作,地图矢量数据下载、更新,影像栅格瓦片的下载等功能。
其他辅助功能主要是为了方便作业员工作而设计的系统辅助功能,包括用户登录和记住密码,地图缓存、栅格瓦片、采集照片和任务数据等数据的清除,道路、字典等服务器数据和APP软件的版本检测,任务地图下载开启/关闭和GPS定位开启/关闭等系统设置功能。
地名地址采集更新工作主要涉及地理空间数据、地图数据、业务数据、文档图片数据以及临时离线缓存数据,为了有效存储和使用系统中的数据,系统采用Oracle11G数据库、Sqlite数据库和文件库等多库相结合的方式进行管理[15-17]。其中Oracle11G数据库主要用来存储空间数据、地名地址数据及业务数据,如项目表、项目任务表、地名地址数据表、道路表、字典表等,表1给出了Oracle11G存储的地名地址数据表结构。Sqlite数据库用来存储和管理移动端APP离线缓存的地名地址数据和瓦片索引数据,文件库用来存储和管理矢量地图数据、影像瓦片数据、拍摄的照片数据和其他文件资料数据等。
表1 地名地址数据结构
地名地址数据外业调查工作一般采用扫街式调查方式,即外业员沿着道路单侧逐个进行外业调查,如果下发任务数据中不存在该数据,则进行数据采集,已存在则进行数据更新及核查。考虑到作业员对任务区实地情况熟悉程度各异,以及作业规则与实地情况的切合度,多个作业员分别作业时会存在数据采集重复或没有采集等问题,如果对任务区进行正方形或矩形网格划分的话,也不利于已有数据的核查,尤其是小区内部楼栋、医院内部楼栋、学校内部楼栋和道路等信息。为了解决地名地址数据外业调查中存在的多作业员采集重复数据,因任务区划分而导致的数据采集困难、效率低下的问题,该文提出了一种基于道路的地名地址数据采集更新方法,主要包括:
(1)对所有道路进行唯一性编码,将所有需要更新的地名地址数据都绑定一条所属道路。
(2)以道路中心线为基准划分网格即任务区,利用裁剪、叠置分析等手段将道路及其所属的地名地址信息都划定到任务区内。
(3)基于作业员外业进行数据采集更新时选定作业的道路和方向,利用GPS定位、混合网络定位等手段,将核查数据以距离当前定位点由近及远依次排序。
(4)通过选取任务区、道路等信息,对采集数据进行内业核查和数据质检。
地名地址数据采集更新工作一般是以市县为项目作业区,而对于整个作业区来讲,数据量大,需要多名作业员联合来完成数据的采集更新工作,因此为了更好的管理作业员的工作进度及数据质量,需要建立一种新的地名地址数据管理体系。
该文以地名地址数据采集更新任务为中心,利用WebService、版本控制、数据缓存、异步上传等技术手段,通过任务的预处理、任务的下发、任务下载和更新、任务数据的外业采集和内业核查、任务质检、任务提交和数据发布等作业流程,建立了以任务为核心的数据管理模式,实现了地名地址数据的内外业一体化管理,具体流程如图3所示。
(1)进行任务数据的预处理,以全省的地名地址数据库作为基础库,通过项目区范围从基础库中提取范围区已有的地名地址数据,将其作为本项目区本次进行地名地址数据采集更新工作的下发数据库。
(2)综合考虑下发数据库的数据量、数据整体分布情况及作业人员数量,划定任务区范围。
(3)作业员通过手机或平板安装地名地址采集系统APP,进行数据采集更新工作。
(4)作业员上传任务区已完成数据,由内业人员进行数据核查,并将不符合要求的数据退回到外业流程,由外业人员重新核查。
(5)任务区数据全部内业核查结束,提交质检人员,进行数据质检,并对不符合要求的任务区数据全部或部分退回,重新进行外业采集或内业核查。
(6)任务数据通过质检,将新的成果数据更新至地名地址基础库,并发布上图。
图3 以任务为核心的数据管理流程图
针对地名地址数据采集过程中定位精度差、准确率低、数据质量不理想等问题,该文利用移动GIS、GPS/北斗定位、图像识别、遥感等技术,通过采集位置上报、影像判断、照片比对、时空分析、实地抽查等手段,建立了地名地址数据采集动态监管模式(图4),实现了地名地址数据采集全过程全方位的动态监管,主要包括外业采集上报监管、采集移动轨迹监管、内业核查监管和质量检查监管四部分。
(1)外业采集上报监管。地名地址数据采集上报时,需要上报采集点位置、数据点位置和现场照片的位置等空间信息,数据采集时间、照片拍摄时间以及数据上传时间等时间信息,以及地名地址所属区划、所在道路及门牌号等属性信息,结合外业调查上报时,作业员的行走速度等因素,进行3个上报位置容差比对、3个时间的对比、位置与所属道路比对、上报名称和拍摄照片文字识别内容比对,实现对地名地址数据采集上报进行监管,准确掌握外业调查时上报的时空信息,为地名地址数据的内业核查和质量检查提供基础支撑。
(2)采集移动轨迹监管。由于作业员进行数据采集的过程是沿道路单向进行采集,且每次采集都会记录位置轨迹,根据轨迹的方向和位置间的规律性,以道路数据为基础,结合轨迹坐标和上报位置匹配,有效避免了采集工作不准确的情况。
(3)内业核查监管。在地名地址数据内业核查过程中,按照数据完整性、一致性、准确性等特点,对照片拍摄的清晰度和角度、外业上报属性信息、照片文字等信息进行核查,同时结合遥感影像,对数据点位置及照片位置再次进行比对,人工判读该次采集工作是否属实,为采集结果的真实性提供了保障。
(4)质量检查监管。在数据质检过程中,质检员严格执行“两级检查、一级验收”制度,对任务数据进行质量控制,并按照数据抽查要求,抽取对应比例的数据进行实地核查,以验证数据的准备和真实。
图4 地名地址数据采集动态监管模式图
目前卫星影像地图在移动GIS领域访问方式主流仍为网络瓦片请求,每张瓦片大小一般30k以上,数据量比较大,访问过的地区重复访问仍需请求网络数据;如果服务器卫星影像地图更新,需将请求的最新影像地图瓦片更新。同时为了满足野外数据采集的需求,往往需要将预先到达的区域卫星影像地图缓存到本地,以免受到手机网络不好等条件影响。因此需要建立一套移动GIS平台下瓦片地图自动缓存机制。
该文基于“天地图·山东”地图瓦片切片规则,以层级-行列号为索引组织结构建立了瓦片数据存储模型,通过预缓存、实时缓存、更新缓存等多种缓存方法,利用Sqlite数据库及文件相结合的方式进行瓦片存储和管理,实现移动GIS平台下瓦片地图数据的自动缓存(图5)。
图5 地图数据缓存流程图
该系统采用B/S架构设计,Web端采用.Net开发框架,使用C#+JavaScript的开发模式进行开发,实现了地名地址数据管理子系统。APP端基于Eclipse开发环境,采用Java开发语言,利用“天地图·山东”Android版API开发实现了移动端地名地址采集系统APP。地名地址采集系统Web端运行在普通PC上即可,APP端需运行在Android4.0版本以上系统中。
系统效果图如图6至图9所示,图6为添加任务界面,实现任务属性信息的输入、作业员的下拉选取以及任务区的绘制和编辑。图7为采集任务详情界面,实现了该任务区数据的检索、分类统计、地图定位展示等功能。图8为外业地名地址数据采集更新界面,实现了地名数据三级分类的下拉选择、所属道路的选择,名称、地址、电话、门牌号、内部楼号等信息的输入,地名照片、地址照片的拍摄,位置的地图采集和编辑等功能。图9为内业核查集界面,选择任务区、所属道路、类别、状态或者输入地名信息,点击搜索按钮,弹出地名地址数据单条记录的内业核查界面,核查人员可对基本信息进行修改和完善,位置信息进行二次编辑,照片信息进行核查等。
为了检验改善的采集方法,在泰安市选取了主城区和郊区等作业区域,分别采用3种不同的采集方式作业。通过实际作业验证,相较于传统的数据采集更新方法,本系统所采用的地名地址数据采集更新方法减少了作业员选取或查找调查点的时间,提高了作业的效率。同时对于新增的地名地址数据,也只需在对应的数据间插入即可,减少了位置点确认的时间(表2)。
图6 添加任务界面
图7 采集任务详情界面
图8 外业采集界面
图9 内业核查界面
外业采集方式作业方法作业区域作业点数/天作业区熟悉度对作业效率的影响传统数据采集利用纸质地图划分网格,拿图纸进行外业采集主城区,200郊区,100~150较大矩形划分网格式采集利用采集系统划分矩形网格,手持采集APP进行外业采集主城区,300~350郊区,200~250适中基于道路的地数据采集利用采集系统以道路中心线划分网格,手持采集APP进行外业采集主城区,400~500郊区,300~350较小
系统成功应用于山东省地名地址数据采集与更新工作中。2018年,利用该系统已顺利完成了济南、泰安、威海、枣庄、济宁、东营等6个地市的地名地址数据采集工作,累计采集更新25万条地名地址数据,将市县核心城区的数据更新效率提升至月级别,重点类地名地址信息更新效率提升至周级别,数据准确度提高至99.99%,极大提高了数据采集更新效率和准确度,保障了地理信息公共服务平台数据时效性和准确性,提高了山东省地理信息公共服务平台的影响力。
该文根据实际采集需求,提出了新型的数据采集更新方法,改善了地名地址数据传统采集方式,提高了采集效率,设计了以任务为核心的内外业一体化流程,创新了数据采集监管模式,实现了地名地址数据实时监督管理,保证了采集数据的时效性和准确性,利用移动GIS技术、计算机技术、GPS技术、图像识别等技术,依托“天地图·山东”提供的地图数据资源和开发API,开发了山东省地名地址采集系统,满足了“天地图·山东”地名地址数据建设的要求,在实际应用中取得丰硕成果,具有较高的推广应用价值。实践证明,利用本系统进行地名地址采集与更新工作,推动了“天地图·山东”地名地址数据的建设,对促进智慧城市的发展有重要意义。