房地一体化外业数据采集系统的设计与实现

2021-05-27 05:13王月恒
地理空间信息 2021年5期
关键词:外业身份证数据库

木 林,王月恒,胡 慧

(1.中水淮河规划设计研究有限公司,安徽 合肥 230601;2.刘河小学,安徽 合肥 231232)

农村房地一体化确权包括农村地籍调查和房屋调查,是对农村范围内所有宗地的权属、位置、房屋以及构筑物面积等相关信息的调查,是一项公益性基础调查[1];并在此基础上进行确权登记、颁发不动产权证书。农村土地确权登记是维护农民土地权益、促进农村改革发展、实现乡村振兴的基础[2]。农村房地确权登记能有效解决农村集体土地权属之间的纠纷,化解农村社会矛盾,依法确认农民土地权利,强化农民特别是全社会的土地物权意识。对农村集体土地权属进行登记并建立数据库,能有效提高土地管理和利用水平,查清宗地的权属、面积、用途和空间位置;进而建立土地登记簿,以摸清土地利用情况;最终形成产权明晰、权能明确、权益保障、流转顺畅、分配合理的农村集体土地产权制度。

农村房地一体化确权工作以地籍调查为基础,以宗地为依托,以满足不动产登记为出发点,充分利用已有的土地和房产权籍调查、登记以及前期审批、交易、竣工验收等成果资料;以实测或收集到的数字化地形图数据为主要数据源,在满足精度的基础上,将其作为外业调查和内业地籍图编绘的工作底图。通过内外业相结合的方式对宗地和房产进行权属调查核实、地籍图测绘和房产平面图测绘,获得最基础的不动产数据信息。

房地一体化外业数据采集工作主要是对土地或房屋所有权人信息的收集,包括身份证、户口簿、权源材料、权属证件、宗地、房屋的四至照片以及其他相关信息的复印件、照片或扫描件等。由于数据种类繁多,采集时涉及拍照、扫描、调查表填写等步骤,所需仪器包括打印机、复印机、扫描仪、相机等;同时在数据整理过程中,需按照一定的规则分类存储文件,整理工作繁琐,不仅工作量大,而且容易出现错误。一旦项目完成后发现数据有缺失,再进行数据补充将拖慢工作进度,特别是牵涉到不同工作组协同作业、检查等工作流程时,传统的作业流程效率低下,工期和质量都不能得到保障。

目前,智能移动设备发展非常迅速,其摄像头、CPU、GPU 等硬件的性能越来越高;而且很多开源的数据库和GIS 软件均支持移动端应用,为移动端开发提供了可能[3]。移动设备已具备定位、视频拍摄、数据传输等功能,且便于携带、数据录入方便,成为房地一体化数据采集与协作的首选。为了减轻外业人员数据采集、照片拍摄和数据处理的难度,提高外业人员协同作业效率,本文针对农村地籍调查和房屋调查工作的实际需求,开展了房地一体化外业数据采集系统的设计与开发工作。

1 系统设计

1.1 系统总体设计

房地一体化外业数据采集系统采用移动端与桌面端相结合的方式(移动端采用Android系统、桌面端采用C Sharp开发语言),集成了地图定位、数据标注、拍照编辑、数据上传等技术,综合手机端App、桌面端软件和服务器等构成了数据采集、传输、处理等一体化的流程系统。

1.2 系统流程设计

系统流程始于数据整理,需对影像数据进行图像裁切、投影变换、格式转换、金字塔创建等处理,使影像数据能在移动端顺利浏览。在移动端创建行政区和宗地信息数据后,可对所属宗地信息(身份证、户口簿、权源材料、调查表、权属证件、宗地、四至、签字等图像数据)进行采集,同时完成地图标注信息,用于其他测量作业队伍的测绘工作。整个项目行政村数据采集完整后,将其整体压缩打包上传至服务器端,进入流通处理环节。内业编辑人员通过桌面端软件从服务器打包下载外业采集的数据,对数据的完整性、数据命名的准确性等进行检查,若数据不完整则通知外业人员进行补充采集,检查完成后通过内业编辑上传至服务器,等待项目负责人核查。项目负责人核查通过后进行下载备份统计,作为最终成果进行保存,对于其中存在的问题,向前反馈进行修改。具体流程如图1所示。

图1 系统流程图

1.3 系统功能设计

系统包括移动端和桌面端两部分内容,移动端App主要负责数据的导入、采集、拍照、上传等采集工作以及地图标绘、地图定位等GIS辅助工作;桌面端负责用户管理、数据转换以及数据上传下载等工作,并建立数据传输机制,通过数据将业务人员联系起来。系统主要功能模块如图2所示。

1.3.1 权利人基本信息创建模块

在移动端App中,为了方便查看、拷贝以及编辑操作,权利人的信息数据采用文件的形式进行保存,系统内置全国所有省份、直辖市、地级市以及县区的行政编码。首先建立地籍子区文件夹,以“行政区码+地籍区代码+地籍子区代码+村名”为文件夹编号,如XX村(XXXXXXXX);然后在该村名文件夹下建立权利人的基本信息,以“权利人名称+门牌号”为权利人的唯一标识,并采用JSON格式的数据保存该地籍子区的基本信息数据;最后将存储的数据进行分类,分别创建地图标注、共有产权情况、户口簿、签字、权源材料、身份证、四至等子文件夹。数据采集文件结构如图3所示。

1.3.2 身份证识别模块

字符识别技术(OCR)是基于光学计算和计算机技术,通过检测字符每个像素的暗亮模式来确定其形状,再翻译成计算机文字的过程[4]。随着AI技术不断的发展,证件识别技术以较高的正确率越来越受广大用户的青睐。在权利人基本信息创建过程中采用身份证自动识别技术,能根据身份证信息智能化创建权利人信息,读取所在省、市、县信息,并根据这些信息智能化地籍子区文件夹、填写门牌号、创建权利人文件夹。身份证识别技术采用百度OCR身份证识别接口,该接口提供Python、Java、C++、php、C#编程语言等各种语言的调用方式。移动端通过摄像头获取身份证的图片信息,通过压缩编码利用网络调用百度OCR身份证识别接口,返回信息包括姓名、性别、民族、出生日期、住址、身份证编号、发证机关以及有效日期等。百度OCR身份证识别接口还提供了离线开发接口,可将SDK集成到移动设备中(Android、iOS),无需网络即可实现身份证质量校验、全字段或关键字段识别等功能,从而对用户信息进行保护。

图2 系统功能模块

图3 数据采集文件结构

1.3.3 图片采集模块

图片采集是系统数据采集的核心功能,包括身份证户口簿的正反面照片、权利人签字时的照片、指界照片以及宗地四至前后左右等信息的采集。在图片存储时,先对图片进行分类,再按照特定规则进行命名,标识图片的类别名称,包括身份证配偶信息、正反面信息、户口簿的户主配偶正反面信息、签字和指界本宗地户主以及邻宗地户主情况等信息。图片保存在相应的文件夹中,针对不同移动设备拍摄的照片大小不固定的问题,在不影响后期图片识别和处理工作的前提下,系统将对过大的图片进行压缩处理,以减小移动端的存储空间。

1.3.4 地图标绘模块

系统通过该模块实现地理信息数据(点、线、面)的采集,地图涂鸦信息的保存以及地理信息数据属性信息的采集。在地图标绘前,需将经过处理的栅格数据导入系统,并进行相应设置。地图标绘是以栅格数据为底图进行图形数据的增加、删除、后退、修改、显示等一系列操作。标绘完成后,用户可通过微信等方式将该数据传递给测量组成员,测量组成员则根据标绘的位置进行数据的精确测量。地理数据在移动端以特殊的格式进行存储,该格式可在桌面端软件中转换为通用的shp文件或kml文件,方便其他软件的读取和编辑。

1.3.5 地图定位模块

由于数据采集人员所处的环境地形复杂或深入深山老林,特别是我国西部的农村地区,村庄偏僻、山高人稀,因此系统提供了位置信息服务,可在线调用Google切片地图并显示当前位置信息。地图控件采用MapBox For Android开源控件,并采用高德地图的位置服务,通过纠偏处理,使得位置信息能够与地图很好的贴合显示。相较于高德地图和百度地图,该系统采用的影像地图更加清晰,弥补了商业地图在偏远山区数据不全、精度不高的劣势。

1.3.6 数据传输模块

该模块可将采集的数据打包上传至服务器。由于数据比较零散,上传前需进行数据预处理,移动端App先对采集的数据进行压缩,上传完成后再解压到服务器上,并以文件的形式进行存储,同时创建区域文件夹和地籍子区文件夹。桌面端软件提供从服务器上下载的功能,能浏览服务器上的所有数据,并以文件浏览的方式进行展示。该模块可选择特定的数据进行下载和上传,同样采用文件压缩、传输、解压等步骤完成。

1.3.7 用户管理模块

系统对数据采集员、数据审核员、项目经理等不同的用户角色设置了不同的权限,其中数据采集员主要是移动端App的使用者,数据能通过移动端进行上传,也支持桌面端软件上传,无论是移动端还是桌面端均需登陆该系统;数据审核员能下载服务器数据,并检查其是否符合采集标准,或经过自己的修改达到数据采集的标准,达标的数据需再次上传至服务器;项目经理负责最终判断某一宗地的数据采集是否完成,并进行标注。

1.3.8 数据导出转换模块

移动端采集的数据以文件结构体系进行保存,一般情况下该数据格式需转换为标准格式才能进入下一步整理流程。因此,桌面端软件需对移动端的数据格式进行转换,将宗地权利人信息数据转换为需要的数据表格,主要包括房屋调查表、四至成果表(图4)、外业采集成果表(图5)、宗地图、权籍调查表、一户一档数据以及标绘文件等。

图4 四至成果

图5 外业采集检查成果表示例

2 关键技术分析

2.1 软件授权加密技术

软件是一种可以复制使用的产品,软件的授权使用是软件作为产品的重要部分。房地一体化外业数据采集系统的移动端部分采用授权文件的方式进行授权,将移动端唯一标识和授权使用时间等信息生成具有唯一性的授权文件。授权文件适用于在线和离线的工作环境,无需在线验证,允许离线环境下的软件授权验证。

1)授权文件的生成。授权文件生成软件基于移动端的机器码、软件的包名、授权允许使用的时间,采用MD5加密技术,通过特定的秘钥转换为加密字符串,再将这些字符串转换为字节。在授权时间的处理上,系统采用两种方式:①以时长为时间限制,该方式在完全离线的状态下(不连接互联网也不接受GPS信号)使用,在移动端软件里,系统能自动记录软件激活状态的总时间;②采用限制日期型,该方式只要连接互联网或GPS信号即可使用。

2)授权文件的验证。在移动端App打开软件时,软件将检测授权文件的情况,主要包括无授权文件、含有授权文件、授权文件的包名相同、授权文件在有效期内等情况,针对不同情况,软件会有不同的提示。

2.2 图片自由裁切变换技术

在图片采集过程中,有很大一部分图片是文档数据的拍照采集,如身份证、户口簿、各种文档证件等,通常这种数据是采用复印的方式获取的。系统以拍照的方式代替复印,但二者最大的不同是拍摄的照片具有形变,规则矩形的身份证和纸张都具有一定角度的仿射变换,因此系统提供了将这种变形图片转换为正常图片的仿射变换功能。通过在图片上绘制矩形的顶点坐标,对原有图像进行矩阵变换,以实现对原有图像的拉伸处理,如图6所示。

图6 仿射变换前后对比

2.3 数据传输与解压缩技术

采集的数据在传输过程中,由于数据文件较多,将出现各种问题,因此系统采用数据压缩、传输、解压的流程。在数据传输前,以宗地或行政区为单位,对数据进行压缩;然后在服务端对接收到的数据进行解压,按照之前的文档结构进行保存,并读取文件中的宗地或行政区信息,用于文件信息的存储。另外,移动端拍摄的图片像素较高,一个权利人采集的数据有可能达到100 M,这么大的数据量不利于数据的在线传输,因此数据压缩前,在不影响图像的识别的前提下,系统对高分辨率的图片进行压缩处理,将不同移动端拍摄的图片压缩至固定像素。

2.4 空间数据存储技术

地理信息采集的数据主要包括点、线、面等地理信息数据及其属性信息。桌面端地理信息一般采用数据库进行存储,需在传统的关系型数据库上安装支持空间数据引擎的插件。Android和iOS系统均支持轻量级的SQLite数据库。SpatiaLite空间数据库是基于SQLite扩展的支持空间数据存储与查询的轻量级数据库,是一个简单、实用的轻量级GIS数据库;遵守OGC标准,支持SQL语言,支持对空间数据进行操作[5]。在数据的访问效率、完整性和安全性等方面,SpatiaLite也具有明显优势,支持存储器存储,提供R-tree和Mbrcache空间索引机制,极大地提高了用户访问数据库的效率。此外,其元数据机制也提高了管理和查询矢量数据的效率[6]。

移动端利用类库对SpatiaLite数据库进行读写,采用SQL语句对数据库数据进行操作。SpatiaLite数据库提供了各种针对空间数据的操作函数和转换函数,能将符合条件的几何字段字符串表达转换为能被数据库识别和存储的Blob字段。将采用WKT表达的空间信息插入数据库的SQL语句为:

Insert Into TableName geom values GeomFromText(wkt)

将从数据库中读取的空间数据转换为WKT字符串的SQL语句为:

Select name AsText(geom) From TableName

SQL语句能将空间信息的Blob 字段字节数据转换为可读的WKT数据。空间几何属性的表达既可采用WKT格式,也可采用GeoJSON和kml格式,还可利用不同的函数进行转换。

3 结 语

房地一体化外业数据采集系统包括移动端App、服务器和桌面端软件系统3个部分。该系统实现了数据采集、传输、编辑、处理的流程化处理,特别是在移动端部分,集成了拍照、定位、地图、文字识别等功能,将先进的技术应用于实际生产工作中,给外业数据采集带来了极大的便利。数据共享技术能及时地将最新成果反馈给内业编辑人员和管理人员,有助于提高数据生产的效率和周期。房地一体化数据管理的最终目标是建立一整套房地一体化管理系统,按照统一的技术标准,整合、汇集地域内不动产登记相关部门的房地一体化调查成果数据[7]。外业数据采集系统是该管理系统数据源重要的获取方式,获取方式的完善和格式的统一有助于管理系统的建立,为广大用户提供优质可靠的服务。

猜你喜欢
外业身份证数据库
都有身份证
基于移动 GIS 的公路工程外业调查系统研究
辣椒也有身份证
基于市政管线外业采集命名规则和辅助软件开发
趣说古人的“身份证”
天津市第一次全国地理国情普查外业调绘核查
数据库
数据库
数据库
公路外业测量中GPS RTK测量技术的应用探究