李小伟 谢振波
(黑龙江省林业设计研究院,黑龙江 哈尔滨 150080)
土地确权项目[1-2]从工程项目角度解读就是对土地信息和承包人信息进行分类、汇总、建库和归档。土地确权数据建库一共涉及三种表和一图:承包方代表表,承包地块信息表,承包方家庭成员表和地块shp图,三张表构成土地承包基本信息。
地块信息包含:标识码,要素代码,地块代码,地块名称,所有权性质,地块类别,土地利用类型,地力等级,土地用途,是否基本农田,实测面积,地块东至,地块西至,地块南至,地块北至,地块备注信息,指界人姓名,空间坐标,实测面积(亩),发包方代码,承包方代码,承包经营权取得方式,确权(合同)面积,承包合同代码,流转合同代码,承包经营权证(登记簿)代码,原合同面积,确权(合同)面积(亩),原合同面积(亩),是否确权确股,发包方名称,承包方名称,图幅编号,调查记事,调查记事人,调查日期等。
承包人代表信息包含:承包方代码,承包方姓名,证件类型,证件号码,性别,年龄,生日,联系电话,邮政编码,家庭住址,户口性质,农户类型,民族,承包合同编号(原),经营权编号(原),鉴证机关,鉴证人,鉴证编号,鉴证时间,经营权取得方式,承包土地用途,承包开始日期,承包结束日期,承包年限,家庭人口数,98年分地成员总数,调查记事,调查日期,调查员,审核意见,审核日期,审核人,备注。
承包方家庭成员信息包含:承包方代码,姓名,证件类型,证件号码,年龄,性别,与户主关系,生日,户口性质,民族,是否为98年共有人,是否是共有人,成员备注。
三种表通过“承包方代码”实现关联,地块信息中的“实测面积”,“地块东至”,“地块西至”,“地块南至“,“地块北至”和“空间坐标”通过地块SHP图提取,其他信息或通过调查或通过计算得到,承包人代表信息和承包方家庭成员信息都是通过调查后录入而得[3-5]。
在数据信息录入过程中就会出现差错,而户籍信息的数据量较大,在项目实施的过程中户籍信息的错误率较高。户籍信息录入最重要的是姓名、身份证号和家庭关系的准确性。年龄、出生日期、性别、家庭成员数等都可以间接计算。
数据建库之前应该进行数据准确性检核,确保建库的有效性。Office软件EXCEL在1994年后就具备了VBA的宏功能,可以通过VBA程序实现对权属信息准确性的检核。
土地确权项目中“证件号码”一般采用身份证号。而在项目实施过程中,出现了大量的身份证号码的无效性,见表1。
根据第二代身份证号编码规则,身份证号共18位,第1、2位数字表示所在省(直辖市、自治区)代码, 第3、4位数字表示所在地级市(自治州)的代码,第5、6位数字表示所在区(县、自治县、县级市)的代码,第7-14位数字表示出生年月日,第15、16位数字表示所在地派出所代码,第17位数字表示性别,第18位数字是校检码,家庭成员表见图1。
图1 家庭成员表样例
第18位的检校码用来检验身份证的正确性,校检码为阿拉伯数字0—9和罗马数字X。文献3论述使用VBA对不是正确的身份证号码进行检核,对于其他的身份证号码错误信息没论述。
针对家庭成员表格式,完善VBA程序,实现对身份证问题1,2,3,4的检查。
身份证号重复出现的情况分多种,有同一身份证号多次出现但姓名不相同,有同名同号但是在不同家庭的,这在土地确权项目中都是不允许的。为了便于查找和修正,在VBA程序编写时直接将错误信息输出到文档中,本例就将错误信息输出到第12、13、14列中[6]。
程序运行效果如图2。
图2 身份证正确性检查效果和身份证号重复检核效果
利用准确的身份证号可以实现性别、年龄、出生日期的自动填充,文献3给出了相应的VBA 代码,但在土地确权的实际作业中,还是发现了 “成员性别”栏的值和身份证性别编码(第17位数字表示性别:奇数表示男性,偶数表示女性)不匹配的情况。同时姓名中出现的空格、数字、字母,符号等认定为特殊字符,这些特殊字符一般不符合中国人取名习惯,应仔细核对。 程序运行效果如下图3。
图3 性别和身份证匹配检测效果
家庭关系的准确性检测包含有无户籍关系,户籍关系填写是否规范,户籍关系是否合理等。
在项目实施过程中,发现家庭关系填写儿子、妻子、哥哥、弟弟、媳妇、姑爷、舅妈、前妻、爷爷、奶奶等与规范称呼不符的现象,有年龄比户主大而家庭关系却填写“长子”的现象,有性别为男而家庭关系却填写“儿媳”的现象,有一个家庭出现多个户主或多个长子、多个长女现象。
在85种家庭称谓中,有些称谓只能出现一次,有些称谓最多两次,有的称呼可以出现多次。见表2、3、4、5。
表2 允许出现一次的称谓
表3 允许出现两次的称谓
表4 允许出现四次的称谓
表5 隐含日期的称谓
通过分析,隐含日期的称谓都是以户主视角称呼,以户主视角划分称谓如下:
其中年龄可能相同的称谓可能是:“兄弟姐妹”、“兄”、“弟”、“姐姐”、“妹妹”、“其他兄弟姐妹”、“堂兄弟、堂姐妹”、“表兄弟、表姐妹”。
年龄小一点的称谓有:“兄弟姐妹”、“弟”、“妹妹”、“其他兄弟姐妹”、“堂兄弟、堂姐妹”、“表兄弟、表姐妹”。
年龄大一点的称谓有:“兄弟姐妹”、“兄”、“姐姐”、“其他兄弟姐妹”、“堂兄弟、堂姐妹”、“表兄弟、表姐妹”。
小一辈的称谓有:“子”、“独生子”、“长子”、“次子”、“三子”、“四子”、“五子”、“养子或继子”、“女婿”、“其他儿子”、“女”、“独生女”、“长女”、“次女”、“三女”、“四女”、“五女”、“养女或继女”、“儿媳”、“其他女儿”、“侄子”、“侄女”、“外甥”、“外甥女”。
小两辈的称谓有:“孙子、孙女或外孙子、外孙女”、“孙子”、“孙女”、“外孙子”、“外孙女”、“孙媳妇或外孙媳妇”、“孙女婿或外孙女婿”、“其他孙子、孙女或外孙子、外孙女”。
小三辈的称谓有:“曾孙子或外曾孙子”、“曾孙女或外曾孙女”。
大一辈的称谓有:“父母”、“父亲”、“母亲”、“公公”、“婆婆”、“岳父”、“岳母”、“继父或养父”、“继母或养母”、“其他父母关系”、“伯父”、“姨母”、“姑母”、“叔父”、“舅父”。
大两辈的称谓有:“祖父母或外祖父母”、“祖父”、“祖母”、“外祖父”、“外祖母”、“配偶的祖父母或外祖父母”、“其他祖父母或外曾祖父母关系”。
大三辈的称谓有:“曾祖父”、“曾祖母”、“配偶的曾祖父母或外曾祖父母”。
在这隐含日期的称谓中“长子”、“次子”、“三子”、“四子”、“五子”、“长女”、“次女”、“三女”、“四女”、“五女”的年龄差较小。
在辈分称呼判断中,采用依据年龄大小进行模糊判断,以18岁为一个辈分段。在对含有辈分关系的称呼进行检查时,本算法为辅助检查,以实际情况为准。
家庭关系逻辑性检测程序效果见图4。
图4 家庭关系逻辑性检测效果
在对家庭成员的检查中发现有些承包方的成员数为0,有些承包方的成员数量和家庭成员表中的人员数量不一致的情况。前者是在家庭成员表中没有录入成员信息造成,后者多是统计错误或是临时增添人口而没有实时修正成员数量造成。
承包方代表信息表中的“家庭人口数”信息需要对家庭成员信息表中的家庭成员数进行统计获取,家庭户以承包方代码为标志。
承包方代表信息表中的“98年分地成员总数”信息通过以户为单位对家庭成员表中的“是否为98年共有人”进行统计获取。
程序运行如图5。
图5 家庭人口数和成员数检核效果
承包人重复表明承包人在两地都承包土地,这不符合实际情况,承包人重复包含情况有本村重复,跨村重复,跨乡重复,甚至跨县重复等[7-8]。
承包人重复现象较为普遍,而问题的处理需要多地调查询问,在两地共同确认后再分别处理各自的权属信息。
承包人本村重复只需对本村的权属信息表进行检索,而跨村乡重复需要对多个权属信息表进行检索,权属信息表是以村为单位命名的文件夹提交,检索量较大。
以红光乡和兴隆镇为例,见图6,红光乡包含8个村,兴隆镇包含8个村,证件号码10万条。
图6 乡村信息
承包人重复检查以证件号码为基准,检查内容包含:证件号码相同而姓名不同;证件号码相同姓名相同且都是共有人。前者需要核对证件号码和姓名,后者需要核对承包人承包土地信息的准确性。
程序运行如图7。
图7 承包人重复检查效果
在承包人代表信息表中有许多必填项,需要在数据入库前进行检查,具体包含:检查证件类型、户口性质、民族、电话号码、家庭住址、承包开始日期、承包结束日期、承包年限、调查日期、检查审核、调查员、审核意见、审核人[9]。
必填项的检查主要检查是否为空,对于日期的检查同时需要检查日期的格式和有效性,承包开始日期应为“1998-01-01”,承包结束日期应为“2027-12-31”。
必填项字段检查效果见图8。
图8 必填字段检查效果
土地权属信息内容的多样性,在实际作业过程中会或多或少出现错误,根据土地确权项目的实施的实际情况,编写项目程序,先期发现错误,提前处理,避免数据入库和合库后再发现错误。
本程序操作简单,针对性强,实际应用效果良好。