李清海 班成英 王佳乐
目前,北京市第二次全国经济普查被调查单位通过北京统计数据集中采集平台(含统计机构通过客户端录入)报送普查数据的工作正在如火如荼进行中,5月底前将通过国家普查数据处理程序实现普查数据的最终上报。由于国家统计局部分普查数据处理程序和清查程序为同一设计方,所以了解国家清查数据处理程序实现业务流程的主要思路和方法,对于了解国家普查数据处理程序的业务实现流程、利用软件上报后续报表数据、理解普查基本单位的来源和更好的应用北京统计数据集中采集平台都将有所裨益。
■ 清查目的与清查软件
为了准确界定第二次全国经济普查的对象与种类、落实普查登记责任、确保普查表发放种类准确和普查单位的不重不漏,各级经济普查机构组织开展了单位清查工作。单位清查以摸清普查区域内从事第二产业和第三产业的各类法人单位、产业活动单位和个体经营户的数量、规模、经营活动类别为目的,为普查培训、普查表发放和有针对性地开展宣传动员等各项经济普查工作奠定基础。
清查软件包括统计制度的布置与再设计、数据的采集、处理、管理和应用等功能;实现了整合部门提供的单位基本信息、生成底册、采集清查表、审核、汇总、分表管理和上报等业务流程。
■ 软件实现清查的流程
整合部门提供的单位信息
在将统计、工商、国税、地税、编办、民政、质监等部门数据导入单位清查程序之前,需要预先对各部门提供的单位信息进行整理和规范,主要包括以下几个方面:一是按统一的指标顺序排列,二是核实与剔除同一部门重名重码的单位,三是将详细地址中的省、市、县名称去掉(因为上报是以区县为单位),并将所有门牌号统一为半角字符,四是尽量获得9位或12位行政区划代码。上述四方面的工作均通过EXCEL实现,主要使用的函数是FIND和VLOOKUP以及排序的方法,基本思想是在单位详细地址中寻找“办事处”、“镇”、“乡”和“村”等关键字,然后将这些关键字前面的字符串组合与行政区划代码表中行政区划比较,从而得到所有单位所属的行政区划代码,再用排序去重。
部门数据整理好之后,就可分别导入单位清查软件。单位清查的目的是为保证普查单位的不重不漏,尽量减轻工作量,树立清查结果的权威性,与部门数据比对只是一种手段,并不是清查的目的。
生成核查单位表
由各部门的数据生成核查单位表时,按照组织机构代码、单位名称,对导入形成的部门数据进行单位信息自动比对合并。比对时可以设置部门的优先级次序,即一个单位属于多个部门时,最终生成的核查单位表中这个单位的信息是按照这个设置好的优先级从这些部门数据中选取信息。对导入核查单位表的单位可以再进行手工合并,解决那些在自动比对合并中由于比对关键字为空或者其它原因造成比对没有成功的单位合并。
核查单位表中每个单位记录都用“数据来源”说明其来自哪些部门,这样就建立了核查单位表中的单位与各部门单位的关联,这种关联保证了只要把核查单位表中的单位清查清楚,各部门的单位就都清楚了。通过查询核查单位表不仅可以了解每个单位的部门来源情况,还可以了解部门单位比对结果,即各部门之间你有我无,你无我有的单位。同时,程序还为核查单位表中的每个单位生成了核查顺序码,核查顺序码在以后生成的底册和单位清查表录入中都保持不变,这样就建立了核查单位表中各单位与底册和清查表各单位的关联,各部门数据与清查结果都通过这个关联建立了关系,可方便地查询各部门之间单位差异,特别是能随时查询并统计出各部门单位的清查情况。
生成清查底册表
因为要将单位信息形成可以分解到普查区的底册,所以在生成清查底册表时必须去掉重名、重码和完成行政区划代码划定。软件通过计算机自动比对及人工合并完成去重,通过程序自动划定和人工借助程序划定12位行政区划代码,最终形成清查底册。
去重的过程主要还是按照关键字如法人和电话号码等排序方法实现。自动划定行政区划代码的原理是通过程序将同一门牌号的单位作为一组,只要其中有一个单位有12位码,则该组所有单位的行政区划代码都自动赋给此码。如果该组中有多个12位码,则用个数最多的码来替换该组的码。
录入单位清查表
在带着底册“地毯式”清查过程中,对于找到的在底册中存在的单位发放单位清查表,同时将该单位在底册中的核查顺序码填写在该单位清查表的“核查顺序码”处,在后期单位清查表的录入时,就可以按核查顺序码为主关键字录入,因为核查顺序码建立了底册、核查单位表与部门数据的关联,所以可以自动、方便地调出该单位的部门信息,录入人员可以根据单位当前的实际情况仅仅改动与原来部门库中不一致的信息,实现快速录入。
对于没有核查顺序码的单位,在单位清查表录入完成后,程序会将该单位情况通过组织机构代码、名称、部门登记注册号等信息与核查单位表和部门数据库进行比对,如果能比对上,就建立关联;比对不上,就作为新增单位对待。
审核与汇总
同所有的统计系统一样,国家清查软件在制度中也统一定义了审核公式,实现了重名重码审核、指标间和表间审核;提供了国家上报统一要求汇总表和综合表的实现;审核公式和汇总表均可自定义。
分表管理
软件可以按专业、规模(限额)以上(下)等条件将清查单位过滤出来,也可根据条件查询出填写某张报表的单位,即实现每一套表(或某一个专业)应由哪些单位来填报,如可查找出作为向各专业填报报表的单位和年定报单位。
■ 用国家清查软件实现上报
由于北京市第二次全国经济普查(包括清查)数据处理是在北京统计数据集中采集平台上实现完成的,必须通过自编程序实现与国家单位清查软件的对接和转换;同时,为符合国务院第二次全国经济普查办公室对部门名录表、核查单位表(底册)和单位清查表以及对这些表审核、汇总的上报要求,北京清查数据必须从外部导入国家清查程序后按照上述流程流转。目前北京数据已经实现从各部门提供的近130万单位名录表到近64万单位核查表(包括区县间在不同部门的重复)、再到近45.5万余法人和产业活动单位以及近56.6万个体经营户的数据处理;业已完成各部门提供单位的填表率、各种综合表和汇总表的计算和上报工作。