信用数据的质量评价

2019-01-27 20:45陈晓芸
浙江经济 2019年12期
关键词:条数信用部门

□ 陈晓芸

最近,李克强总理在浙江考察时,对浙江省公共信用信息平台给予了高度的评价。信用数据是建设公共信用信息平台的基础,离开数据,信息平台便成无源之水、无本之木。信用数据质量好坏直接影响信用档案的质量状况,影响信用信息的共享互通,影响信用评价的准确性和客观性,最终影响信用应用的顺利开展。因此,加强信用数据质量管理,开展信用数据质量评价,将其作为数据管理的手段倒逼数据质量的提升,十分有必要。

公共信用信息归集的特点是只负责整合各数据源头部门的信用信息,不修改各部门提供的信息内容,确保信用数据真实有效并可追溯。开展信用数据质量评价的目标是对省级部门和市、县(市、区)信用数据报送质量进行评价,并把相应评价结果反馈给数源部门,从源头上提高数据质量。

在实际公共信用信息归集过程中,各信息来源部门提供的数据在完整性、有效性、及时性等方面存在质量参差不齐的问题。从完整性看,较常见的问题是缺失唯一识别码和关键字段。缺失唯一识别码即缺失统一社会信用代码或身份证号码,对信息清洗比对带来难度,容易造成主体的信息遗漏;缺少关键字段即缺少反映信息实质内容的必要字段,如不良信息、荣誉记录信息时间字段缺失或不完整等。从有效性看,常见的问题是归集的公共信用数据字段类型、字段长度等格式不符合国家或浙江已有的规范标准,无法通过入库的规范化校验。从时效性看,较常见的问题是数源部门未根据公共信用信息目录更新周期的要求及时更新信息,无法动态反映主体的真实信用状况。

针对上述问题,积极开展信用数据质量评价,让部门了解自身数据问题,切实加强质量管控,是提升社会信用建设水平的有效手段。从完整性、时效性、有效性等三个方面存在的症结着手,借鉴其它省市信用数据质量管理经验,基于可操作性原则,可设置如下五方面评价指标:

一是主体唯一识别码覆盖率。用以评价部门或地方所提供信息记录是否包含统一社会信用代码或自然人身份证号码,可通过有主体唯一识别码的记录条数与所提供信息的总记录条数比率获取测评值。

二是必填字段覆盖率。用以评价部门或地方所提供信息的重要字段是否完整填报,可通过完整填报必填字段的记录条数和总记录条数比率获取测评值,单条信息记录的必填项均完整填报的计为1条。

三是信息准确率。用以评价部门或地方所提供信息记录的数据内容是否符合系统定义的数据类型、长度、格式、取值范围或逻辑关系等,可通过逻辑校验的记录条数与总记录条数比率获取测评值,单条信息记录所有数据项内容均通过逻辑校验的计为1条。

四是信息更新率。用以评价部门或地方是否在规定周期内及时更新信息,可通过及时更新的信息项条数与该部门或地方报送信息项总条数的比率获取测评值。及时更新的信息项条数计算规则分为两种情况:一种为生成周期为年度、半年、季度、月度的这类定期信息,通过计算检查当日和最近一次更新日期的时间间距,与更新周期值进行比较,以确定该信息记录是否做到及时更新。若时间间距小于或等于周期值的视为该信息项已及时更新,若大于周期值的视为该信息项未及时更新。第二种情况为生成周期为不定期或实时的信息,默认己更新,若通过抽查或例证发现,该信息项没有做到及时更新的,则不计入更新条数。

五是信息覆盖面。用以评价部门或地方是否提供其产生的规定信息项的全部信用信息,可通过数据库比对进行验证。此项评价指标作为附加指标,不列入评价总分权重分配,作为抽查或例证的扣分项。

在实际工作中,遇到的数据问题更加错综复杂,信用数据质量评价需在实践当中不断动态调整与完善,在评价中不断发现问题与解决问题,并配套针对性的制度与管理办法,才能长效地提升信用数据的质量。

猜你喜欢
条数信用部门
联合监督让纪检部门不再单打独斗
信用收缩是否结束
哪些是煤电部门的“落后产能”?
信用中国网
信用中国网
信用消费有多爽?
医改成功需打破部门藩篱
人民网、新华网、中国非公企业党建网两新党建报道条数排行
对多边形对角线条数的探究
每只小猫给了猫妈妈几条鱼