龙在宇 许然
反腐
在 最近一次案件查办中,沈阳市纪委监委发现,为提升录取率,有学生把户口迁到沈阳参加高考。得知情况后,沈阳市纪委监委第一纪检监察室韩冰心里咯噔一下,“这可能并非个案”。
不过到底有多少类似情况,韩冰心里也没底。
大数据监督在此时派上用场。通过大数据分析比对,平台发现有疑似学生800多名,且集中在一个区县。利用大数据监督,沈阳市纪委监委开始对“高考移民”亮剑。
对于沈阳市纪委监委开展的大数据监督,去年6月21日,中央政治局常委、中央纪委书记赵乐际到此调研时给予了充分肯定。
从紧闭嘴到主动投案:大数据成反腐“利刃”
让韩冰印象深刻的是,去年在大数据监督平台运行了一段时间后,沈阳市纪委监委来了个“自首”的干部。
来人四十来岁,是一名区县基层干部。他提着300万元的现金主动上缴,清晰地交代了自己的腐败问题。办理完退赔程序后,却迟迟不愿离开,他找到相关负责人,怯怯地问:“我主动交代了,能不能不处理我了?”
不过,这在办案人员的意料之中。因为“自首者”们交代的问题,早就被沈阳正风肃纪大数据监督平台盯上了。
“在没用大数据手段前,要找相关证据,只有挨个找人核实,想尽办法让可疑人员‘张嘴。”韩冰说,“但现在各单位、各级人员都暴露在数据下,问题一目了然。”
8月18日,廉政瞭望·官察室记者在沈阳市纪委监委办公楼的机房内看到近百台服务器。它们是沈阳大数据监督的“最强大脑”,存储着该市1100个一级预算单位的25.1亿条基础业务数据。数据从这里清洗、计算、分析后,沈阳正风肃纪大数据监督平台就能主动发现问题。
打理这些服务器的团队叫“大数据监督技术实验室”,由沈阳市纪委监委与中科院计算技术研究所共同打造。正是这个实验室,促使1.3万多名党员干部主动说明问题,上交违纪款3亿元。
2018年3月,大数据监督技术实验室研发建立了正风肃纪大数据监督平台。该平台包括一库四系统。“一库”即正风肃纪监督大数据库,“四系统”即数据采集系统、综合分析系统、正风肃纪监督公示系统、问题管理系统。
“与一些地方针对民生资金、工程项目‘钱袋子的大数据监督不同,在沈阳,纪委监委把涉及公共财政的项目、资金、物资、决策和权力,都纳入了监督范畴。”沈阳市纪委监委第一纪检监察室副主任郭彬说。
数据采集系统主要负责收集各单位的行权数据。数据采集完成后,就进入到综合分析系统。
在电脑前,技术人员在浏览器地址栏输入一串数字,综合分析系统页面展现在记者面前。蓝色的页面上有十几个标签,写着民政、科技、招投标等政府工作中可能出现疏漏的项目。比如点开“民生资金”,下面就会出现“企业法人领取社保”“服刑人员领取低保”“死亡人口领取社保”等子项目,项目括号里自动标记着可疑问题的条目。
中科院计算技术研究所研究员方金云将这个大数据分析过程比喻为“体检”:不同指标对应着不同阈值,超过阈值就会“亮起红灯”。发现这些异常问题后,平台会自动报警,成为纪委追查的线索。
家住大东区的张某的问题就是在这个过程中被发现的。在大数据平台的民生资金信息库里,记录着沈阳市民政局每一笔民生资金的流向,包括发放时间、金额、对象等。而在工商信息库里,记录了沈阳市工商户信息。
“两个数据库碰撞对比,就发现了大量的问题。其中张某是个典型。”郭彬介绍,张某从2012年1月开始领低保,同年10月却购买了一辆奥迪车。工商信息显示,张某还是沈阳某商贸公司的法人代表。在其他数据库比对后又发现,张某自2017年到2019年多次往返欧洲、新马泰。
“以往纪委监委的很多工作是‘手工活儿,一例一例筛查。”韩冰说,“现在有了这个系统,以前几十个人的团队工作半年才发现的问题线索数量,平台可能一天就能达到,准确率在80%以上,可精准找到某领域的问题。”
“问题管理系统主要是把纪律监督、监察监督、派驻监督、巡察监督四种力量所发现的问题整合起来,打通我们自身的信息壁垒。”郭彬说。
此外,正风肃纪监督公示系统主要是解决政府和民众的信息不对称问题。全市的项目、资金、物资全部被纳入到该公示系统,市民可以在系统上查询项目,如发现有和实际情况不符的,可以一键举报。
探索不易,要数据等于动奶酪
实际上,自大数据监督平台构建以来,沈阳市纪委监委便一直在大数据监督的无人区探索,“包括梳理材料、统计数据、构建模型、体系建设等,都没有可参照的内容”,沈阳市纪委监委相关负责人说。
在数据采集平台,如何高效地收集各单位的行权数据,是沈阳市纪委监委开展大数据监督面临的第一道难题。
“要数据就是动别人奶酪。过去平级政府部门间,哪怕工作内容相关也难以实现数据流通。”据沈阳市纪委监委工作人员介绍,为打破不同部门间信息系统的数据孤岛,沈阳市纪委监委推动全市建立了数据备案机制,将房产局、民政局、人社局等业务单位的数据纳入“大数据仓库”。
此外,对于机器来说,识别不同类型的表格与数据也有困难。这时工作人员不得不进行手动整理。
数据采集完成后,就进入到分析阶段。“通过对政府内部权力和资源的流转分析,我们研发了5套分析方法,构建了近300个规则模型。”工作人员告诉记者,通过大数据比对分析、关联分析、数据碰撞等方式能实现精准监督,发现各类廉洁风险点。
“要构建模型就需要‘向贼王学习,我们现在推行的‘一案一模型就是通过访谈案件中的问题官员,找出相关领域的漏洞后,再调整平台规则和参数来堵住这个漏洞。”这就是所谓的“捉贼要向贼学习”。
在访谈中,也有人拒绝透露如何钻制度的漏洞。沈阳市某区原劳动局一副局长因帮28人偽造工龄被查。因为该案的典型性,技术人员想通过该案查找出同类型的案例。但在访谈中,此人却打起了马虎眼,拒绝透露作案方式。