蒋 思,张文璐,卢军强,李剑峰
基于大数据的政府采购风险防控策略探索
蒋 思,张文璐,卢军强,李剑峰
(北京邮电大学 采购与招标办公室,北京 100876)
该文以政府采购风险防控视角为例,运用大数据技术分析财政部发布的政府采购案例处理意见,构建风险防控系统,实证分析详解问题成因,提出面向“放管服”的策略建议,有效率先规避风险,切实提高政府采购效率和管理水平,对今后政府采购项目执行具有重要的指导意义。
大数据;政府采购;风险防控
大数据分析技术为现代化治理提供了创新性的技术手段,构建政府采购的风险防控策略分析模型,捕捉客观现状、挖掘数据价值、及时学习经验,对今后在采购实践中提前发现和准确规避案例中涉及的类似问题,促进阳光采购的公开透明,助力政府监管治理决策更加精细化、科学化,全面提高采购经济效能,具有重要意义。
2015年,国务院发布《促进大数据发展行动纲要》(国发[2015]50 号)[1]部署的三项主要任务就是一要加快政府数据开放共享,推动资源整合,提升治理能力;二要推动产业创新发展,培育新兴业态,助力经济转型;三要强化安全保障,提高管理水平,促进健康发展。国务院办公厅同年发布的《关于运用大数据加强对市场主体服务和监管的若干意见》(国办发[2015]51 号)[2]中提出运用大数据创新政府服务理念和服务方式,提高市场主体服务水平;建立健全守信激励机制、失信联合惩戒机制;提高政府运用大数据的能力。2018年2月28日公布的十九届三中全会公报,同样提出深化推进国家治理体系和治理能力现代化的深刻变革。政策的促动和改革的需求,构筑了“互联网+政府采购”的制度优势,适应实践发展的新要求,为政府采购行业的技术创新、融合监管带来巨大机会。
逐渐健全的法制环境形成了社会共同监督环境,促进了供应商维权意识提高,相关的投诉举报案件呈现上升趋势,处理和解决相应案件耗费了采购人和监管部门的大量精力。本文以此为切入点,开展大数据技术应用在政府采购监管治理的风险防控策略实践初探。
财政部作为政府采购的权威监管部门,在受理质疑、投诉、举报后做出的调查决定,是行业专家精准把握政策后,做出的科学决策意见,体现了丰富的实践经验,因此对现有处理案例的分析是法律法规有效的补充指导意见,便于运用大数据技术根据大量历史案例,总结具有指导意义的结论,掌握经济规律,推动行业规范发展。
随着大数据行业的蓬勃发展,机器学习和深度学习技术在各行各业广泛应用,因此,以技术手段从数据中学习经验,构风险防控策略分析模型,如图1所示。从权威监管发布的内容着手,开展数据挖掘和数据关联分析,应用机器学习和深度学习算法构建风险防控系统,并在此基础上,融合案例的统计分布情况,挖掘热点问题、追溯案例来源、细化事项分析,结合实际政策,提出面向“放管服”的风险防控策略,可以极大程度率先规避风险,帮助采购人总结判例要旨,提高管理水平,也为监管部门科学制定政府采购绩效评价体系提供决策支持建议。
图1 风险防控策略分析模型流程图
构建风险防控系统,首先需要获取与市场风险相关的数据资源,通过文本处理,以词向量的语义表示形式构建政府采购领域的向量空间,为实现数据分析和文本分类奠定基础。
财政部对案例的处理意见发布在政府采购信息处理公告栏[3],从外部获取数据的主要途径就是主题爬虫,爬虫搜索策略的制定直接影响到获取的数据质量。基于分布式主题爬虫策略,对每篇信息公告的内容根据主题相关性选择搜索路径,逐页遍历每篇公告的内容,解析网站返回的结果页面,判断获取的关键词相关性,以标签形式对案件进行分类整理,便于后续研究开展标签间的对比分析。
共获取2010年到2017年底发布的全部510条数据,与信息公告文号一致,且全部采集数据均为非空文本,包括信息公告序号、发布时间、发布原因、相关当事人姓名、基本情况、处理结果、处理决定等,可以确定数据获取策略的有效性。
在线内容是以文本内容形式存在的非结构化数据,并不能被机器所识别和计算。文本处理的意义就是将这些文本转换成具有实际语义的词,常用的经典分词方法包括了词典匹配、统计、神经网络等算法,以及科研机构研制的成熟分词工具,但因政府采购行业具有较强的领域特殊性,在算法和工具应用中不能准确识别专业词汇,故采取近年来在深度学习领域最主流的词向量表示技术,应用word2vec开源工具[4],将词的表示转换成固定维度的稠密向量,维度间的相互关联保留了语义信息,从而便于在数据集中获得较高的训练效率。
基于深度学习的神经元分层连接结构原理是模拟人类大脑,在大规模数据集上自动学习抽象的深层文本特征,从而免去了传统的机器学习方法中的特征抽取过程。对于没有明确标注类别的新鲜语料,采用主流的聚类K-Means算法[5]进行无监督学习,基于计算案例内容的距离,选取不同的K值将相近案例集中在一起,生成集群标签。在此基础上,参考政府采购专家归纳总结的集中涉案类型[6],细化标签类别,首选基于深度学习CNN[7]和RNN[8]模型的有监督学习训练,然后以人工经验矫正核验,精确目标类别。
分类效果极大程度依赖于训练文本的数量,同类型内容越多,其分类质量越高,经典的评价指标包括了准确率、召回率和F值。因涉及不同的案例类别,故对不同类别分别实现主流的机器学习和深度学习分类算法,构造不同的分类器,调整参数,优化结果。对每种分类器进行5折交叉验证,可较好地评估分类效果。实验结果表明,经典的线性回归、朴素贝叶斯和捕捉上下文信息的RNN分类器在案例分类实验中具有一定优势,在案例原因和事项分析的八分类实验中,最高准确率可达到74.2%和67.3%。
整合财政部在信息公告中的法规依据和实际案例,是技术融合政府采购的首次探索,“有理有据”的实证规律可以更加实质性地指导采购人落实主体责任,对招标采购全流程管理的水平提升起到明显促进效果。
以柱状图对政府采购年度案件处理数量统计,结果如图2所示。
图2 财政部政府采购信息公告统计分布图
从整体上看,政府采购处理案例在近5年呈现快速增长趋势,案件总平均年处理量为64件。2017年财政部共发布125件政府采购处理案例,属近年来最高;2015年发布处理案例106件,2013年发布处理案例94件。究其原因,这三年正逢国家对政府采购的监管执行加大力度,财政部于2013年发布《政府采购非招标采购方式管理办法》(财政部令第74号),国务院于2015年发布《中华人民共和国政府采购法实施条例》,2017年发布修订后的《政府采购货物和服务招标投标管理办法》(财政部令第87号),新法新规的实施对规范政府采购当事人的采购行为,加强对政府采购货物和服务招标投标活动的监督管理,维护当事人的合法权益起到重要作用,也为采购人和监管部门带来更大的监管责任和压力。
对不同的案例标签和其中包含的关键词分类,构建政府采购行业的案例共词“热点”网络。为体现案例焦点,突出特点,去除词共现网络中词频出现在5次以下的低频低质词,生成如图3所示的关键词云图。
从图3中可以看出以下三个特点:一是制度明确,监管部门对所有判决做到有法可依,各项法律法规出现的词频最高;二是流程规范,所有投诉和举报事项,均依法调查、正式受理,经过严格的调查取证后,作出处理决定;三是热点集中,货物和服务类招标是案件高发区,竞争性谈判在非招标采购方式的采购执行中存在较多问题。
图3 案例关键词云图
基于聚类的实验结果和共词网络,开展分类实验,优化后的结果将公告内容分成8个类别,综合8个类别归纳成4个大类,分别是投诉、举报、检查、和其他,图4展示了归类规则和层次关系。
图4 案件来源分类比例图
根据内容类别发现,监管部门在各项执法检查中发现问题,从而发布处理决定的,在4大类中占比最高,达到46.6%;在案件受理后,监管部门开展了多方调查和项目检查,特别是在2017年加强了在对投诉案调查处理环节中的审查,由此发现的违规情形数量在总投诉数量中接近1/3的比例,说明部分采购活动的开展过程存在潜在违规行为。其次是投诉的数量达到31.4%,且多数诉至监管部门的原因都是因为供应商对采购人或采购代理机构的质疑答复不满,以此原因提出的案件占比为31.5%;采购人和供应商的直接举报案件近年呈现小幅上涨趋势,占比为19.2%;由于举报案件,开展的监督检查数量占比总数量将近一半。其他公告内容还包括了对代理机构的考核名单公告和通知公告等。可喜的是,大力监管收获巨大成效,在2015年的专项检查中发现的各类问题在2016和2017年明显减少和消除。
共词热点发现聚焦问题,案例来源感知案例态势,然后具体关注涉案事项,方能发现问题根源,总结判例要旨,提高监管质量。根据案例基本情况和投诉举报内容实证分析,整合权威监管部门的决策结果,从图5的堆积折线图可以看出,问题集中在非合理性的超低价中标、串标围标、厂家未授权或多家授权、存在不良记录或违法记录的企业中标、评审专家抽取不规范、评审过程不合规、虚假应标、以及招标文件编制不合理八个事项。近两年最明显的事项增长出现在了涉及招标文件和虚假应标这两方面。
图5 历年累计涉案事项统计分布图
3.4.1 招标文件涉案较多
涉及招标文件事项的投诉案例最多,是投诉事项的“重灾区”。根据判决意见显示,仅有23起最终因缺乏事实依据,驳回投诉。处理意见充分体现了招标文件的规范制定对规范采购行为,减少采购不良风险,提高采购质量起到关键作用。招标文件的投诉事项,主要分为两个方面:—是采购需求的制定,集中出现在部分指标不能实质性响应招标文件的情况;存在倾向性等情况;部分招标文件未列明政府强制或优先采购节能、环境标志产品要求;还有对供应商需提供的资质和相关证书的设置上,具有条件限制条款等。二是评分标准的制定,部分招标文件对分值未量化[9],或存在评审标准中的分值设置未与评审因素的量化指标相对应的行为,有11个案例涉及此问题;出现了在价格分计算时以投标人报价算数平均值作为基准价进行价格打分、未给予小微企业产品价格扣除等情况;还有将投标人资格条件作为评分因素等。
3.4.2 虚假应标数量增长
以供应商虚假应标为由提起的案件数量逐年递增,特别是在2017年出现骤增,全年出现25起,特别是3月和7月,分别发生6起;然而此类事项在2015年及以前一共14起;涉及虚假应标的案件累计发生62起,经监管部分查证后以缺乏事实依据驳回的案例仅13起,这意味着近80%的案件存在供应商明显违反政府采购诚实信用原则、提供虚假材料谋取中标的情况,需要采购人和相关代理机构引起高度重视,在评审中加强监管,提高核查力度。
3.4.3 加强代理机构监管
财政部的检查中还发现了关于代理机构的问题,一方面是采购公告问题,多数问题集中在政府采购信息公告内容不完整、中标公告的发布日期与中标通知书发出日期不一致、存在延长开标时间的变更公告发布时间不符合规定期限的情形、存在未在省级以上财政部门指定的媒体上发布政府采购信息的情形等。另一方面是采购执行中存在招标文件售价过高、招标公告与招标文件内容不一致、采购文件中规定保证金可以以现金形式支付、保证金的收取数额超过采购项目预算比例、逾期退还保证金等问题。目前越来越多的采购人委托采购代理机构开展政府采购业务,故对采购代理机构的专业化服务和自身约束的行为规范提出更高要求,避免投诉举报事项的发生,保障采购计划顺利实施。
期待获取更多的政府采购数据,开放多元数据平台和接口,将大数据技术渗透在政府采购行业的全流程。基于宏观经济数据、法律法规、同类采购项目执行情况等的多维数据综合分析,发现行业的规律性趋势、影响因素、先行指标等,构建行业发展的趋势预测模型[10];多层次的数据验证,有助于提高采购人对供应商和代理机构的监管水平,以技术手段把握失信、违法等判定的实时情况,审核供应商资质,对虚假投标、围标串标等现象,提前预警,准确评估供应商的产品质量和服务水平,从而有效规避违法案件的发生;文本分析采购人对供应商的反馈评价信息,便于及时发现和解决问题,落实采购实践,提高采购质量。
强化事前监督,严格源头管理,强化全体采购相关参与人在政府采购全流程环节主体责任,加强内部管控,优先内部质疑,率先防控风险,规范行为,从源头上减少外部质疑的发生,切实做到让政府采购项目经得起质疑[11]。数据开放促使先进技术可以全面感知不同采购人的多样化需求,及时作出具有针对性的响应,从而实现供需之间的良性互动[12]。权威监管部门以此构建的科学政府采购评价体系,有助于提高资金的使用效率和透明度,引导政府采购工作科学开展,实现技术驱动、精准服务。
政府采购品类的不断增加以及市场加速发展,共同促使产品专业性越来越强,“答疑”“释疑”的难度也在增加。采购人应练好内功,不断提高业务水平,增强运用专业知识处理政府采购实务的能力,整合数据、优化流程,利用技术手段改善人力资源局限[13],提高政府采购管理水平,全面提升更有效的决策信息支持,合力提升政府采购监管质量,提高政府采购工作效率,推动政府采购更加规范透明,服务市场主体全面发展。
本文是大数据分析技术融合政府采购行业数据分析的创新实践。依托财政部政府采购处理案例,以技术手段构建风险防控策略分析模型。结合案例中的热点问题,提出面向“放管服”的风险防控策略建议,实现了以现代化技术在监管治理的应用,提升了监管质量和采购效率。期待在大数据推动的数据开放、融合共享的新时代背景下,不断加强融合创新,助推政府采购行业的科学发展。
[1] 国务院.国务院关于印发促进大数据发展行动纲要的通知[EB/OL]. http://www.gov.cn/zhengce/content/2015-09/05/content_ 10137.htm.
[2] 国务院办公厅.国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见[EB/OL]. http://www.gov.cn/zhengce/content/2015-07/01/content_9994.htm.
[3] 中国政府采购网.财政部政府采购信息公告栏[EB/OL]. http: //www.ccgp.gov.cn/gg/.
[4] Google. Tool for computing continuous distributed representationsof words[EB/OL]. https://code.google.com/archive/p/word2vec/.
[5] Coates A, Ng A Y. Learning Feature Representations with K-Means[J]. Lecture Notes in Computer Science, 2012, 7700: 561–580.
[6] 郭纲,郭秀娟.政府采购中的投诉举报问题及其对策:以沿海某县级市为例[J].中国经济周刊,2017(40): 78–80.
[7] Dundar A, Jin J, Culurciello E. Convolutional Clustering for Unsupervised Learning[J]. Computer Science, 2015: 1143–1151.
[8] Mikolov T, Karafiát M, Burget L, et al. Recurrent neural network based language model[C].INTERSPEECH 2010, Conference of the International Speech Communication Association, Makuhari, Chiba, Japan, September. DBLP, 2010: 1045–1048.
[9] 张志军,邵月娥.编制采购文件如何避免质疑投诉[J].中国招标,2016(6): 11.
[10] 申孟宜,谷彬.论大数据时代的政府监管[J].中国市场,2014(36): 32–40.
[11] 李外禾.大数据时代涪陵政府采购监管机制研究[J].学理论,2016(12): 68–70.
[12] 于施洋,杨道玲,王璟璇,等.基于大数据的智慧政府门户:从理念到实践[J].电子政务,2013(5): 65–74.
[13] 何哲.人工智能时代的政府适应与转型[J].行政管理改革,2016(8): 53–59.
Exploration on risk prevention and control strategy of government procurement based on big data
JIANG Si, ZHANG Wenlu, LU Junqiang, LI Jianfeng
(Procurement and Bidding office, Beijing University of Posts and Telecommunications, Beijing 100876, China)
By taking the risk prevention and control perspective of government procurement as an example, this paper uses big data technology to analyze the case handling opinions issued by the Ministry of Finance, construct the risk prevention and control system, and to empirically analyze the causes of the problems, and puts forward some tactical suggestions for “Putting in custody” so as to evade risks effectively and improve the efficiency and management level of government procurement, which has important guiding significance for the implementation of government procurement projects in the future.
big data; government procurement; risk prevention and control
F253.2
A
1002-4956(2019)07-0277-05
10.16791/j.cnki.sjg.2019.07.069
2018-12-18
2019-05-10
蒋思(1989—),男,北京,硕士,研究方向为风险管理和大数据分析.E-mail: jiangsi@bupt.edu.cn