■周国亮 杜辰华 万卓敏
2009年以来,全国电子招投标活动不断发展成熟。虽然电子招投标对工程项目招投标中围标、串标现象有一定的约束作用,但是投标人围标串标依然屡禁不止。近几年,随着云计算,大数据分析技术的涌现,这些技术手段在审计中的运用也越来越广泛。现结合审计项目案例,介绍审计人员在电子招投标中如何运用大数据分析等技术来查处工程项目围标串标行为。
根据我国现行法律法规认定投标人相互串通投标的各种情形,结合电子招投标,一般采用的依据主要有以下两个方面:
1.不同投标人的投标文件由同一单位或者个人编制。这类情况指的是投标文件在制作标书时都经过同一人,在电子招投标中,能证明通过同一人制作标书的表现形式有以下两种:(1)多家单位投标制作MAC地址一致,表明多家投标单位的投标文件由同一台电脑制作生成并上传;(2)多家单位的预算书显示同一计价软件、同一份锁号,表明多件投标单位的投标报价由同一个预算员制作生成。
2.不同投标人的投标文件异常一致或者投标报价呈规律性差异。这类情况则需要对投标中的预算书进行分析,需要对预算书中具体的分部分项工程项目清单计价表、综合单价分析表、主要材料及价差汇总表、措施费项目清单计价表等进行分析对比。参与围标串标的投标单位做出的预算书往往出自同一人,虽然最终的投标报价不相同,但是同一个预算员做出的不同的预算书往往有着紧密的联系,而能证明不同单位的预算书是通过同一人制作标书的表现形式有以下三种:(1)清单子目下的定额子目雷同;(2)人工工日、材料数量、措施费等等成规律性差异;(3)清单工程量、材料市场价等错误相同。
首先,从公共交易资源中心采集工程项目的所有电子招标数据,通过分析,每家单位的投标文件中能为审计围标串标提供有效证据文件一般有三个:(1)TB.xml文件。此文件中记录了该标书从投标单位制作招标文件开始传送至公共交易资源中心的基本信息。包括工程项目的基本信息,上传标书的IP地址,制作标书的MAC地址等;(2)JJB.xml文件。此文件中记录了标书中经济标预算书的制作锁号,每一条清单详细子目等;(3)工程量清单.pdf文件。此文件中记录了标书中预算书中的所有组成,包括分部分项工程项目清单计价表、综合单价分析表、主要材料及价差汇总表、措施费项目清单计价表等报价表。
通过SQL语句筛选出所有通过公共资源交易中心招投标的投标单位中经常结伴进行投标的施工单位,作为有围标串标的疑点单位。当大量经常结伴投标的施工单位参与了某工程项目投标时,该项目极有可能存在围标串标的现象,应确定该为审计重点。
现以某市公共资源交易中心工程项目为例。首先,利用SQL查询语句,将经常结伴的投标单位筛选出来,语句如下:
SELECT First(项目结伴情况表.[单位名称 1]) AS[单位名称1字段],First(项目结伴情况表.[单位名称 2]) AS[单位名称 2 字段],Count(项目结伴情况表.[单位名称 1]) AS 结伴投标次数
FROM 项目结伴情况表
GROUP BY 项目结伴情况表.[单位名称 1],项目结伴情况表.[单位名称2]
HAVING (((Count(项目结伴情况表.[单位名称1]))>1) AND ((Count(项目结伴情况表.[单位名称2]))>1));
将结伴20次以上的施工单位作为疑点单位,再将2016~2017年某市通过所有通过电子招标的工程项目中参加投标单位出现这些疑点单位次数进行统计,降序排序得到表1:
表1 某市2016~2017年工程项目疑点单位参与投标次数统计表(部分)
经分析,ABCDE等5个工程项目中有大量的疑点施工单位参与投标,极有可能存在围标串标的现象,因此作为审计重点关注项目。
投标文件上传的MAC地址是网卡在计算机出厂时,厂商烧于网卡芯片内的12位的16进制数字,用于标识每一个网卡的,全世界没有一个相同的。因此,不同投标单位应该是独立制作并上传投标文件,MAC地址都是不相同的。反之,一旦出现多家单位投标书MAC地址一致的情况,则表明由同一台计算机制作生成。
现以A项目为例,提取A项目的所有投标单位的TB.xml文件。该文件不是常规的数据记录文件,且每个投标文件都只有一个TB.xml文件,需要利用计算机辅助从中提取出MAC地址有效数据,进行数据分析。
(1)搜索出文件夹下所有 141个TB.xml文件,复制并放入同一文件夹中,在同一文件夹中新建XMLtoExcel.xlsm文件,用excel文件打开并利用宏将141个xml文件转换为excel文件并进行合并。
(2)合并之后,筛选出有效的行包含有“单位名称”以及“Machinekey”,单位名称就是投标单位的名称,Machinekey的前十二位字母与数字组合就是投标单位制作标书的MAC地址,一般利用excel文件的left函数和筛选功能,即可得出有效数据,工作量较大时也可利用数据库和SQL查找。
(3)最后利用excel文件中的计数函数 countif找出MAC地址出现过两次或者两次以上的单位。如表2,ZJKY集团有限公司、HNZD建设集团股份有限公司两家公司的MAC地址均为“0862****A0BD”。
表2 A项目经筛选后MAC地址表
预算书的制作锁号,是预算员制作标书时的软件加密锁的一串字母与数字的组合,是软件公司制作软件加密狗的唯一标示。同一软件公司的加密狗对应的加密锁号都是独一无二的。因此,不同投标单位应该是独立制作投标文件的预算书,预算书的锁号都是不相同的。反之,一旦出现多家单位投标书的预算书锁号一致的情况,则表明由同一公司的预算员制作生成。
再以A项目为例,提取A项目的所有投标单位的JJB.xml文件。该JJB.xml文件也不是常规的数据记录文件,该文件记录了制作标书的锁号以及经济标所有的投标报价,每个文件锁号信息都显示在文件的前几行。因为每个投标文件都有一个JJB.xml文件,且每个文件中数据量巨大无法用上述提取MAC地址的办法进行数据提取,需要利用更有效的办法进行有效数据提取,进行数据分析。
(1)搜索出文件夹下所有 141个JJB.xml文件,复制并放入同一文件夹中,在同一文件夹中新建txt文件,利用数据库语句ren*.xml*.txt,再将文件修改为bat文件运行,将所有的xml文件转换为txt文件。因为锁号的信息文件只出现在前几行,因此再新建txt文件,利用以下SQL语句并将文件修改为bat文件运行提取出所有锁号信息,也可利用导入数据库SQL筛选查询,语句如下:
(2)将合并后的txt文件用excel软件打开,利用和筛选MAC地址一致的方法,将相同锁号的信息筛选出来,最终找到锁号相同的投标单位。如表3,HNSDSGC有限公司、FJSLC建设集团有限公司两家公司投标文件均由共有计价软件生成且制作标书的软件锁号均为“V2****17”。
表3 A项目经筛选后软件锁号表
一位预算员从拿到招标文件的工程量清单到最终形成的投标文件的分部分项工程项目清单计价表,往往需要通过清单项目特征描述,再结合施工图进行工程量计算,对每条清单子目套定额组价,最后才形成投标文件。虽然对于有的清单子目,不同的预算员可能套出相同的定额子目,但是每个预算员往往因为对清单特征描述的理解不同以及组价习惯的不同,不同预算员生成的预算书中综合单价分析表中的定额子目应该都存在一定的差异。反之,如果多家预算书中上百甚至上千条的定额子目都套用都雷同,可以认定这几家单位的预算书是由同一位的预算员制作生成。
再以A项目为例,提取A项目的所有投标单位的工程量清单.pdf文件。因为每个单位的投标文件中都有工程量清单.pdf这个文件,且其中包含的各种表格有大量的数据,需要将这些数据全部导入数据库中,利用SQL语句查询,筛选出围标串标的单位。
(1)将所有投标文件中的工程量清单.pdf文件先转换成excel文件,找到每份工程量清单中的综合单价分析表,将每条分析表中有效的字段导入数据库,需要导入的关键字段有:投标人,项目编码,项目名称,定额编号,定额名称等。
(2)利用SQL语]进行如下查询:
SELECT 子目表.[项目编码],子目表.[项目名称],子目表.[定额编号],子目表.[定额名称],子目表.[投标人]
FROM子目表
WHERE (((子目表.[项目编码]) In(SELECT[项目编码]FROM [子目表]AsTmpGROUPBY[项目编码],[项目名称],[定额编号],[定额名称]HAVING Count(*)>1 And [项目名称]=[子目表].[项目名称]And [定额编号]=[子目表].[定额编号]And[定额名称]=[子目表].[定额名称])))
ORDER BY 子目表.[项目编码],子目表.[项目名称],子目表.[定额编号],子目表.[定额名称]
从中筛选出同一清单子目下套用同一定额子目的重复数据,再进一步统计重复次数,利用SQL进行如下查询:
SELECT[查找 子目表 的重复项].投标人,count([查找 子目表 的重复项].投标人) as重复次数FROM[查找 子目表 的重复项]group by[查找 子目表 的重复项].投标人
得到同一投标人在141家不同标书中,出现清单子目相同的情况下项目名称、定额编号、定额名称与其他投标人重复的次数,降序排序得到重复次数最多的前几家公司。如表4,ZYJS集团有限公司、GDSYT工程有限公司、NCSLQ工程有限公司、HGYHD建设工程集团四家公司定额子目重复次数均达到294次,经对四家公司投标文件的综合单价分析表中进行逐条对比,四家公司所采用的定额子目和估价子目名称及编号完全一致,且其中ZYJS集团有限公司为最终的中标单位。
表4 A项目各投标单位定额子目重复统计表(部分)
在有的招标文件有时候不需要提供综合单价分析表,这样看不到定额子目的明细无法通过上述方法分析。一位预算员要从同一份预算书形成报价不相同多份预算书,往往采取修改管理费率、利润率、综合单价或者工程量乘以一个比例等等方法。这样从表面上无法看出多份预算书的差异,因为每个分部分项工程都有定额规定的费率且费率不相同,这样形成的每个清单子目单价也不会成固定比例。但是定额中规定“安全文明施工费”和“规费”作为不可竞争费,不允许修改费率。而其中的安全文明施工费又是通过定额直接费中的一项或者几项取固定费率形成。同样的“主要材料及价差汇总表”的人工工日及材料数量也是直接从每条定额含量中直接汇总得到。因此这几类指标在不同预算书一般都是不相同的。反之,一旦发现这几种指标在不同预算书表现出相同或者成固定比例,可以认定是由同一位的预算员从同一份预算书制作生成。
现以B项目为例,利用上述同样方法,将所有投标单位的主要材料及价差汇总表、措施费项目清单计价表等全部导入excel中,利用简单函数语句查询,筛选出围标串标的单位。
(1)将所有投标文件中的工程量清单.pdf文件先转换成excel文件,找到每份工程量清单中的主要材料及价差汇总表,将每条分析表中有效的字段合并为同一excel文件中,需要导入的关键字段有:项目名称、各公司投标报价或工程量等,本文截取部分数据,实际工作量较大时可利用数据库和SQL查找。如表5:
表5 B项目各投标单位主要材料及价差汇总表(部分)
(2)利用CORREL函数将公司两两进行相关性比对,得出E、G两家公司的线性相关性很高,如表6:
表6 B项目各投标单位之间工程量线性相关性表
再将E、G两家公司的数据单独逐条对比,发现所有工程量均成固定比例1.04,如表7:
名称 单位 E公司工程量 G公司工程量 比例值综合工日 工日 6472.678 6207.172 1.04机械人工 工日 1077.984 1033.185 1.04水泥32.5 kg 11709.664 11243.042 1.04
表7 B项目E、G两家投标单位之间工程量对比表
同理,措施费项目清单计价表也采用同样的办法查处工程量或投标报价成固定比例。
6.确认清单工程量、材料市场价等错误相同的方法。
工程量的计算以及材料市场价都是由预算员直接输入得到。工程量的计算依据施工图,材料市场价依据造价站每个月发布的材料信息价或者通过市场询价得到。这两类数据如果形成较大差异,一般由于预算员人为失误操作或者主观上需要不平衡报价。不同施工单位的预算书这类指标即使错误,往往不会错的相同。因此,一旦能发现这几种数字在不同预算书表现出错误相同,可以认定是由同一位预算员从同一份预算书制作生成。
现以C项目为例,将每家公司的主要材料及价差汇总表中的项目名称以及材料单价导入数据库,该工程的招标时间为2016年4月,故再将2016年2~4月的项目所在市造价站发布的信息价也导入数据库,利用SQL语句查询,将报价不等同与信息价的所有公司的材料报价查询出来,发现四家公司在碎石60mm、C25非泵送预拌砼两个材料单价上,既不等同于当期市场价,却又一致相同。如表8,JXST工程有限公司、GZBD公路有限公司、JXTW公路建设集团有限公司、JXGLGL交通工程公司四家公司投标文件的主要材料及价差汇总表中碎石60mm、C25非泵送预拌砼材料单价错误相同,表现异常一致。
表8 C项目筛选后投标单位投标报价表
大数据审计具有鲜明的大量化、多样化和快速化等特点,电子招投标中采用大数据方法审计,不仅大量节省了审计成本,还将原来一些难以认定的情形实现了具体可操作化,提高了审计质量和效率。在实际审计中,审计人员应同时结合传统审计方式,从资金、人员等方面入手,进一步查证是否存在不同投标人的投标保证金从同一单位或者个人的账户转出、不同投标人委托同一单位或者个人办理投标事宜、不同投标人的投标文件载明的项目管理成员为同一人等围标串标情形,巩固完善审计证据链。