以Neo4j为代表的图数据库是以数学中的图论为基础实现的一种新型NoSQL数据库,它通过节点和关系构成一个图结构,在此基础上实现数据库的所有特性,并用图的形式表达数据与数据之间的关系。与传统的关系型数据库相比,Neo4j更擅长海量数据之间的复杂关系分析,具有处理速度更快,表达形式更直观、浅显、简单等诸多优点,近年来被广泛应用于知识图谱、社交网络等领域。在政府采购及招投标审计过程中,审计人员往往需要对参与投标的企业与个人的背景,以及相互之间存在的关系进行审查分析,从而判断是否存在围标串标的行为疑点,图数据库能快速、方便地解决这个问题,而且分析结果直接以图形等视觉化的效果呈现,更加直观。本文以某公立医院设备采购为例,利用图数据库Neo4j的分析功能,通过构建招投标网络分析模型,介绍如何快速检索出投标个人及企业间的关联关系,从而快速锁定疑点项目,为审计人员进一步核实调查提供明确的方向,以求达到“靶向抽检项目、精确锁定疑点”的效果。
在招投标领域,企业互相串通投标的情形较多,违法行为呈现出多样化的形式。《中华人民共和国招标投标法实施条例》第四十条和《中华人民共和国政府采购法实施条例》第十八条分别就投标人之间互相串通投标做出了判定标准和禁止性规定。根据上述两条依据,笔者提取出企业围标串标行为的两条线索特征:第一条是不同投标人委托同一单位或者个人办理投标事宜;第二条是单位负责人为同一人或者存在直接控股、管理关系的不同供应商参与同一合同项下的政府采购活动。
在第一条线索特征下,关注的是在投标过程中,递交投标文件相关个人之间的关系,只要能证明参与某个项目的投标人中有两个或者两个以上从属于一家单位即可判定该项目存在围标串标的嫌疑;在第二条线索特征下,需要关注参与投标的企业间存在的控股与被控股关系,以及企业股东之间的重叠关系,找出两家或两家以上参与同一项目投标的企业间存在关联关系或者股东存在重叠的情况,即可快速锁定审计疑点。
利用图数据库Neo4j的分析功能,构建招投标网络分析,即可快速检索出投标个人及企业间的关联关系,从而锁定疑点项目,为审计人员进一步核实调查提供明确的方向。
图数据库在招投标审计中的应用,关键要明确网络中的节点和关系。在招投标审计中,可以将招投标数据、企业工商登记信息、社保参保信息等多个行业进行管理,构建以投标参与主体为核心的关系网络进行大数据分析。
审计关注的主体即为图数据库的节点。在招投标及政府采购过程中,审计关注的主体即为参与投标的企业与个人。
审计主体之间的关系即为图数据库的关系。在招投标及政府采购过程中,审计需关注的关系主要是参与投标企业与个人之间存在的关系,通常有三类:一是个人与企业之间的从属关系;二是企业与企业之间的控股与被控股关系;三是不同企业股东之间的重叠关系(即一人同时持股两家或两家以上企业的情况)。
采集的招投标数据、工商登记数据、社保参保信息等数据,进行整理,可快速构建出审计网络分析模型,在此基础上完成对数据的分析。
数据分析主要用到的信息如表1。
表1
确定好数据模型后,需要将采集的结构化数据批量导入到Neo4j。Neo4j提供了两种数据导入方法:一是将结构化数据导出成csv格式的文件,然后使用Neo4j提供的Load CSV命令或者neo4j-import工具,将csv文件导入Neo4j;二是采用微云数聚(北京)科技有限公司(Neo4j中国代理)设计的导入精灵工具将数据导入(该工具支持excel和mysql两种格式的数据)。
对于零星数据,可以直接采取Cypher语句的方式,直接创建节点和关系。具体语法格式如下。
(1)创建节点的语句:
这样就创建了三个节点,{}里面的内容代表每个节点的属性。名为公司的节点,含有两个属性,分别是公司名称为甲公司,注册地为武汉市;设备节点的属性是设备名称为彩超,采购单位为甲医院。审计中可以根据实际,对于节点赋予多个属性。
(2)创建关系的语句:
在关系创建语句中,()里面的内容代表的是节点的id,[]里面代表的是关系。通过箭头运算符等,根据经济业务发生的顺序,完成对各节点间关系的创建。例如:甲公司为张三缴纳了社保,证明了两者之间存在的劳动关系;张三代表甲公司于2013年1月1日参与了彩超(该彩超为甲医院采购的)项目的投标。
根据审计需求,笔者选取少量的案例,使用Cypher语句直接将相关数据插入数据库中,并构建出关于医疗设备招投标的网络分析模型。
Cypher语句:
最后构建出的网络分析模型如图1所示。
图1
Cypher语句:
如此得到的查询结果如图2所示。
图2
从图2可以看出,李四的社保由甲公司缴纳,但在投标过程中代表了乙公司进行投标,且甲公司也参与了该项目的投标。隶属于同一公司的不同个人分别代表不同的企业参与同一项目的投标,符合本文前面所述的线索一的特征,该项目存在围标串标的嫌疑。
Cypher语句:
如此得到的查询结果如图3所示。
图3
从图3可以看出,王五同时持有甲公司和A公司的股份,这两家公司同时参与了CT和彩超设备的投标。这说明两项设备的招投标中,甲公司和A公司作为关联公司,分别参加了项目的投标,符合本文前面所述的线索二的特征,存在围标串标的嫌疑。
利用图数据库简单、快捷的关系分析,审计人员可以将经济活动涉及的各类主体编织成一张数据“大网”,利用Cypher语句快速进行深度挖掘,揭示其中存在的某种特定关系。Neo4j不仅可以用于招投标项目的审计,还可用于公职人员经商办企业、违规享受财政补贴、民生资金优亲厚友等违纪违规问题线索核实方面。