汤 骏
(南通市公共资源交易中心(南通市政府采购中心), 江苏 南通 226001)
评标是招标采购活动中最关键的环节之一,也是最易引发质疑和投诉的环节之一。由于评标主要依靠人的主观判断,易受评标专家能力不够、经验不足、态度敷衍,以及外界干扰等诸多不利因素影响,导致评标结果不公正、不公平现象一直存在且难以有效根治。加之实施“放管服” 改革以后,招标采购参与门槛进一步降低,企业参与投标的便利度大大增加,投标数量暴增,造成评标工作量超负荷,客观上导致评委在有限时间内难以精准地给出评标结论。如何借助人工智能技术克服和纠正不恰当的人为因素问题,遴选出实力强、信誉好、综合素质优的投标人,既充分发挥评标专家的专业经验和技术优势,又可防止专家随意行使自由裁量权,切实提高评标质量,已成为招标采购管理部门迫切需要解决的重要课题。
国内研究者在智能评审领域已有一些初步探索,如卢晶等[1]通过将供应商结构化响应数据与评标办法相结合,设计了辅助专家评审的应用工具,实现阅标记录、关键参数自动对比、详评自动算分等功能;王佩光等[2]提出采用主成分分析方法获取影响企业信用等级的主要影响指标,将指标及对应的企业信用等级作为样本集,从原始样本集有放回的生成随机树训练集,建立企业信用评估的随机森林模型,并通过投票方式获得企业信用等级等。
上述方法有一定的适用性限制,因此改变以往全量化评标的传统做法,探索差别化评标具有较强的现实意义。
所谓全量化评标是指评标专家按照招标文件规定的评标程序、方法和要求,对全部投标文件逐项进行评审,并结合规范及经验给出定性或者定量结论的过程。按照评标程序和工作流程,通常先进行形式评审,再进行初步评审,最后详细评审,既不会缺省步骤,也不颠倒顺序,这是招标采购行业当前的通行做法。
所谓差别化评标是指通过比较待评审投标文件与历史投标文件,剔除已经形成评标结论的部分(即不再对两者之间相同的要素进行评审),只对新增或者调整的内容进行“增量评审” 的过程。这种差别化评标方式可能会缺省步骤,也可能不按固定顺序进行评标。
差别化包含两层含义:一是评标起点的差别。对于全部投标文件而言,由于大多数投标人已有部分历史评标记录(除非是首次参与投标的企业),因此评标可能不是从形式评审开始,而是从初步评审甚至详细评审开始,这与全量化评标从零开始的做法有明显差异;二是评标关注点的差别。不同投标人的投标文件与其历史投标文件比较,产生的待评审(即增量评审)内容不一致,评标专家对于不同投标文件评审的关注点也就不尽相同,如有的投标文件需要重新复核其资质、业绩,有的投标文件只需要评审其施工组织设计方案即可。差别化评标的运行原理见图1。
图1 差别化评审原理图示
差别化评标是招标采购领域的全新概念。虽然我国招投标法律体系中没有类似定义,但是从逻辑推演和实践应用来看,差别化评标有理论依据和现实基础。
1.2.1 差别化评标的理论依据
我国一直推行招投标文件标准化管理,国家发展改革委、有关的行业主管部门针对资格预审文件、招标文件、投标文件、合同文本等均制订了统一示范文本。这些制式文本在要素构成、顺序结构等方面有固定格式和明确规定,为推行差别化评标提供了有利条件。对于企业而言,尽管招标项目千差万别,但每一次投标需要提供的基础材料均雷同。例如,《中华人民共和国标准设计招标文件(2017 年版)》(以下简称《标准设计招标文件》)规定,投标文件包括8 项内容:(1)投标函及投标函附录;(2)法定代表人身份证明或授权委托书;(3)联合体协议书;(4)投标保证金;(5)设计费用清单;(6)资格审查资料;(7)设计方案;(8)投标人须知前附表规定的其他资料。上述8 项材料中,除第6 项“资格审查材料” 和第8 项“设计方案” 会因项目不同而作调整以外,其他材料均无太大变化。若待评审项目与已评审项目的规模、类型和质量标准要求一致或者相近,那么“资格审查材料” 也不会有显著变化。评标专家无需将投标文件全部评审一遍,完全相同的部分,可以“不用审” ,局部不同的部分可以“选择审” ,而对于完全不同的部分才需要“仔细审” ,即无需对投标文件各部分平均用力用时评审。
《招标采购“循例评审” 原理和技术实现》[3]中提出一种智能评审新思路——循例评审。其基本假设是,当两个招投标项目的项目特征、招标要约条件和投标响应程度等三个维度信息完全一致时,若同一个投标单位参与投标,其评审结论应该一致(至少是高度相近)。将差别化评标进行量化折算,若待评审项目投标企业的投标文件与历史投标文件完全一致,那么其差别化程度为0,即可通过“循例评审” 方法直接得到评标结论;当差别化程度为100 %,即待评审文本与历史文本无任何相似信息,则需要评委进行全量化评审;当差别化程度为0~100 %,就可通过差别化评标方法进行评审。说明差别化评审相较于循例评审具有更大的适用性,可实现局部或间断的循例评审。
1.2.2 差别化评标的实践依据
根据评标实践,评标专家通常需要在查验投标文件基本信息、鉴别业绩奖项等级、核算工程造价规模等环节消耗大量的时间,而这些在以往项目中已经过评委仔细评审并形成可靠结论。本文随机抽取江苏省南通市近3 年65 个项目2 490份房屋建筑和市政基础设施工程项目的投标文件,经统计测算发现,在项目特征(如建筑面积、层高、跨径)、工艺要求(结构形式、抗震强度)等基本要素相似的招标活动中,同一个企业提供的投标文件在不同的项目中少有变化,企业的资质证书和经营范围等基本信息不变,财务报表、业绩奖项、人员配备、机械台班等内容也均高度雷同,差别主要集中在施工组织设计方案中因不同项目的水文、地质条件变化而需要调整的部分。从投标文件文本的相似度来估算,70%~80%以上的篇幅完全一致,即对于评标专家而言,至少可缩减70 %~80 %以上的评标工作量。即便在项目特征和工艺要求等基本要素有显著差异的不同项目中,同一企业提供的投标文件相似度也超过了30 %(形式评审内容基本都相同),这是非常可观的数字。很显然,投标文件的相似度越高,节约的评标资源就越多。
一是效率高。差别化评标只对本次投标文件与样本数据库中历史文件的不同之处进行评审,其评标工作量大大缩减。据统计,对于一般的投标人而言,在3~5 年的周期内,主要资质等级、重大业绩奖项、主要管理人员的执业资格等方面信息变化很少,大量的形式评审工作量可以直接忽略,有效提升了评标效率。
二是精度高。样本数据库中的历史投标文件已进行过“标定” ,新旧投标文件中相同内容的部分不再重复评审,能有效地避免因不同的评标专家重复评审可能导致的与以往评标结论不一致的结果,确保评标尺度完全一致,评标结论稳定、均衡、可信。
三是成本低。评标的效率和精度获得提升,评标时间大大压缩,招标人支付的评标费用、评标设施和场地的运维费用也相应降低,评标场次周转率明显提升,评标的单位成本大幅减少。
建立差别化评标工作机制,首先要将沉淀的海量历史投标文件及其评审结论资料,按照预先设定的规则分门别类,进行文本信息结构化拆解和提取,并形成样本数据库;再将待评审文本导入样本数据库并进行文本信息要素碰撞、比对或者匹配化处理;最后生成真正需要评标专家人工评审的待评标文本。差别化评标的工作流程如图2所示。
图2 差别化评标的工作流程
投标文件文本信息结构化处理是差别化评标工作的第一步,也是决定差别化评标能否取得成功的最关键一步。结构化处理的目的是将自然语言转化为一种能被计算机理解的形式。计算机快速实现对文本的理解,为下一步文本的比较、筛选、判断和信息提取做准备。我国招标采购大部分已实现电子化,大多是通过专用投标文件工具软件制作生成投标文件,无论是文本目录构成、篇章层次还是字体格式,均具有模块化规制的特点。文本的凝聚度高而自由度很低,有效减少了文本信息结构化处理的难度,也是推行差别化评标的有利条件。图3 是某投标文件自动化制作工具,其具有高度封装性,能使用户使用“搭积木” 方式快速地生成投标文件。
图3 某投标文件自动化制作工具
投标文件有商务标、技术标、报价函三个主要部分。实践中,商务标函所包含的诸如资质证书、项目负责人注册执业证书、安全生产许可证书,以及有关的社保信息、业绩材料与奖项证明、税务缴纳情况、财务报表信息,大多是按照规定格式直接调用或者自动生成,不存在手工编辑、录入的过程。报价函(工程量清单计价文件)也通过专业造价软件生成,基本无需其他结构化技术介入处理。
由于投标文件内容庞杂,特别是技术标函中的“施工组织设计方案” ,投标单位会根据项目的具体特点和工艺要求等进行针对性编撰,因此必须引入自然语言处理技术才能实现文本结构化。投标文件区别于一般的文学作品,经大样本的词典训练,并应用深度学习、知识图谱、语义情感推理技术,可将投标文件文本进行有效的结构化处理。若短期内技术难度太大,或有法律法规不适应的情况,这部分内容可以保留人工评审的做法。
若将投标文件文本信息结构化处理的过程看作是机器学习中的“分类” 过程,那么文本要素信息归集就是“聚类” 过程,即按照预先设定的规则,将结构化拆解后的信息有序归类并形成数据库,以便于分析、比较和信息提取。而这种规则的设定主要依据是招标文件规定的评标程序和评标办法。经归集处理后形成的文本要素信息数据库见图4。
图4 投标文件文本信息要素归集数据库示意
以《标准设计招标文件》为例,一般设计投标文件的文本信息归集处理方式如下:
(1)形式评审标准:投标人名称、投标函及投标函附录签字盖章、投标文件格式、联合体投标人、备选投标方案;
(2)资格评审标准:营业执照和组织机构代码证、资质要求、财务要求、业绩要求、信誉要求、项目负责人、其他主要人员;
(3)响应性评审标准:投标报价、投标内容、设计服务期限、质量标准、投标有效期、投标保证金、权利义务、设计方案;
(4)资信业绩评分标准:信誉类似项目业绩、项目负责人资历和业绩、其他主要人员资历和业绩;
(5)设计方案评分标准:包括设计范围、设计内容、设计依据、设计工作目标、设计机构设置和岗位职责,设计说明和设计方案,设计质量、进度、保密等保证措施,设计安全保证措施,设计工作重点、难点分析,合理化建议等。
完成文本信息的结构化拆分、并按规则生成归类数据集后,可对待评审文本与历史文本进行比对,即进行文本的匹配度(或者说语义相似度)分析。在投标文件文本结构化比较完善的前提下,从难易程度看,匹配方法主要有三种:
一是基于关键词搜索的匹配。这是最简单,也是误判率最低的匹配。例如企业的资质证书等级、项目负责人的执业资格证书、个人社会保险代码等具有唯一性特征元素的比对。关键词匹配的应用场景主要集中在资格、资信评审等环节。当然,关键词匹配过程并不仅停留于“词语” 这个最小单元,可扩展至任意划分的“整体单元” 的匹配和比较,如冬雨季施工方案、噪音和扬尘控制措施等。
二是基于算法的语义相似度计算。语义相似度计算的基本思路是将文本映射到向量空间,利用余弦相似度算法模型等计算两类文本是否相似。当前基于语义的中文文本相似度的算法包括向量空间模型算法(VSM)、隐性语义索引(LSI)算法、奇异值分解法(SVD)等等。这些算法在时间成本及运维效率方面各有优缺点,需要结合实际恰当选用。相似度计算主要应用于短文本比较,例如待评审文本语句是“项目经理担任过省级科研攻关项目负责人并获得创新成果二等奖” ,而数据库中的文本语句是“项目经理作为项目负责人在省级科研攻关项目中获得了创新成果二等奖” ,经相似度模型计算即能判断这两类短文本语义相同。
三是基于深度学习方法的语义推理。更高难度的相似度计算需要运用深度学习方法,包括先验知识、知识图谱等技术的应用。一般要先建立词典,构建训练语料,再通过监督(半监督)方法完成语义的推理和相似度计算。该匹配方法主要应用于大篇幅主观文本的比对,如施工组织设计方案相似程度的比较。如果缺乏完备的词库和足够的语料训练,则由评标专家人工评审更为合适。
实际上,如果文本信息的结构化过程在统一规则下进行,就不存在相似度分析的问题。但是,结构化过程不可能完全规整,一定会有遗漏、差错(语义混乱),因此人工智能技术的介入必不可少。
上述全部标识完成以后即生成待评审文本,计算机将自动出具一份标识差异信息的对比报告,同时列出待评审文本出现在样本数据库中具体的历史记录。如企业提供的某项业绩曾在哪次项目评审中出现,其评审结论是什么等。评标专家可以浏览这些相似字段的历史记录,用于检验计算机提示的重合信息是否存在偏差,是否需要人工修正等等。
计算机形成差别化待评审文本后,交由专家评审。经“过滤脱水” 处理后的待评审文本与原始文本相比,评审内容大幅减少,评审工作量大大降低。专家可更集中精力对照招标文件要求,严格认真地完成剩余部分的评审并给出评标结论。值得注意的是,专家评标结论将作为新的素材载入样本数据库,成为下一次评审的源数据,即每次的新评审内容都将作为新“标尺” 纳入数据库并成为下一次评审的“参照比对答案” ,任何细小差错都会引发连锁反应,对后续评审产生一定影响。
某待评审项目为南通市***会议中心项目,其中一家投标企业是苏州市***建筑有限公司,通过输入筛选条件(一般以项目类型、特征、规模、造价等作为筛选字段)和调用数据库后发现,该单位曾先后于 2018 年 7 月 16 日和2020 年 3 月15日参与投标,相关投标信息如图5 所示。
图5 待评审文本与样本数据库文本信息的寻址匹配过程
从图5 可以看出,计算机完成信息匹配检查以后,待评审文本形成了三部分内容。
第一部分是信息完全重合部分(即待评审信息与数据库信息完全一致),属于无需评审的内容,如本次“南通市*** 会议中心项目” 中,苏州***建筑公司提供的“房建一级资质” 在“西安市***图书馆项目” 中已经提供;项目负责人获得奖项方面,在“淮安市***学校新建项目” 中也有提供,因此“资质等级” 和“近3 年项目负责人获得奖项” 两项评审内容均无需评审。
第二部分是信息局部重合部分(即待评审信息与数据库信息局部相似但不完全一致),需要就两者间存在差异的部分进行复核评审。如本次要求项目负责人有“一级建造师和高级职称” ,但计算机匹配的两个历史项目中投标人提供的项目负责人信息分别是“二级建造师、中级职称” 和“一级建造师、中级职称” ,故仅需要就本次提供的“高级职称” 一项进行复核即可(一级建造师无需复核)。
第三部分是信息未成功匹配部分(即待评审项目在历史文本中未搜寻到任何匹配片段),主要是“施工组织设计方案” 等主观性表述内容。前文提到,这部分内容尽管可以通过自然语言处理技术予以恰当处理,但是毕竟技术还不成熟,且计算机给出的结论是否可靠尚有存疑,一般以评委介入评审为主。统计数据表明,采用差别化评标方式后,评审用时不到两个历史项目平均用时的30%。
综上分析可知,数据库搜集的样本越多,其待检信息与历史信息匹配契合度越高,除首次参与投标的企业(冷启动问题),或企业投标信息发生巨大变化等情况外,运用差别化评标技术能极大地提升工作效率。
当前,合理管控专家评委在评标中的自由裁量权,尽可能通过人工智能方法来克服人工评审的缺陷,确保评审结果稳定、可靠、经得起查验,已经成为招标采购行业的迫切需要。受法律约束和技术水平等因素影响,我国在智能评审方面的研究还很不充分,至今尚未找到理论上可行、实践中可靠,并得到行业内部普遍认可的解决方案。实践应用证明,基于历史样本数据搜索的差别化评标方法,在理论逻辑、可操作性、技术实现等方面优势明显,可实现有条件替代人工评审,有良好的推广前景。