汤 骏 南通市公共资源交易中心,南通 226001
一些评标办法对于主观性指标(比如文明施工、节能环保要求)的评审项没有具体的评审标准(一般给出一定幅度的分值范围),在有限的评审时间内,评委只能依据自身的经验和感性认识匆忙给出分值。在实践中,就发现同一工程的不同标段,同一个投标企业得到的分数存在明显偏差的不正常现象,这是难以令投标人信服的结论,也常常引发质疑投诉。
评委的考核管理机制不健全也是导致评审乱象的原因之一。一些地方对于专家评委管理流于形式,长期不进行专业知识培训和继续教育,没有科学健全的考核退出机制,导致部分专家评委专业能力下滑。评审实践中,一些评委因不能透彻理解招标文件,不能知晓国家的招投标政策新政导致的误评、错判现象比比皆是。还有一些专家缺乏职业操守,甘于被围猎,成为某些特定企业重点关照的对象,在评审时打出“人情分”“关系分”,评审结论缺乏公正性。
专家资源不足、分配不均衡也是困扰基层公共资源交易机构正常开展工作的重要因素,尽管一些地方采用“远程异地评标”方式一定程度上弥补了一些短板,但是总的成效不明显,尤其是一些稀缺专业,专家评委人数过少,难以满足随机抽取的需要,招标人不得不“变通”采用相近专业的评委来代替,评审质量大打折扣。
独立公正评审是确保评标工作有序开展的重要前提,然而事实上,外界干扰因素不在少数。一方面评委本身有其利害相关的利益诉求,另一方面,评审工作还可能受到招标人的明示或暗示,有关部门领导的委托和招呼,这些外来影响对于独立开展评标工作都是不利因素。
智能合约是存储在区块链网络(每个参与者的数据库)中的一段代码。它界定了各方使用合同的条件。当且仅当触发合约条件,合同才能自动执行。智能合约运行在以太坊的虚拟机EVM中,可以调用其他的智能合约,也就是具备“自治代理”的能力。它具有以下几个特征:
(1)去中心化。智能合约在以太坊网络的全部节点中被拷贝和分配,具备典型的“去中心化”特点。
(2)自动化。智能合约能够自动实行各种任务,未达到智能合约的触发条件,它将维持“休克”状态,不会实行任何操作。
(3)不可篡改。智能合约一经部署,就无法更改。除非预先设定了边界条件,才可以实行“调整”操作。
(4)无需信任。合约协议各方能够利用智能合约开展互动,而不用相互了解或取得信任。此外,区块链技术可确保数据准确无误。
表1 智能评审与人工评审评价指标对比表
相较于人工评审,智能合约技术应用到招投标评审中去有着人工评审无法比拟的优势,主要体现在以下四个方面:
(1)独立、公正。智能合约的执行过程完全依靠事先编译好的计算机代码,不受任何外界条件的干扰,能确保评标始终在独立公正的条件下进行。
(2)精准、高效。智能合约不会出现人为差错,也不存在评审质量不稳定、不均衡的现象。评审效率极高,不可能出现因评委资源不足而延迟评标的情形。
(3)费用低廉。智能合约部署到区块链中尽管要消耗少量的“资产”(以太币),但是相比专家评委的劳务费不值一提,为招标人节约了大量的评审费用支出。
(4)公开、透明。由于智能合约依托于公有区块链,因而其源代码不仅不可篡改,而且对任何人都是透明的。因此,如果不涉及到商业秘密,智能合约评审的评分过程、判定依据甚至可以全方位向社会公开,这是当下人工评审所无法做到的。
表1列出了智能评审与人工评审两种方式有关评审指标的比较情况。
招投标行业应用AI技术参与评审还处在初级阶段,且未能向投标文件的“语义智能判断”等高难度领域涉足,至多只能称之为“机械评审”,离能够模仿人类大脑思维的“智能评审”目标相去甚远。智能合约实现无人评审的流程示意图如图所示。
智能合约实现无人评审的流程图
以建设工程施工项目评审为例,投标文件中的客观性评价指标(比如企业的资质等级、业绩成果、注册资金、年产值等),计算机很容易处理,一般只需要进行“关键字”对比就能完成评定工作,且误报率极低。而智能评审面临最大的障碍就是对投标文件中主观内容(比如施工组织设计)的评价是否真的像专家评委那样客观公正,因此必须要结合深度学习、智能合约等多项新技术,才能实现上述目标。
3.1.1 基于深度神经网络建模的评分模型训练
深度神经网络可以应对更复杂的数据集并利用其多层次结构来更好地概括出先前从未见过的数据,故此称之为“深度”。多层次的结构使其相比线性模型能够容纳更多的数据。
深度学习模型训练步骤主要有以下四步:
(1)数据预处理。应当在海量的投标文件样本中进行分类,对人工专家评审意见进行标注,尤其是样本集切分要合理,一般应当保持80%用于训练,20%用于测试,要特别注意测试集合不要重采样,防止训练工作量太大。建设工程施工招标项目的样本主要还是对“施工组织设计”方案文本的训练,其他内容多为客观性内容,无需参与训练。
由于投标文件样本质量不高、数量不充分、定标规则不合理等因素将直接导致模型训练难以达到预期效果。因此,这一步是评分模型训练的关键,也是整个智能评审工作成败的关键。
(2)前向传播(Forward Propagation)。将数据输入神经网络(神经元先加权累加再输入激活函数输出值)正向传播,得到得分,再将“得分”输入误差函数loss function(正则化惩罚函数,防止过度拟合),与期望值比较得到误差,通过误差判断识别训练的鲁棒性。
(3)反向传播(Backward Propagation)。反向传播就是求梯度。目的是用梯度下降法来对参数进行更新,而更新就需要梯度。这样就通过梯度向量来调整权值,使“得分”误差趋于极小值。
需要强调的是,参数选取一方面要参考招标文件中的评分标准,另一方面还要充分考虑建设工程项目的具体特点,以能够全面、客观反映投标企业的综合能力为原则,组成定标集合数据集并合理配置权重。
表2列出了建设工程投标文件中“施工组织设计方案”训练文本参数集合建议,大致可以将这些指标分为控制性、评价性和参考性指标,这样做的好处是便于在参数调整过程取舍适当,既防止“欠拟合”,也避免“过拟合”。
目前,对于施工组织设计方案文本宜采用半监督学习的方法实现专家语料标注和深度学习训练,主要步骤如下:
表2 建设工程投标文件施工组织设计方案样本训练参数集
(a)先对经挑选的“优异”文件施工组织设计方案文本的语料进行专家的人工标注;
(b)使用机器学习训练模型如SVM、LR对已经标注的语料训练,把未标注的语料作为测试集;
和顺县的辐射水源井主要是远离河流集取地下水型,以小泉小水为水源的农村饮水安全工程,可通过实施水平辐射把漏失的泉水和未开发的散泉集中起来,增水效果十分明显,比如横岭镇的龙旺村、阳照村等,尤其适宜厚度较薄的含水层以及不易用渗渠开采的厚度薄、埋深大的含水层。主要优点:(1)山区辐射井水源工程多为引水工程,管理方便,运行成本较低。(2)集水范围大,含水层厚时可多层设置集水孔,此水水质优良且水量稳定,受季节影响较小。
(c)为测试集样本产生标签及置信度(即标签的准确性的概率值);
(d)通过观察为置信度设定一个阈值(须反复调整),当样本中的每个分词都满足这个阈值时,把这个自动标注好的测试样本加入到训练集中,在测试样本中取出这个样本;
(e)重复2~4步,直到剩余的测试样本中没有完全满足阈值的样本;
(f)输出剩余的测试样本。经过这样的训练过程,计算机基本具备智能评审文件的语义条件。
(4)重复上述过程,直到设定次数(损失误差)的平均值不再下降(最小值)。
深度学习的关键是数据标注前,标签体系设定要合理、用于标注的数据集需要无偏、全面、尽可能均衡。目前制约智能评审的一个重要因素是投标文件有效数据集太小,深度学习容易产生过拟合。另外,数据集没有局部相关特性也是一个影响因素。从提高训练泛化能力的需求来看,公共资源交易机构只有跨区域、跨部门合作,形成丰富、充足的样本库才能有效地解决训练集不均衡的问题,这也从另一个侧面反映了只有打破数据壁垒,走区域合作之路才能发挥科技对于公共资源交易的巨大推动作用。
3.1.2 智能合约协议代码的部署、编译和运行
以太坊社区开发并开源了在线Solidity集成开发环境Remix,可以方便地在Remix中编写、部署、测试智能合约,Remix具有自动完成,语法高亮,实时编译检查错误等功能。
(2)账户准备、创建和转账。以太坊是有账户的,每个用户都可以开设账户,账户余额是拥有的以太币或其他基于ERC20标准的通证。以太坊有两种账户一是外部账户(externally owned accounts),由密钥控制,二是合约账户(contract accounts),由智能合约的代码控制。
以太坊的区块中存储的实质上是一种交易(transaction)行为,因此部署智能合约至少需要一个外部账户(可用于招投标双方费用结算)和一个合约账户(用于部署智能合约)。外部账户可以触发交易,而合约账户不能主动发起交易,只能在被触发后按预先编写的智能合约代码执行。创建外部账户不需要花费,但是创建合约账户需要支付一定的Gas,而且合约钱包中的任何操作都是需要支付Gas(Gas是以太坊智能合约执行所需的“钱”。每执行一个命令就会有一定的“钱”被消耗,这个“钱”用Gas作为单位,不同命令消耗的Gas数量不同),其原因在于执行这些合约需要花费以太坊网络中宝贵的计算时间和存储资源。
账户创建完成以后要进行以太币挖矿操作(否则无法完成交易),挖矿效率受到全网算力、收益分配模式、矿机能耗比、币价等因素影响,可以通过专门工具进行挖矿,也可以通过线上交易直接购买以太币。在以太坊中,还可以使用estimateGas方法来估算一个交易要消耗的gas消耗量,然后再根据需要购买。
(3)代码编写。智能合约代码编辑器可以使用Visual studio code(下载Solidity插件),也可以选择Ethereum官方开发的remix在线编程环境(URL:http://remix.ethereum.org/)。
3.1.3 智能评分
完成了深度学习和智能合约的部署上链,就可以嵌入现行的电子评标系统进行智能评分,评分过程的执行效率主要依赖于智能合约本身的复杂程度,也就是区块链环境里面可执行的代码集。还要注意,发布智能合约的时候需要消耗一定的通证(GAS),而消耗通证的数量是根据智能合约的难度来决定,就是说这个智能合约的处理逻辑越长、越多,那么消耗的通证就越多。从HUOBI(火币)、OKEX.ME等主流交易平台公布的实时价格(2020年7月30日上午9时)来看,单价为2221元/ETH(买一价),经过大致估算,一个普通的建设工程招投标智能合约从创建账户到部署合约直至完成评审,大约需要花费50~80的Gas(与合约的节点、存储方式、算法、复杂程度都有关),按照1GAS=0.00900ETH=19.98元计算,一次评审大约需要花费1000~1600元(价格单因素评标办法花销会少一些)。
评分过程中,计算机可以给出具体的评判依据,如果不涉及到不适宜公开的商业秘密,那么可以将计算机的评分过程在中标公示阶段向社会公开,这个实际上也是智能评审将评审过程予以公开,接受各方监督的过程。
相比于人工评审,利用智能合约技术进行机器评审的成效主要体现在以下三个方面:
(1)解决了独立评审的问题
智能合约技术最大的特点就是“去中心化、自动执行”,它不存在人工评审尺度不一、人为疏漏和显失公允、偏颇的问题,能确保实现真正意义上的独立评审。
(2)解决了评委资源不足的问题
智能合约技术应用在评审工作中能显著提升工作效率,专业也不受任何限制(样本充足、训练有效的前提下),评审质量均衡而稳定,评审费用较低,实际就是同步解决了因评委资源不足带来的多个“后遗症”。
(3)解决了评标信息保密问题
智能合约技术的引入还能根治长期以来评标信息难以做到严格保密的“顽疾”。智能评审不存在提前抽取评委的过程,评标工作在开标过程完成以后立即开始,没有提前量,也不存在回避情形,投标利害相关人根本无法干扰评审工作的正常进行,整个评审都在“无密可泄”的计算机代码执行环境中独立运转。
总之,智能合约技术在评审工作中的应用,实质上是用经样本训练过的计算机代码来模仿人类大脑逻辑思维的过程,能够克服“人性的弱点”。