基于数据挖掘的招标代理机构异议信息智能预警

2024-12-04 00:00:00王征王颖薛栋贤
中国新技术新产品 2024年4期
关键词:数据挖掘预警

摘 要:针对异议信息预警精准度不足的问题,进行基于数据挖掘的招标代理机构异议信息智能预警研究。通过清洗、补充、归一化等预处理步骤,提高数据的质量和一致性。使用数据挖掘技术从预处理后的海量数据中提取异议信息特征,减少计算复杂度,进一步关联度分析,识别重要的异议信息,采用卷积运算和误差修正提高异议信息的识别精度。最后,根据信息异议指数确定预警等级,生成预警报告。经试验证明,设计方法F1值大于0.85,错误预警数量占总预警数量的比例<1%,可以提供决策支持和风险管理。

关键词:数据挖掘;招标代理机构;异议信息;预警;归一化;关联度分析

中图分类号:TH 17" " " " 文献标志码:A

招标代理机构的招标代理信息是否合理和科学直接影响项目的经济收益。为了发现存在异议的信息并进行准确评估和预警,招标代理机构需要提升管理信息化水平,并应用智能预警技术。然而,面对大量的异议信息,对其进行有效预警存在困难。有研究者提出将BP卷积神经网络技术与随机森林算法相结合,利用随机森林算法分类异议信息,并使用BP卷积神经网络对信息进行综合分析,识别特征并进行预警分析。然而,BP卷积神经网络的学习能力在迭代过程中逐渐减弱,导致预警结果不准确。采用数据挖掘技术效率高,可以挖掘海量信息的关联关系,被广泛应用于各领域。因此,针对目前的问题,提出了基于数据挖掘的招标代理机构异议信息智能预警研究。

1 招标代理机构异议信息处理

首先,对招标代理机构异议信息清洗,将原始数据格式统一,并将相同字符的数据定义为重复数据。针对重复数据,仅保留一份,删除多余的信息。其次,识别招标代理机构异议信息缺失数据并补充处理[1]。通常情况下招标代理机构异议信息数据具有连续性,且服从正态分布,缺失数据符合以下条件,如公式(1)所示。

x+|v-u|≥3a " " " " " "(1)

式中:x表示招标代理机构异议信息;v表示招标代理机构异议信息数据值的均值;u表示招标代理机构异议信息标准差;a表示空间最近邻异议信息。

将待处理异议信息代入上述公式中,如果公式(1)中关系成立,则判定该异议信息为缺失数据;如果公式(1)中关系不成立,则判定该异议信息为正常数据。将识别的缺失数据用均值填补,完成招标代理机构异议信息缺失值补充处理。

最后对招标代理机构异议信息归一化处理。招标代理机构异议信息种类不同,数据量纲方面存在较大的差异,因此采用归一化算法对招标代理机构异议信息归一化,如公式(2)所示。

(2)

式中:x*表示归一化处理后的招标代理机构异议信息;x*表示缺失值补充处理后的招标代理机构异议信息;minx*表示招标代理机构异议信息最小值;minx*表示招标代理机构异议信息最大值。

2 基于数据挖掘的异议信息特征提取

利用数据挖掘技术对处理后的招标代理机构异议信息进行关联分析,提取异议信息特征。具体步骤如下:将历史异议信息上传到数据库中,构建数据挖掘知识库,知识库中均为异议信息,无正常信息[2]。基于数据挖掘技术,将待分析的招标代理机构信息与知识库中异议信息关联度分析,确定2组信息之间的关联度,根据关联度判断信息样本是否为异议信息以及信息的异议程度,由此提取异议信息特征。

假设构建的数据挖掘知识库为G,从知识库中随机抽选一组完整的异议信息,将其定义为项目集,项目集中异议信息数量为该项目集长度,如果待挖掘的招标代理机构信息样本与项目集存在关联关系,则2组信息之间具有较大的支持度和置信度。根据2组招标代理机构信息特征和条件概率,计算信息与项目集之间的支持度,如公式(3)所示。

q(x*,y)=A(V∩N) " " (3)

式中:q(x*,y)表示挖掘招标代理机构信息x*与数据挖掘知识库中随机抽取的事务项y之间的支持度;A表示数据挖掘条件概率;V表示挖掘招标代理机构信息x*属性特征集合;N表示数据挖掘知识库中随机抽取的事务项y属性特征集合。

支持度可以反映招标代理机构信息为异议信息的支持程度。根据挖掘招标代理机构信息x*与随机抽取的事务项y之间的支持度,计算2组信息之间的置信度,其计算过程如公式(4)所示。

(4)

式中:p(x*,y)表示挖掘招标代理机构信息x*与数据挖掘知识库中随机抽取的事务项y之间的置信度。置信度可以反映招标代理机构信息为异议信息的可信程度[3]。

根据挖掘招标代理机构信息x*与数据挖掘知识库中随机抽取的事务项y之间的支持度与置信度,计算两组招标代理机构信息与事物项的关联度,如公式(5)所示。

(5)

式中:α表示挖掘招标代理机构信息x*与数据挖掘知识库中随机抽取的事务项y的关联度。关联度可以反映出挖掘招标代理机构信息x*与异议信息的关联程度,数值越高,则表示挖掘招标代理机构信息x*异议程度越高。

根据信息与异议信息之间的关联度计算出招标代理机构信息x*异议指数,如公式(6)所示。

b=max[0,1-max(α)] " " (6)

式中:b表示招标代理机构信息x*的异议指数。

考虑到在数据挖掘过程中可能存在误差,为了保证后续招标代理机构异议信息预警精度,采用卷积运算和误差修正法对上文计算的招标代理机构信息异议指数进行误差修正[4]。

以2组招标代理机构信息的异议指数卷积和为代表,将每组招标代理机构的异议指数看作是一个序列,通过卷积操作将这两个序列进行组合,生成一个新的代表性异议指数。使用不同的卷积核(即3-GRAM和5-GRAM)来获取不同的局部区域内的数据元素组合。

假设有两个招标代理机构的异议指数序列X和Y,其长度分别为N和M。对于每个位置(i,j),定义一个3×5的卷积核,对X和Y进行卷积操作,得到一个新的代表性异议指数。

以滑动窗口形式对输入异议指数进行局部区域内的异议指数数据元素组合,如公式(7)所示。

R=f(δc+b) " " " " " " (7)

式中:R表示卷积运算后的特征矩阵;δ表示初始化的权重矩阵;c表示卷积网络中的异议指数数据;b表示偏置向量。

在卷积操作后,为了引入非线性特性,采用PELU(Parametric ReLU)激活函数进行转换。将卷积结果作为PELU函数的输入,得到一个非线性映射后的结果。如公式(8)所示。

(8)

激活函数在>0的区域内有常数梯度,这使异议指数在该区域内可以平稳传播,而不会出现梯度弥散的问题,从而防止梯度弥散对异议指数的分析产生不利影响。当激活函数的输入≤0时,其梯度为0,在这一区域内,数据不会发生传播和更新。这一特性在处理招标代理机构的异议信息时可以用来过滤掉一些无效或错误的信息。

经过卷积运算过滤掉无效或错误的异议指数后,引入误差修正方法,补偿异议指数结果,如公式(9)所示。

b*=b·ψPELU " " (9)

式中:b*表示修正后的招标代理机构信息x*的异议指数;Ψ表示误差修正系数,通常情况下该系数取值为0.01。

通过修正处理后,得到招标代理机构信息x*异议指数,异议指数可以反映招标代理机构信息的异议性程度,将其作为信息特征,完成基于数据挖掘的异议信息特征提取,为后续招标代理机构异议信息预警等级评定奠定基础。

3 异议信息预警

基于招标代理机构异议信息智能预警需求,根据信息异议指数确定预警等级,此次设计5个预警级别,分别为异议性非常低、异议性比较低、异议性一般、异议性比较高、异议性非常高[5],由这5个预警级别建立招标代理机构异议信息智能预警等级集合,如公式(10)所示。

K={k1,k2,k3,k4,k5] " " " (10)

式中:K表示招标代理机构异议信息智能预警等级集合;k1表示招标代理机构信息异议性非常低;k2表示招标代理机构信息异议性比较低;k3表示招标代理机构信息异议性一般;k4表示招标代理机构信息异议性比较高;k5表示招标代理机构信息异议性非常高。

信息异议指数值范围在0~100,每个预警等级都对应一个信息异议指数区间,根据信息异议指数所在区间,确定预警等级。如果信息异议指数值在区间0~20,说明招标代理机构信息异议性非常低,招标代理机构信息争议性非常小,信息基本正常、合理,预警等级为一级;如果信息异议指数值在20~40,则说明招标代理机构信息异议性比较低,招标代理机构信息争议性比较小,信息比较正常、合理,预警等级为二级;如果信息异议指数值在40~60,则说明招标代理机构信息异议性一般,招标代理机构信息争议性一般,信息趋于正常、合理,预警等级为三级;如果信息异议指数值在60~80,则说明招标代理机构信息异议性比较高,招标代理机构信息争议性比较大,信息基本不正常、不合理,预警等级为四级;如果信息异议指数值在80~100,则说明招标代理机构信息异议性非常高,招标代理机构信息争议性非常大,信息完全不正常、不合理,预警等级为5级。按照以上评判规则,确定招标代理机构异议信息预警等级,实现了基于数据挖掘的招标代理机构异议信息智能预警。

4 试验论证

4.1 试验准备与设计

采用OTQHKSH数据包对本文所提方法的预警性能进行检验,数据包包括300家招标代理机构异议信息,共8000Byte,通过对异议信息进行处理和挖掘,提取异议信息特征,并对招标代理机构异议信息进行预警综合分析,对异议信息智能预警,随机选择10个招标代理机构异议信息样本,其预警结果见表1。

通过对招标代理机构异议信息数据挖掘,共识别到297个异议信息,异议指数范围在11.62~89.62,进行297次预警响应,其中包括一级预警56次,二级预警34次,三级预警106次,四级预警51次,五级预警50次。

4.2 试验结果与讨论

试验为对比试验形式,选择基于BP卷积神经网络的预警方法(MKDI)和基于随机森林模型的预警方法(WRRE)对本文所提方法对比。试验先后对招标代理机构异议信息智能预警的F1指标和错误预警数量进行了检验。试验对以上2个评价指标值进行统计,结果为图1、图2。

从图1中3种方法F1值对比可以看出,本文所提方法F1平均水平为8.98,MKDI方法F1平均水平为6.45,WRRE方法F1平均水平为0.54,按照F1值由大到小排序为本文方法、MKDI、WRRE,本文方法F1值最高,证明本文方法预警结果的准确性最好。

从图2中三种方法错误预警数量情况来看,对于300个招标代理机构异议信息预警,本文所提方法总错误预警数量为6个,MKDI方法总错误预警数量为17个,WRRE方法总错误预警数量为23个,本文所提方法错误预警数量最少。

通过以上对比得出试验结论:本文方法对于招标代理机构异议信息智能预警效果最好,方法利用数据挖掘技术提取到异议信息特征,通过对招标代理机构信息异议性定性分析,确定预警等级,有效保证了预警精度,设计方法在招标代理机构异议信息智能预警方面具有良好的适用性。

5 结语

招标代理机构异议信息预警是智慧招标代理机构信息管理体系中重要组成部分,对异议信息精准地预警能够为招标代理机构管理提供可靠的依据和支撑,能够有效降低招标代理风险。此次结合数据挖掘技术优势,将该项技术应用到招标代理机构异议信息预警中,提出了一种新的预警思路,有效提高了招标代理机构异议信息预警精度和预警的智能化和自动化水平,具有良好的现实意义。此次研究还有一定的理论意义,为招标代理机构异议信息智能预警提供了有力的参考依据。

参考文献

[1]蔡天润.数据挖掘技术在构建银行个人客户金融负债流失预警模型中的应用[J]. 科技通报,2023,39(6):44-49.

[2]黄方亮,许欢庆,沈同平,等.基于数据挖掘的智能学习效果预警管理系统设计与试验研究[J].通化师范学院学报,2022,43(12):84-89.

[3]梁树杰.基于数据挖掘技术的学习预警系统的研究与实现[J].电子技术与软件工程,2022(23):202-205.

[4]毕波,陈永春,谢毫,等.多源数据挖掘下潘谢矿区深部灰岩水突水预警研究[J].煤田地质与勘探,2022,50(2):81-88.

[5]林旭杰.基于数据挖掘算法的煤矿安全隐患预警研究及应用分析[J].现代信息科技,2022,6(4):141-144.

猜你喜欢
数据挖掘预警
探讨人工智能与数据挖掘发展趋势
基于BIM的基坑开挖实时感知与预警应用研究
中华建设(2020年5期)2020-07-24 08:56:04
法国发布高温预警 严阵以待备战“史上最热周”
今日农业(2019年12期)2019-08-13 00:50:02
园林有害生物预警与可持续控制
现代园艺(2017年22期)2018-01-19 05:07:01
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
数据挖掘技术在中医诊疗数据分析中的应用
辽宁 短缺药品三级预警
中国卫生(2016年12期)2016-11-23 01:10:16
一种基于Hadoop的大数据挖掘云服务及应用
日盲紫外探测技术在空间预警中的应用
预警个啥
小说月刊(2014年11期)2014-04-18 14:12:28