公共资源的多条件大数据挖掘分析

2024-01-22 06:32:32刘传蔚
中国新技术新产品 2023年23期
关键词:公共资源数据挖掘公式

刘传蔚

(天津市公共资源交易中心(天津市政府采购中心),天津 300171)

公共资源是一个城市或地区有关公共服务的重要资源,也是具有经济价值的重要板块,更是市场经济体系平稳运行中不可或缺的重要组成部分[1]。目前,公共资源已经成为政府控制且可以进行交易的重要信息化产品,这也推动了公共资源交易的飞速发展。随着信息化技术浪潮,公共资源交易活动更高效和频繁[2]。据不完全统计,全国各类公共资源交易平台达数千个,每年涉及的经济总额高达数百万亿元。由此可见,推动公共资源交易进一步良性发展是公共资源领域未来的重要发展方向。从目前的情况来看,在公共资源交易过程中主要存在部门多、交易流程繁冗以及资源数据量大等问题,影响了交易的效率和对接的准确性[3]。因此,该文在公共资源中引入大数据挖掘方法,对公共资源信息进行分析,以提高交易效率。

1 公共资源的大数据挖掘方法

公共资源数据量大、信息繁冗,要实现公共资源交易的有效对接,就需要设置多个合理的、客观的且准确的挖掘条件,以便顺利地实施大数据挖掘方法。因此,多个条件配置的过程就是消除公共资源数据冗余性的过程。而当全部数据的冗余性被消除时,就可以挖掘出准确的结果,这也是该文构建大数据挖掘方法的切入点。

根据公共资源数据挖掘的多条件设计思想,给出所有可能条件的数学集合,如公式(1)所示。

式中:E为公共资源挖掘过程中全部条件的集合;e1为公共资源挖掘过程中配置的第一类条件;e2为公共资源挖掘过程中配置的第二类条件;e|E|为公共资源挖掘过程中配置的第|E|类条件;|E|为公共资源挖掘过程中配置的条件总数量。

为了有效解决公共资源数据挖掘过程中的条件配置问题,针对每个条件可以配置1 个具体的挖掘方案,由此形成方案集合,如公式(2)所示。

式中:P为公共资源挖掘过程中全部方案的集合;p1为公共资源挖掘过程中配置的第一类方案;p2为公共资源挖掘过程中配置的第二类方案;p|P|为公共资源挖掘过程中配置的第|E|类方案;|P|为公共资源挖掘过程中配置的方案总数量。

在上述2 类集合的配置情况下,可以进一步构建公共资源大数据挖掘判断矩阵,如公式(3)所示。

式中:R为公共资源挖掘过程中构建出的判断矩阵;r11为公共资源挖掘过程中第一类条件和第一类方案构建出的判据;r12为公共资源挖掘过程中第二类条件和第一类方案构建出的判据;r21为公共资源挖掘过程中第一类条件和第二类方案构建的判据。

在公共资源的大数据挖掘过程中,不同方案及对应的判据存在差异,其是否为更佳的判定依赖于大数据挖掘算法后台支撑的专家知识。大数据挖掘算法会根据算法设定自动为不同的方案配置权重,这些权重的关系如公式(4)所示。

式中:qj为公共资源挖掘过程中第j个权重;|E|为公共资源挖掘过程中的全部权重总数量。

在大数据挖掘方法的使用过程中,如果不同类别的公共资源数据存在较大的数值差异,就无法形成有效的横向间比对,会影响判据和方案选择的准确性。因此,对挖掘过程中的同类参数进行归一化计算是基础性工作。

同类参数的归一化计算如公式(5)所示。

式中:tji为归一化后的结果;rji为原参数值;为最大参数值;i为方案序号;j为条件序号。

上述处理采用正向的归一化计算,结果都是0~1 的小数。也可以采用反向归一化计算,如公式(6)所示。

式中:为最小参数值。

至此,可以得到该文提出的大数据挖掘方法的流程图,如图1 所示。

图1 公共资源大数据挖掘方法流程图

由图1 可知,该文提出的公共资源大数据挖掘方法一共包括5 个步骤,分别是生成条件矩阵、生成方案矩阵、生成判断矩阵、权重归一化以及生成挖掘结果。

2 公共资源交易对接中的条件设置

针对公共资源和公共资源交易问题构建了大数据挖掘方法。这些方法必须进行充分的条件设置才能达到更好的挖掘效果。

当采用大数据挖掘方法进行公共资源数据处理时,首先要对其进行分类,分类过程可以看成第一次去冗余的过程。而公共资源的数据板块在很多城市或地区已经有了比较明确的划分或切割。该文抽取一部分公共资源数据的分类问题进行说明,该分类关系如图2 所示。

图2 公共资源数据的分类

由图2 可知,该文选取了公共资源数据的6 个分类,包括基础设施数据、公共项目数据、材料交易数据、经济发展数据、金融服务数据以及专家服务数据。分类只是第一次去除冗余的过程,如果需要得到更理想的数据挖掘结果,就需要进行更多的条件设置,该文进一步的条件设置见表1。

表1 公共资源数据挖掘中的条件设置

由表1 可知,针对从公共资源中所抽取的6 种类别分别设置了6 个条件,为了保证在数据挖掘过程中的各类公共资源数据具有相同的维度进行对等设计。当然,各类数据所属领域不同,其特征条件也存在很多差异。

3 公共资源的数据挖掘试验结果及分析

为了便于公共资源大数据挖掘过程的展开,对挖掘方法执行过程中获取结果的等级进行分类,结果如图3 所示。

图3 公共资源大数据挖掘结果的等级

在图3 中,将公共资源大数据挖掘结果准确性设置为6 个等级,为了便于进一步实施算法,对其进行对应量化,见表2。

表2 图3 中各等级的量化结果

在进一步的大数据挖掘试验中,要从海量的公共资源数据中找到与要求匹配的3 类数据,分别是A 型公共资源数据、B 型公共资源数据、C 型公共资源数据。根据公式(1)~公式(6)的大数据挖掘方法流程,得到了A 型公共资源数据挖掘过程的判断矩阵,见表3。

表3 A 型公共资源数据挖掘过程的判断矩阵

根据公式(1)~公式(6)的大数据挖掘方法流程,得到了B 型公共资源数据挖掘过程的判断矩阵,见表4。

表4 B 型公共资源数据挖掘过程的判断矩阵

根据公式(1)~公式(6)的大数据挖掘方法流程,得到了B 型公共资源数据挖掘过程的判断矩阵,见表5。

表5 C 型公共资源数据挖掘过程的判断矩阵

为了更直观地展示上述过程的挖掘效果,用柱状图来表达表3~表5 的结果,如图4 所示。

图4 表3~表5 的图形表达

通过图4 的形象对比,就可以选取更合适的公共资源数据,这也体现了大数据挖掘方法的优势。例如如果想选择条件2 配置较好的公共资源,就应该选择A 型公共资源数据。如果想选择条件1 配置较好的公共资源,就应该选择B 型公共资源数据。如果想选择条件4 配置较好的公共资源,就应该选择C 型公共资源数据。

4 结语

随着公共资源及公共资源交易快速发展和适用范围越来越广,对其进行大数据挖掘处理、找到更适合对接的公共资源数据就成为时代发展所需要的重要技术。针对该实际问题,该文提出了一种大数据挖掘方法,该方法根据公共资源交易的需求设定多种类型、多个数量的条件,达到数据冗余的最佳去除效果,进一步形成方案集合的配置,并实现不同判据的权重设置和归一化处理。在试验过程中,以基础设施数据、公共项目数据、材料交易数据、经济发展数据、金融服务数据以及专家服务数据6 类公共资源数据为挖掘对象,形成了A 型公共资源数据、B 型公共资源数据以及C 型公共资源数据的差异化分析,可以为不同的需求者提供更有针对性的挖掘结果。

猜你喜欢
公共资源数据挖掘公式
排列数与排列数公式
组合数与组合数公式
公共资源交易平台构建及体制机制创新
现代企业(2021年2期)2021-07-20 07:57:30
探讨人工智能与数据挖掘发展趋势
等差数列前2n-1及2n项和公式与应用
例说:二倍角公式的巧用
基于并行计算的大数据挖掘在电网中的应用
电力与能源(2017年6期)2017-05-14 06:19:37
云南省积极推进公共资源交易标准化工作
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究