大数据技术在输变电工程造价指标预测中的应用研究

2021-06-04 03:09:18刘哲何子东靳健欣张德广董楦

微型电脑应用 2021年5期

刘哲, 何子东, 靳健欣, 张德广, 董楦

(1.国网河北省电力有限公司，河北石家庄 050022; 2.国网河北省电力有限公司经济技术研究院，河北石家庄 050022;3.河北省送变电有限公司，河北石家庄 050070)

0 引言

科技的进步推动着各行各业不断地进行着发展，电力建设的规模也随之而持续扩大，输变电工程的投资与造价不断攀升[1]。基于此，电力网络企业承担着超负荷的市场压力，输变电工程造价由于受到多方面多角度的影响，包括社会环境、自然环境与经济发展等众多因素的影响，产生了越来越高的管理要求[2]。为了改变这一现状，亟需构建一种合理高效的输变电工程造价指标预测模型[3]。当今社会中，许多输变电工程造价的模型均存在弊端，不能为工程建设的顺利实施提供有力的帮助[4]。有鉴于此，此次研究将针对大数据技术，以及输变电工程造价的影响因素等进行深入的分析，旨在为未来的输变电工程造价指标预测提供参考。

1 输变电工程造价指标预测方法

1.1 输变电工程造价影响因素分析

对输变电工程的相关影响因素进行分析，指的是对输变电工程的基础项目数据进行收集整理，对该数据之间的相互关系进行分析，最终获得影响因素及其影响力[5]。针对输变电工程造价影响因素进行分析，详尽的技术路线图如图1所示。

在对影响因素进行识别的过程中，须对整个过程的环节进行合理的划分，从自然因素与技术条件两个方面着手，来构建工程造价影响因素库。输变电工程造价项目主要包含六个部分，分别为可行性研究阶段、设计方案选择和初步设计阶段、技术设计和施工图设计阶段、招投标阶段、施工阶段，以及竣工阶段。在可行性研究阶段，主要影响因素包括政治、经济与自然三方面的风险，以及工程复杂度等等，具体内容如图2所示。

图1 输变电工程造价影响因素分析的技术路线

图2 系统动力学流图之可行性研究阶段

由图2可知，可行性研究阶段的主要工作为可行性研究报告的拟定，该报告需要具有一定的真实性与科学性。其中显示出可行性研究报告的站址选择、技术方案与设备方案决定着该报告的精度，与输变电工程决策的精度与深度紧密相关。对投资方案进行拟订，随后再按照投资目标进行比较，选择出最优投资方案。除此以外，在设计及招投标阶段部分，其系统动力学流图如图3所示。

图3 系统动力学流图之设计、招投标阶段

由图3可知，设计阶段作为输变电工程建设的核心，其规划、数据、图纸与技术等均为实现项目工程的建设起到重要的指导作用。工程造价的主要任务目标是对项目中的技术先进性与经济合理性进行协调化处理，尽可能地降低估算与概预算之间存在的偏差。还需结合设备数量、规划难度与技术要求，提高预算方法的准确性。随后进入施工与竣工阶段，对建设资源的实际值与目标值之间的偏差进行动态分析及管控[6]。

1.2 基于输变电工程造价指标预测的模型构建与造价估算

为了对输变电工程造价中的各项指标信息进行准确地预测，此次研究采用支持向量机(Support Vector Machine，SVM)来构建模型，支持向量机是一种机器学习方法，其监督学习流程如图4所示。

图4 SVM监督学习流程示意图

SVM对训练样本进行监督学习，对输入特征进行分类，再将提前选择的非线性映射用来对训练样本进行处理，将训练样本映射到高维特征空间后，创建最优分类超平面，最终获取到复杂度较小的特征函数集。此最优超平面如图5所示。

图5 最优超平面示意图

图5中的C1与C2分别代表着二维数据样本；P0与P1则指的是不同的分类函数。前者即最优超平面分类函数，后者为普通超平面分类函数。SVM模型的泛化性较强，能够快捷高效地处理高维数据，因此其被广泛应用到小样本、非线性和高维等数据的分析处理中。此次研究中为了提高模型的精度，应用更具优越性的最小二乘支持向量机(Least Squares Support Veotor Maohine，LS-SVM)，将SVM的训练过程灵活转换为线性方程组的求解过程。LS-SVM令训练样本集为Sl，表明该样本集的大小为l。在此条件下，则有Sl={(xi,yi),i=1,2,…,l}，且xi,yi∈Rn。LS-SVM通过机器学习，依据样本集的变化规律来获取相应的数据预测值，则有式(1)。

f(x)=wTφ(x)+b

(1)

式中，w∈Rn指的是该模型中的权向量；b指的是偏置项；φ(x)是低维空间到高维特征空间的映射函数。将该线性关系进行一定的转换，如式(2)。

(2)

式中，αk代表着误差变量；k=1,2,…,l；γ表示的是可调系数。随后再运用拉格朗日函数对获取到的线性关系进行转换，得到式(3)。

式中，λk表示的是拉格朗日乘子，随后再求偏导数，式(4)。

(4)

在该模型中存在核函数，令核函数为K(xk,xh)，则有式(5)。

K(xk,xh)=φ(xk)Tφ(xh)

(5)

核函数被选择确定为径向基(Radial Basis Function，RBF)核函数，如式(6)。

(6)

式中，核函数的宽度系数表示为g，因此可以得到该模型中样本的预测值为yk，如式(7)。

(7)

根据式(1)至式(7)，再结合输变电工程中的历史数据，可以得到训练样本集{(xi,yi),i=1,2,…,l}，输入向量表示为xi；输出向量的期望值表示为yi；样本个数仍然以l来表示。随后再进行数据的归一化处理，以提高模型的训练速度和精度。输变电工程造价中的核心点在于投资问题，其中包括静态投资与动态投资，在此过程中获取到的数据均为小样本数据，故而需要采用主成分分析法(Principal Component Analysis，PCA)，将对该工程造价中的相关数据信息进行处理，以获取原始输入集与输出集，输入集包含了输入电压等等，输出集则表示为静态投资，其特征值与相对应的贡献率如图6所示。

图6 特征值和主成分贡献率分析

图6中的特征值为k，贡献率以百分比来表示。其中输入集共含有22个指标，输出集指的是静态投资，仅有1个指标。第一主成分拥有的原始指标信息量最多，往后依次减少。所有主成分相对应的特征值均为正数，主成分包含初始指标的数据量与主成分的值呈负向相关关系。

2 实验与分析

通过构建输变电工程造价指标预测模型的方式，采用SVM与LS-SVM对样本进行估算。首先将样本集输入到SVM网络中进行学习，并多次重复学习过程；随后利用测试样本得到最优的参数值，再将目标样本输入其中进行估算，最终将得出的结果与真实值进行对比分析，输电工程造价估算模型的实验结果如图7所示。

图7 不同估算结果与实际值对比

根据图7可知，当测试样本数量为1时，原始静态的估算值为485万元，SVM与LS-SVM的估算值分别为435万元与500万元；当测试样本数量为3时，原始静态的估算值为405万元，SVM的估算值为465万元，而LS-SVM为450万元。综上所述，当测试样本的数量不同时，SVM与LS-SVM的估算值也会随之而产生变化，然而无论处于何种样本数量值时，LS-SVM的估算值均更加靠拢实际值，这表明LS-SVM的预测精度更高，预测的准确性更强。在LS-SVM模型中，为了更加精确地分析清楚模型的预测准确度，还采用了不同的核函数来进行横向对比，结果如表1所示。

表1 输电工程中不同核函数输出的结果对比分析

表1中展示了在LS-SVM估算模型中，基于RBF核函数与Lin核函数输出的不同结果。通过将实际值、RBF核函数与Lin核函数三种输出结果进行对比可知，若选用传统的Lin核函数，该模型的绝对误差最小值为7.69万元，绝对误差的最大值为86.78万元；当选用RBF核函数时，绝对误差的最小值仅为2.58万元，相对应的绝对误差最大值则为14.84万元。不同核函数的输出结果对比图如图8所示。

图8 估算结果与实际值对比

通过图8 不同数量的测试样本的估算结果来看，选用RBF核函数的估算精度更高，其估算值更加接近于原始静态值。当测试样本个数为3时，原始静态值为410万元，Lin核函数的估算值为500万元，二者间的误差高达90万元；与此同时，RBF核函数的估算值则为402万元，与实际的原始静态值之间仅存在8万元的误差。因此，RBF核函数的估算准确度显著高于Lin核函数。

3 总结

我国电力水平不断提高，推动电力工程与社会经济同步持续增长势在必行。为了做好输变电工程造价的管控，此次研究对输变电工程造价中的各项影响因素进行了细致的探究，利用大数据相关技术构建了优化后的支持向量机模型，提出了一种新的工程造价管理方法。结果显示，在输变电工程的LS-SVM估算模型中，运用RBF核函数来对工程造价进行估算是最优选择，其估算准确性更强，预测精度更高。此次研究有幸取得了一定的研究成果，然而由于个人能力的限制，在研究中仍然存在一些亟待完善的地方，如进行变电工程中不同核函数估算的工程数量较少。在未来的研究中，希望能进行更加全面客观的探究。