基于机器学习建模效果的电力数据资产价值量化评估方法*

2020-11-28 12:10孙艺新崔维平雷涛
中国科技纵横 2020年24期
关键词:检修建模维度

孙艺新 崔维平 雷涛

(1.国网能源研究院有限公司,北京 102209;2.天云融创数据科技(北京)有限公司,北京 100080)

1.大数据时代的数据资产价值特点

在大数据阶段,数据才具备了完整的、独立的资产属性,它可以作为一个独立要素,配置到许多生产、经营或管理场景中,通过机器学习建模预测的方式,实现生产、经营或管理的模式改进或模式创新,直接对增加收入增长、降低成本、减少损失或规避风险等目标产生不可替代的且可以评估的经济价值。

2.数据资产价值的基本评价方式和基本估值方式

数据资产价值的基本评价方式很明确,就是计算引入一项数据资产要素后,在具体的业务场景中产生的经济价值。

以电网设备故障预测与智能化检修方案为例,假设原有检修方案对应的年故障停工损失为S1,引入新模型后的年故障停工损失为S2,则新模型产生的年经济价值S为:

S=S1-S2

以个性化电价营销为例,假设原有电力营销年收入为S1,引入个性化电价营销后,年收入为S2,则个性化电价营销模型产生的年经济价值S为:S=S2-S1。

但是,某项数据资产在某个具体业务场景中产生的经济价值,并不等于该项数据资产本身的估值,因为在该业务场景中产生经济价值的要素并不只有所引入的数据资产要素,还包括所依赖的人力、设备和资金等要素,因此,针对上述业务场景,该项数据资产的正确估值y应该是所产生经济价值S乘以该项数据资产的要素贡献度权重x,即:y=Sx。假设某项数据资产能应用到多个业务场景中,则该项数据资产的估值就是针对各个业务场景的估值的加和,即:

Y = y1+y2+y3+……+yn= S1x1+S2x2+S3x3+……+Snxn

总体数据资产中包含多项可以产生经济价值的数据资产子项,因此总体数据资产Z的估值公式如下:

Z=Y1+Y2+Y3+……+Yn

3.用于机器学习建模的数据资产价值的形态分析

3.1 用于机器学习建模的数据资产的三个基本形态

由于在大数据时代,数据资产的价值,是通过机器学习建模预测的方式,在具体的业务场景中得到实现的,而业界的一个通识就是数据和特征决定了机器学习的上限,模型和算法只是逼近这个上限而已,因此,在对一项数据资产的价值进行量化评估时,就不能仅仅从原始维度的层面去评估,还应包括特征工程和算法实现这两个层面的量化评估,换句话说,当我们对一项数据资产的价值进行量化评估时,需要区分数据资产的3个基本形态:(1)原始维度;(2)特征工程成果;(3)算法实现成果。

理论上,数据资产的原始维度形态决定了数据资产效用和价值的上限,而特征工程和算法实现的作用和价值是通过机器学习模型实现数据资产的价值,并逼近这个价值上限。

这3个基本形态的区分,不仅对数据资产的交易和定价有着更加清晰的边界意义,而且对该项数据资产的增值开发,以及对利益相关方的利益分配,也有着更加清晰的边界意义,因为这3个基本形态,在现实中,很可能分属于不同的利益方,并且可以单独交易,也可以组合交易,可以单独定价,也可以组合定价。

3.2 用于机器学习建模的数据资产的时空形态、维度形态和质量形态

数据资产的时空形态,是指数据所在的时间窗口范围、空间范围以及数据的时空粒度,电力数据资产就具备很强的时空形态特性,例如电力生产、传输和经营数据可以按年度、季度、月度分片,也可以按地区分片。

由于历史原因,在电力数据资产中,同一类数据资产在不同的时空范围内,其维度形态和质量形态也有区别,例如有些范围内的数据维度不够丰富或有缺失,或数据质量达不到机器学习建模所要求的标准,这些都会影响对数据资产价值的量化评估。这也意味着,在梳理用于机器学习建模的电力数据资产时,需要先行按维度标准和质量标准对不同时空范围的数据资产进行分级,使其成为价值量化评估的一个判断前提或依据。

4.用于机器学习建模的数据资产价值的量化评估

假设某项数据资产的形态和所针对的业务场景已经确定,例如,在某类大型设备检修场景中,原始维度数据集由某时空范围内的设备基础数据、运行监测数据、停工检修数据(含检修成本和检修停工损失数据)、故障损失数据组成,那么可以采用以下方式对其进行价值的量化评估:

(1)定义与业务场景对应的价值评估指标,此例中可定义为:价值量化评估指标S=故障损失总值+(检修成本总值+检修停工损失总值)。

(2)将原始维度数据集分割为训练集和验证集,以设备需要在哪个时间点进行停工检修为变量,选择适用的一个标准算法进行建模。

(3)建模完毕,在验证集中计算建模前的S值S(0)和建模后的S值S(1),则可得到原始维度形态的数据资产所产生的经济价值为:Y(1)=S(0)-S(1)。

(4)根据场景业务和数据特点,引入特征工程,在特征工程成果基础上,继续选择第2步中所用的标准算法进行建模。

(5)建模完毕,在验证集中计算建模后的S值S(2),则可得到提升到特征工程形态的数据资产所产生的经济价值为:Y(2)=S(0)-S(2),而特征工程所提升的经济价值为:Y(1)↗(2)=Y(2)-Y(1)。

(6)在特征工程成果基础上,设计新的算法或直接在建模平台上优化算法,再次建模。

(7)建模完毕,在验证集中计算算法改进后的S值S(3),则可得到提升到算法改进后的数据资产所产生的经济价值为:Y(3)=S(0)-S(3)。

而算法改进所提升的经济价值为:Y(2)↗(3)=Y(3)-Y(2)。

在具体实践中,4-7步可以重复进行,直到得到理想的结果。

在其他类型的业务场景中,我们同样可以用类似的方法得到 Y(1),Y(2),Y(3),Y(1)↗(2),Y(2)↗(3)这一组值,并以此来量化评估不同形态的数据资产价值。

如果需要,对同一类或同一项数据资产,因其内部的时空形态、维度形态和质量形态的分布不均导致不同范围数据集的价值区别,也可以通过上述方法分别进行量化评估,并进行对比。例如,针对同一个业务场景,有两个数据集A和B,我们可以计算出以下量化评估值进行比对:

Y(1)Avs Y(1)B

Y(2)Avs Y(2)B

Y(3)Avs Y(3)B

在某些业务场景中,因条件所限,数据资产价值的量化评估指标可能无法以金额方式实现,则可以采用机器学习算法的标准评价指标来作为替代或参考,例如采用AUC值或KS值作为评价指标,在条件具备时再换算为金额。

5.基于价值量化评估的数据资产交易方式

数据资产价值的量化评估为数据资产的对外交易和定价带来了便利,基于前文描述的价值量化评估模式,数据资产可以采取前述三个形态单独或组合进行交易。

仅仅拥有数据资产的原始维度形态,往往只能得到最低的估值,仅仅售卖原始维度形态的数据资产,往往只能拥有最低的交易报价话语权,并且只能得到最低的价值回报,还面临着数据泄密的商业风险。因此,拥有原始维度形态数据资产的企业,一定要重视数据资产的增值开发,主动将数据资产形态提升到特征工程或算法实现这两个高级的、高价值的形态。

对数据资产拥有者来说,最理想的交易方式是交付模型,而不是交付原始维度形态的数据,因为模型不仅包含了原始维度形态的数据资产价值,还包含了特征工程和算法改进所提升的经济价值,使得数据资产实现价值最大化。

猜你喜欢
检修建模维度
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
浅论诗中“史”识的四个维度
检修
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
电力系统继电保护二次回路的维护与检修
光的维度
论自动化焊接设备的预检修
“五个维度”解有机化学推断题
茂名式大修