融合社会数据的高压企业电费回收风险筛查

2019-11-11 09:13邹云峰邓君华
山东电力技术 2019年10期
关键词:命中率电费用电

邹云峰,邓君华,徐 超,季 聪

(1.国网江苏省电力有限公司电力科学研究院,江苏 南京 210000;2.江苏方天电力技术有限公司,江苏 南京 211102)

0 引言

电费能否及时回收,直接影响到电网公司经营与发展。高压企业客户用电量大,电费占比多,逾期或欠费对总体电费回收情况影响巨大。近年来,受国家供给侧结构性改革不断推进、国际贸易保护主义抬头等多种因素影响,企业生产经营不确定性增加,尤其是高耗能及环保不达标企业经营压力大幅提升,关停风险加大,电费回收风险不断攀升。因此,如何准确预测高压企业客户电费回收风险,提前采取针对性防控措施,是破解“电费回收难题”的关键。

现有研究多是基于用电、交费等电力内部数据,对客户电费回收风险进行评价[1-12],无法全面分析企业客户的经营情况,难以评估其实际履约能力,预测电费回收风险,给电费回收工作带来很大困难。

针对上述问题,基于高压企业客户,融合工商、银行、司法、税务等社会数据,建立电费回收风险筛查模型,从企业电力信用、经营、舆情等7 个方面,对各类潜在风险因素进行全面的辨别,实现企业客户电费回收风险提前预警。

1 社会数据融合

传统电费风险预测局限于从单一企业用电数据角度分析企业电费回收风险,而企业电费回收是企业经营状态的外在表现,企业经营环境变化、外部政策、股权组成调整等都可能直接或间接地影响企业电费回收风险的形成。因此,考虑融合了政府、金融机构、数据公司、媒体平台等渠道获取的工商、司法、银行、税务等12 类社会数据,涉及422 个字段、15 亿条记录,累计数据量达120 GB,部分数据内容如表1所示。

表1 社会数据信息

2 风险筛查建模

进行风险筛查建模时,首先开展业务分析,从海量数据字段中,筛选影响电费回收的关键因子;随后利用大数据技术进行数据预处理与特征提取,利用随机森林算法、熵值法等算法构建电费回收风险筛查模型;最后,通过贝叶斯深度学习等方法实现模型自优化。

2.1 关键因子选取

首先对全量数据进行业务分析,将电力数据和社会数据归纳为电力数据、企业经营数据、企业关联关系和政策事件信息4 类。通过支持向量机、Xgboost 等方法,进行关键因子提取,并分为电力信用、用电异常、经营异常等7 个分析维度。关键因子选取如图1 所示。

图1 关键因子选取示意

2.2 筛查模型构建

采用模式演化、关联聚类等技术,从电力信用、用电异常、经营异常、失信处罚、政策事件、关联风险和舆情风险7 个维度进行企业风险评分,7 个维度的总分为100 分,各维度评分采用加权的方式,加和后得到企业风险评分,各维度评分权重如表2 所示。

表2 风险评分各维度权重

根据评分结果,划分风险等级。具体风险等级划分标准如表3 所示。

表3 筛查模型中风险等级划分标准

图2 电力信用分计算

2.2.1 电力信用

电力信用维度,在传统用电行为、交费行为的基础上,增加用电价值、电网互动价值、服务互动行为和电力市场交易诚信分析维度,借鉴芝麻信用计算方法,全面客观对客户电力信用进行评分[13],计算步骤如图2 所示。

根据信用评分结果和权重,得到该用户电力信用维度风险分值。

2.2.2 用电异常

用电异常维度,通过深度挖掘电力数据,感知企业用电异常,预测电费回收风险。采用卷积神经网络和轨迹演化技术,利用行业历史用电数据,对钢铁、光伏、水泥等20 个典型行业,从正常、异常两个方面构建160 类行业典型用电模式,企业用电模式与行业正常、异常用电模式的对比分别如图3、图4 所示。通过计算企业用电模式特征与行业典型用电模式偏离度,量化企业用电异常风险分值。

图3 企业用电与行业正常模式对比

图4 企业用电与行业异常模式对比

2.2.3 经营异常

经营异常维度是指通过综合分析企业人员变动、工资发放等数据,判断企业自身经营是否正常。经营异常维度风险评估如图5 所示,利用聚类分析法,分析量化司法冻结、工商异常、不动产抵押、生产情况等因素对企业的影响程度(见表4),通过企业半年内发生经营异常事件次数,结合影响程度,量化经营异常维度风险分值。

2.2.4 失信处罚

失信处罚维度风险评估是指利用结构熵权法,量化银行、税务、环保等失信、处罚信息对企业风险的影响程度,失信处罚事件影响程度如表5 所示,失信处罚维度风险评估如图6 所示。通过企业半年内发生失信处罚事件次数,结合影响程度,量化失信处罚维度风险分值。

表4 经营事件影响程度

图5 经营异常维度风险评估流程

表5 失信处罚事件影响程度

图6 失信处罚维度风险评估流程

2.2.5 政策事件

政策事件维度,基于历史数据构建各类产业政策、国际贸易事件对行业的影响模型。政策事件维度风险评估如图7 所示,分析了光伏行业受反倾销、补贴、产业政策、经贸摩擦等政策事件的影响程度和起效时间,其中,光伏行业受政策事件影响情况如表6所示。通过筛查企业所处行业近期的政策事件情况,根据影响程度和起效时间,预测量化企业政策事件风险分值。

图7 政策事件维度风险评估流程

表6 光伏行业受政策事件影响情况

2.2.6 关联风险

关联风险维度,用于分析企业间关系传导风险。关联风险维度风险评估流程如图8 所示,基于知识图谱技术,对企业间的股东关系、业务关系和投资关系进行关联分析,构建了企业关联风险模型。根据企业上游股东和下游投资企业的风险情况,计算关联风险维度风险分值。企业关联风险传导如图9 所示。

图8 关联风险维度风险评估流程

图9 企业关联风险传导示意

2.2.7 舆情风险

舆情风险维度,通过网站、微博等公众平台获取企业舆情信息。舆情风险维度风险评估流程如图10所示,利用自然语言处理技术,进行文本分词和关键词提取,实现负面舆情统计分析和舆情风险评估。舆情风险词云如图11 所示。

图10 舆情风险维度风险思路

图11 舆情风险词云

7 个分析维度从不同角度、全面揭示了企业客户电费风险,充分发挥了融合社会数据的威力。最后,对各维度风险得分进行综合计算,得到企业风险评分。

2.3 模型自适应学习

模型优化部分,利用卷积神经网络和贝叶斯深度学习等方法,实现各维度参数权重自适应优化调整,如图12 所示。

图12 模型自适应学习示意

3 算例分析

以某省级电网3 个地市共45 427 户的高压企业客户为例,对构建的风险筛查模型进行验证。

3.1 验证指标

为了更清晰地验证模型筛查效果,定义了逾期用户遗漏率和命中率作为主要考核指标。遗漏率用以表征模型筛查的识别能力,考核指标遗漏率计算公式为

式中:R1为遗漏率,即利用本文风险筛查模型预测为中低风险但实际发生逾期的客户在所有发生逾期客户中的占比;T2为建立的模型预测结果为中、低风险且实际发生了逾期的客户数量;F2为模型预测结果为高风险且实际发生了逾期的客户数量。

命中率用以表征模型筛查的识别效率,考核指标命中率为

式中:R2为命中率,即利用本文风险筛查模型预测为高风险且实际也发生逾期的用户在所有预测为高风险客户中的占比;F1为建立的模型预测结果是高风险并且实际未发生逾期的客户数量。

遗漏率越低,电费回收风险越低,命中率越高,预测更精准,电费回收工作开展的效率越高。

3.2 算例结果

利用近5年历史数据对以上建立的模型进行了验证,遗漏率为7.2%,命中率35.7%。为检测建立的风险筛查模型在线预测效果,利用表7 样本数据,对2018年11月、12月两个月的客户电费回收风险分别开展预测,电费回收周期结束后,验证模型预测结果。选取随机森林算法[14]、LSTM[15]进行模型优劣对比,3 种模型得到的预测结果如表8 所示。

表7 样本数据

表8 模型预测结果

3.3 结果分析

遗漏率方面。算例中45 427 户高压企业客户,2018年11月份、12月份分别发生逾期3 335 户、1 833 户,本文模型分别遗漏了301 户、182 户,遗漏率最低。随机森林和LSTM 模型预测结果相近,2018年11月份、12月份,随机森林和LSTM 模型遗漏率分别在50%、30%左右,远高于本文模型遗漏率。

命中率方面。2018年11月份、12月份,本文模型命中率分别为30.94 和21.65,随机森林模型命中率分别 为28.26 和19.47,LSTM模型命中率为29.07和20.36,本文模型命中率略优于随机森林和LSTM 模型。

验证过程中,还发现了一些典型案例。例如,用电异常方面。2016年9月某商业综合体用电走势与行业典型模式偏离如图13 所示,11月发生电费逾期。

图13 用电异常典型案例

建立的融合社会数据的电费回收风险筛查模型预测结果,遗漏率远低于传统风险预测模型,命中率方面也表现优异,证明了模型的有效性。

4 结语

融合工商、司法、税务等企业社会数据,利用卷积神经网络、决策树等大数据技术,从电力信用、用电异常、经营异常等7 个维度构建了企业电费回收风险筛查模型,解决了传统电费回收风险评估中对企业信息掌握不全面、履约能力预判不足的问题,实现高压企业客户电费回收风险科学评分、评级和模型参数自适应调整,通过算例验证了风险筛查模型的科学有效性,对指导供电公司开展电费回收风险防控,提高电费回收工作针对性具有重要意义。下一阶段,将持续扩展社会数据维度,优化电费回收风险筛查模型,不断提升预测的科学性和准确性。

猜你喜欢
命中率电费用电
基于ε-SVR模型的日电费回收预测
基于文献回顾的罚球命中率与躯干稳定性影响因素研究
安全用电知识多
对输配电及用电工程的自动化运行的几点思考
为生活用电加“保险”
夜夜“奋战”会提高“命中率”吗
用电安全要注意
2015男篮亚锦赛四强队三分球进攻特点的比较研究
浅谈电力企业电费账务管理工作
基于大用户电费回收的风险管控