基于大数据分析的电力企业供应商信用风险管理研究

2019-09-10 06:22:15吴奭登

现代信息科技 2019年2期

摘要：供应商管理作为购买者实行信用风险管理的重要前提，高质量的风险管理信息系统得到广泛实践。目前，供应商信用风险管理较为零散，供应商信息不全面，这些问题一直阻碍我国电力企业的持续发展。因此，建立供应商信用风险管理方案，采用科学的方法收集和统计实现供应商信用风险管理成为了电力企业工作人员的首要工作。本文简要地分析了国内外数据挖掘技术的研究现状，提出了基于大数据分析的电力企业供应商信用风险管理方案。

关键词：数据挖掘；供应商画像；信用风险

中图分类号：TP311.13 文献标识码：A 文章编号：2096-4706（2019）02-0191-03

Abstract：Supplier management is an important prerequisite for purchasers to implement credit risk management，and high-quality risk management information system has been widely practiced. At present，supplier credit risk management is scattered and supplier information is not comprehensive. These problems have been hindering the sustainable development of China’s power enterprises. Therefore，the establishment of supplier credit risk management program，the use of scientific methods to collect and statistics to achieve supplier credit risk management has become the primary work of power enterprise staff. In this paper，the research status of data mining technology at home and abroad is briefly analyzed，and the supplier credit risk management scheme of power enterprises based on large data analysis is proposed.

Keywords：data mining；supplier portrait；credit risk

0 引言

在供應商信用风险管理过程中，充分利用好大数据是企业占领市场、获取利润的捷径。将供应商数据化，即构建供应商画像是企业对供应商信用进行有效管理的重要手段，其目的是供应商信用的全数据描述，根据价值细分供应商，了解供应商信用情况，制定精准的供应商管理方案，为供应商信用管理提供支持。

本文基于对供应商的评价分析管理，通过对供应商信息风险管理中大数据的挖掘、分析，提出供应商画像的概念，并以此为依据实现不同供应商信用分级管理，同时提出业务和系统的改进策略，以优化供应商之间及供应商与电网企业之间的关系。在保证服务质量的前提下，降低供应链运行成本，帮助电网企业建立竞争优势，获得更多的客户满意度。

1 国内外数据挖掘技术的研究现状

数据挖掘技术是一种对电力企业信用管理决策提供支持的技术，它主要是基于机器学习、人工智能、统计学等技术对大量的数据进行处理，从而做出归纳性的推理，挖掘出数据中的潜在模式，并对供应商的信用风险进行预测，从而帮助企业的决策者们及时调整市场策略以减少可能存在的风险，做出尽可能少的错误决策。

从商业层面上来说，数据挖掘还可以描述为：按照企业既定的业务目标，对海量的业务数据进行探索和分析，从而揭示隐藏的、未知的或者验证已知的数据的规律性，并进一步将其模型化，用户兴趣模型也就应运而生。根据已有的数据对用户信用风险进行建模，并进行规则抽取与提炼，得到用户的画像。

国内将数据挖掘的技术应用在电信领域的成果案例也不少。比如李军利用数据挖掘的算法对电信行业的客户流失模型进行建立与分析，针对不同种类的客户分别进行了不同模型的流失分析；段云峰、吴唯宁、李剑威等在数据仓库及电信领域的应用中，运用数据仓库的方法对电信行业的服务客户进行存储管理；吴爱华在数据挖掘在客户关系管理中的应用研究中，应用了数据挖掘的相关知识来研究数据挖掘算法在用户关系管理中的应用；叶松云在我国电信行业客户流失管理的建模分析及应用研究中，通过对电信行业的流失客户进行模型建构，通过管理这个流失模型来有效控制客户的流失。

目前南方电网企业和供应商的信息交换处在一种繁杂的状态，电网企业可以对单个供应商信用情况进行信息的查询，反馈，但很难通过获得的信息对多个供应商信用进行有序、有效的管理。供应商的管理缺乏直观、可视化的手段和方法。通过建立供应商模型可以将纷乱的数据进行清洗和建模，提供进一步的分析决策。

2 基于大数据分析的电力企业供应商信用风险管理

根据以上分析，在电力企业供应商信用风险管理过程中，需要对收集到的供应商数据进行处理，进行行为建模，以抽象出供应商的标签，这个阶段注重的是大概率事件，通过数学算法模型来排除供应商的偶然行为，故需要运用机器对供应商的行为、偏好进行猜测，根据供应商的关注点或投标意向、投标历史、中标情况等因素来判断供应商的忠诚度、履约能力、信用等级等，并对供应商行为进行建模。简单来说，供应商画像就是通过算法计算等方式，用统一的标准衡量供应商的表现，并对未来发展进行预测，这是一种把单个分析集成化，把平面分析立体化的过程。

可见，在供应商信用风险管理过程中，应结合供应商属性、行为、评价标签体系，充分研究数学算法模型，并应用Python、R等工具建模推演，构建供应商评价模型，全面刻画供应商画像。

2.1 画像构建与数据分析

供应商画像模型旨在帮助管理供应商、优化投标决策，因此画像构建的关键过程在于结合实际业务情况定性地选取投标决策关心的供应商评价指标，定量化评价指标，最后选取合适的评价维度给供应商贴上标签，通过不同维度的标签还原供应商的“画像”。因此，数据处理和分析建模的过程应该基于上述关键过程的指标数据特征以及业务分析逻辑。现在针对供应商画像的研究还不算特别多，我们以流行的“用户画像”分析进行对比，从而可以发现供应商画像和用户画像有何异同，从用户画像当中又能寻找到什么可行的分析思路。

图1是用户画像的一般流程。可以发现供应商画像与用户画像的建模过程本质上都是数据收集-建模-画像成型的过程，区别只是在于：首先，画像构建的目的不同，用户画像的目的是进行精准营销，而精准营销的建模工作是要对用户分类后对不同类别用户的消费行为进行预测。而供应商画像的目的是为了精准管理、精准招标，建模工作是要对供应商分类后对不同类别的供应商进行评级。其次，画像的标签维度不同，标签维度的构建同样是从画像构建的目的出发，用户画像关心的是用户的购买能力、行为特征、社交网络等，供应商画像关心的是供应商的商务状况、产品质量、信用状况。具体分析数据的思路如下所示。

（1）数据收集。通过访谈和调研搜集数据，确定供应商指标的打分逻辑和统计口径。

（2）数据预处理。对收集到的数据进行清洗，目前收集到的数据量非常小，且需要进行整合、预处理，包括缺失值和异常值的处理、数据数量级的统一、后续分析所要进行的标准化处理。在构建供应商画像的现有数据中，资格评审涉及的商务与技术两大维度的数据已经根据权重进行了打分，分数的数量级为10以内，因此部分数据只需要剔除不满足资格评审的数据（表现为所有维度都为0值）以及数值超出权重的分值。履约评价的数据有物资合同签订及时率（0-100%）、一次性试验通过率（0-100%）、到货及时率（0-100%）和不良行为记录（分值范围0.1-12）。对于这部分数据需要根据权值进行标准化，由于权值需要根据评价标准进一步确定，因此目前只需要将不良行为记录的量化数值压缩到与0-100%相同的范围。

（3）数据降维。目前的供应商信用风险评级指标过多，不能满足供应商画像的特征提取与分类要求，需要进行降维处理。拟采用关联性分析和主成分分析降低指标维度，同时最大化保留原有数据的信息。在资格评审中，商务基本面信息的数据涉及15个指标，技术能力更是高达10余个，这些指标反映的意义具有较强的关联性（共线性）且在有限的数据量的情况下变量过多将会大大降低模型的自由度从而影响精确度，因此为了满足后续的分类和拟合要求，必须要剔除冗余变量，对指标进行降维处理。

（4）特征分類。结合业务理解初步确定分类个数（供应商不同特征维度的级别个数），利用聚类分析算法对供应商不同特征维度进行分类，后续根据分类情况和数据特征适当调整分类个数。在构建标签之前，需要对供应商进行分类，由于目前的数据是不具有分类结果标签（y值），因此这是一个无监督的分类问题，无法采用决策树、神经网络等学习类模型；又因为目前数据集的数据量非常少，需要大量训练数据的无监督深度学习模型也不适用，因此，针对无监督和小样本的特点，选用聚类分析解决分类问题。

聚类试图将数据集中的样本划分为若干个通常是不相交的子集，每个子集称为一个“簇”。通过这样的划分，每个簇可能对应一些潜在的概念（类别），如“财务状况良好”、“技术能力强”等。不过，这些概念对于聚类算法而言事先是未知的，聚类过程仅仅能自动形成簇结构，簇对应的概念语义需要结合业务来把握和命名。常用的聚类算法有K均值算法、层次聚类算法等非常多，而针对现有的数据，K-means算法适用的情景是：簇数确定（同维度标签评级个数确定）且较少、数据量较大；而Hierarchical clustering适用簇数不确定（可能有一定范围）、数据量相对大的情况。具体采用哪一种分类算法要根据数据情况以及业务分类要求和可视化要求而定。

（5）分类结果检验。通过计算该特征维度不同类别的供应商的加权总分对分类后不同簇的供应商的总分进行统计上的显著性检验。

（6）构建画像标签。结合对供应商管理评级的业务理解，从数据层面分析该特征维度下不同簇的供应商的区别，并增加语义内容。

2.2 设计供应商画像

根据行业经验及领先实践，通过对南网供应商各类行为数据及外部数据进行数据采集、数据挖掘，结合公司战略、未来发展愿景还有指标构建的一般原则，将供应商的综合画像构建为六大一级指标，分别为供应商资质评价、供应商履约运行评价、企业风险信用评价、社会行为与责任、供应商生态与供应商创新。其中最重要的企业风险信用评价指标包括企业基本风险（如企业人员变更频率）、司法风险（开庭公告次数、法律诉讼次数）、经营风险（税务评级等级、股权质押比率、动产抵押比率、司法拍卖事件次数、欠税信息次数、行政处罚次数、抽检检查合格比率），具体结构如图2所示。

3 结论

本文通过对我国市场经济环境下大数据挖掘技术的现状分析，研究了基于大数据分析的电力企业供应商信用风险评价指标体系。通过数据挖掘等技术定制供应商行为标签及评价指标，构建供应商画像。通过税务信息、司法信息、抵押信息、违法信息、质检抽检信息等数据对供应商潜在风险及信用进行评估，将供应商管理体系纳入风险管控原则。同时，对供应商画像相关业务进行优化，针对群体的分析，进行供应商画像的可视化展示，根据供应商信用风险细分指标及原则，可用来评估供应商资格准入条件，辅助项目评标，同时也可以细分出优质供应商、评估某一群体供应商的潜在价值空间，提出针对性的运营和管理策略。

参考文献：

[1] 郭秀红.大数据时代物流信息平台构建与建设对策研究 [J].现代信息科技，2018，2（9）：149-150+153.

[2] 庄希瑞.基于电网大数据的电力需求侧管理 [J].现代信息科技，2017，1（3）：125-126.

[3] 陈红，苏运东，付婷，等.试论电力大数据在电网规划中的运用 [J].现代信息科技，2018，2（9）：101-102.

作者简介：吴奭登（1981.07-），男，汉族，广东湛江人，毕业于哈尔滨工业大学，高级工程师，硕士研究生，研究方向：电网应该跟电力研究、电网工作建设管理。