余向前,王林信,张维静,罗 欣,赵 燃
(1.甘肃省电力公司,兰州 730030;2.北京清软创新科技有限公司,北京 100085)
欧债危机阴影不散,产业链流通不畅,由此直接导致大客户用电量不稳,这给电力市场,尤其是工业比重较大的省市电力市场的分析预测带来了极大地挑战。
业扩报装业务从用电根源处反应了外在环境对电力市场的影响,同时也是将大客户和电力企业绑定供用电关系的首要环节。因此量化业扩报装业务对电力市场的影响,是从用电根源处把握电力市场变动的关键。然而,由于业扩报装系统是以工作票的方式完成,用户从申请到签定合同通电的流程,存在报装时间长、决策脱离需求等方面缺陷[1],因此,目前对于业扩报装业务的研究侧重于如何简化业务流程、优化用电[2—3]等。
针对如何量化业扩报装业务对电量的影响,本文拟从用电根源出发,以业扩报装业务为导向,以生长曲线模型和主元分析为手段,提出业扩生长曲线的概念。将大客户、行业业扩报装后的用电趋势分阶段解读,并逐层剖析得到投运比例,以进一步指导预测。
业扩报装包含新装、增容、减容和减容恢复等业务。针对增加容量类业务,尤其是新装业务,客户在完成报装后需要进行用电设备等各方面的调试,并不能马上达到稳定用电状态,这段调试期客户的用电量正是本文研究的重点。本文选取用电量较大的新装钢铁企业客户报装后一年的用电量做折线图,见图1。
图1 某地区钢铁企业新装后用电趋势
通过趋势分析可见,客户完成业扩报装后用电趋势呈现出S型生长特性,因此本文首先纳入大量客户业扩报装后的用电量,进行数据的挖掘分析,实现用电特点和报装业务的耦合,同时去除客户用电量波动不符合客观规律的数据,进一步依据客户报装后用电量的变化特点,引入生长曲线模型进行拟合,并在此基础上利用主元分析汲取典型客户用电的关键信息,形成基于行业的业扩生长曲线,最后推算出每个月的电量投运比例以进一步指导预测。具体研究流程图如图2所示。
S型曲线是描述生物生长过程的一种特殊曲线,又称生长曲线,其通过形状展示个体的成长与所处环境的相互关系。近年来,生长曲线模型被广泛应用于生长规律的研究[4—5],最为典型的是Logistic、Gompertz和Von Bertanlanffy曲线模型。模型表达式及主要参数见表1。
图2 行业业扩生长曲线基本思路
拐点是曲线运行速率的转折点,用以表征曲线的运行趋势。由于3种模型都是Richard曲线(Wt=A(1-Be-kt)1/(1-C))的特殊形式。C=2时为Logistic曲线;当C=2/3时为Von Bertanlanffy曲线;当C=1时即为Gompertz曲线[7],因此3种模型在拐点位置上有一定相似性。所谓拐点是指凹曲线和凸曲线的转折点,也就是运行速率正负变化的位置。依据拐点的有效识别[8],当3种模型的二阶导数为0时,即达到各自的拐点月份,与此同时,拐点月份对应的Wt即为拐点电量。可见虽然3种模型到达拐点时电量恒定,但是拐点电量各不相同,Logistic曲线的拐点电量为A/2,为最大电量的一半,且发生在(lnB)/k月份;Gompertz曲线拐点月份和Logistic曲线一致,而拐点电量为A/e,相当于36.8%A;Von Bertanlanffy曲线趋势相对平缓,拐点月份在(ln 3B)/k,彼时电量值为8A/27,相当于29.6%A。
为了进一步分析业扩用电生长曲线的特质,本文在研究常用的指标拐点时间和拐点量值外,还引进了瞬时生长率、瞬时生长加率和相对生长率3个指标在业扩生长曲线的响应[8]。瞬时生长率着重体现生长速度的变化趋势,以(lnWt2-lnWt1)/(t2-t1)为计算依据;瞬时生长加率实质是瞬时生长率的一阶导数,强调瞬时生长率的变化快慢;而相对生长率利用单位时间内初值占末值的比率,体现了净用电量的有效增长。上述3个指标是从生长变化率层面强调用电的趋势特点,以瞬时生长率为基值,衡量曲线波动特性。相比曲线模型为基值的拐点判断,其阶段划分更加深入,更易发现曲线的内在规律。
表1 生长曲线拟合的3种非线性模型
主元分析法是一种利用降维思想将多指标转化为几个综合指标的多元统计分析方法。其通过研究不同角度的变量,采用线性结合的方式将原始信息聚焦,形成互不相关但可以涵盖绝大部分信息的综合变量。对于大数据提取,主元分析法的实用度较高,可有效地提升研究人员的工作效率。
其数学模型为:设有n个样本,每个样本观测p项指标X=(X1,…,Xp)T
式中:F1,F2,…,Fp是主元,即原始数据的关键信息;a11,a21,…,ap1,ap2,…,app是原始变量与主元之间的相关程度的指标,Xi为因子载荷,也就是原始变量。
动力学试验:将400 g的红土镍矿与硫酸铵在一定条件下进行混合焙烧,将盛有去离子水的烧杯置于恒温水浴锅中,加热到设定温度后,按液固比(水:红土镍矿)2.51的比例加入焙烧熟料,边搅拌边溶出,溶出至设定时间后,每间隔10 min取样10 mL,取样液体过滤后采用重铬酸钾滴定法测定溶出液中铁的量,并计算铁的提取率。
主元的计算中,总方差不变,通过对原始变量结构的调整实现元的整合。占据最大方差的元,数据离散程度也最大,也就是包含了原始变量的大部分信息,称为第一主元,次大方差的元为第二主元,依次类推。因此虽然p个变量对应有p个主元,但在实际应用中,主元通常提取占全部方差的比重大于一定阈值(如:85%)的m个主元进行分析,也就是将原来的p个指标转化为m个综合指标,通过估算主元得分,完成对指标的综合评价。
应用于业扩生长曲线,将不同客户的用电量作为原始变量,进行分时间、分客户的双向切割,实现主元的多维提取,这样得到的最大限信息的最小不相关集合,是将用电分析从根源客户提升到行业的最佳手段。
选取某地区钢铁行业2007—2012年新装业务做实例分析。
首先,选取新装业务后用电量排名前20名的客户,并归纳其接电后12个月的用电量规律;其次,去除客户用电曲线不符合客观规律的数据,比如:客户新装业务后由于市场原因大规模减产,或受政策影响实行节能减排导致产量降低、用电量下降等,示例中以用电量环比大于0为依据,筛选出新装后用电量上升且排名前10名的客户;最后,将10名客户业扩报装后的用电量采用Logistic、Gompertz及Von Bertanlanffy模型,利用SPSS2.0统计分析软件进行循环迭代[9],拟合计算出各模型参数的最优估值A、B、k,收敛标准为10-8,并根据各模型推算出理论拐点月份、拐点电量及拟合度R2。
10家钢铁行业典型用户的Logistic、Gompertz及Von Bertanlanffy模型拟合结果详见表2。可见,3种非线性模型对于典型客户接电后用电量拟合度基本都处于0.98以上,说明拟合效果较好,能很大程度上描述10个典型客户接电后用电情况,其中企业1、企业4、企业6、企业8、企业9及企业10等6个客户对于Logistic模型的拟合效果较好,拐点月份分别为5个月、2个月、2个月、3个月、5个月、7个月;而企业2和企业5拟合度更加倾向于Gompertz模型,拐点月份分别为3个月和1个月;Von Bertanlanffy模型在拟合度上相对适合企业3和企业7的用电趋势,其中企业3当月就达到拐点,而企业7在3个月左右增速趋缓。虽然各个客户最佳拟合模型不一致,但是从整体来看,10个典型客户发生新装业务接电后用电曲线拐点在3.1个月。
(1)主元提取
采用SPSS2.0统计分析软件对钢铁行业10个典型用户的最佳拟合业扩生长曲线1—12月用电量进行主元提取[10],提取原则为累积贡献率达到90%以上、特征值大于1,即找到可以表征整个行业在1—12月各月的用电量水平的主因子。分析得到一个主元,贡献率为96.67%,特征值为9.67,可见原变量的信息集中度非常高,根据分布在各个变量的载荷信息计算主元,见表3。
(2)行业业扩生长曲线
针对集萃的主元,采用Logistic、Gompertz及Von Bertanlanffy模型,对主元进行生长曲线拟合。此外,为更加全面细致的研究钢铁行业新装用电生长曲线的内在变化规律,进一步推算用电曲线的瞬时生长率、瞬时生长加率和相对生长率。
3种模型对于主元用电曲线拟合效果都很好,Logistic与Von Bertanlanff模型拟合度为0.999,而Gompertz模型拟合度为1.000,拐点月份出现在2月时,彼时用电量为24 170万kWh。进一步剖析其生长率可见(图3),瞬时生长率在2—3月,也就是在主元用电量的拐点位置达到峰值,在达到拐点之前瞬时生长率上升趋势,用电量增速增长,3月份以后瞬时生长率逐渐减小,用电量呈现减速增长态势;以拐点分界,可将生长过程分为加速生长期和减速生长期。需要注意的是,无论是加速生长期还是减速生长期,瞬时生长率的变化都不是均速的。瞬时生长加率展示的是生长率的变化速度,其在2—3月结束正增长,Logistic模型于6月达到最低速、Gompertz模型于5月份达到下降速度最大值、Von Bertanlanff模型则锁定4月份。由此可以将整个生长过程依次划
分为2个时期:快速生长期和渐进生长期。快速生长期内,瞬时生长率虽然在增加,但是增长速度在逐步减小,到曲线拐点的时候,瞬时生长率停止为0,随着时间的推移,瞬时生长率负向增长越来越快,直至快速生长期末。综合考量发现,快速生长期是加速生长期和减速生长期各自的一部分的加和,此阶段瞬时生长加率高于其他时期,也是用电量增长最快的阶段。渐进生长期的特点是,瞬时生长率继续下降并缓慢地趋于0,与此同时,用电量也逐步趋于渐进值。
表2 3种生长曲线模型参数估计值和拟合度
表3 主元矩阵
图3 行业生长率分析
钢铁行业生长曲线见图4。针对拟合度为1.000的Gompertz模型,快速生长期1—5月,渐进生长期为6—12月。在快速生长阶段,每个月电量投运比例分别为21.61%、35.37%、49.52%、62.32%、72.93%、81.20%,稳定后用电量在69 811万kWh左右。
可见行业业扩生长速度相对较快,每月电量投运比例几乎线性增长。一方面,客户进行业扩报装时市场需求旺盛;另一方面,大客户电量都是由容量电费和电量电费2个方面构成,因此客户在接电后为尽快投入生产,在用电设备调试等各方面工作都会加快步伐,这就决定了用户在接电初期处于快速生长期阶段,经过调试后很快就会进入渐进生长期的特质。
图4 钢铁行业生长曲线
(1)本文定义了业扩生长曲线的概念,使得业扩报装业务和S型生长曲线无缝结合,为业扩报装业务的量化分析奠定了良好基础。
(2)以某地区钢铁行业为例,通过主元提取客户接电后用电特性,综合模拟行业接电后用电趋势,将行业业扩生长曲线划分为快速生长期和渐进生长期2阶段。
(3)推算出钢铁行业快速生长期(设备调试阶段)每月电量投运比例,以便于下一项研究内容电量预测工作的开展。
[1]谢明.基于IEC61968的电业局营销业扩报装信息化系统的设计与实现[D].西安:西安电子科技大学,2012.
[2]朱蕊.业扩报装系统的设计与实现[D].成都:西南交通大学,2007.
[3]卢明珠,王熙照.业扩报装空间辅助决策支持系统的设计与实现[J].电力系统及其自动化,2006,30(17):84-88.
[4]Darmani kuhi H,Kebreab E,Lopez S,et al.An evaluation of different growth functions for describing the profile of live weight with time(age)in meat and egg strains of chicken[J].Poultry Science,2003,82(10):1 536-1 543.
[5]Khamis S,Ismail Z,Horan K,et al.Norlinear growth models formodeling oilpalm yield growth [J].Journalof Mathematics and Statistics,2005,1(3):225-233.
[6]邢黎峰,孙明高,王元军,等.生物生长的Richard模型[J].生物数学学报,1998,13(3):348-353.
[7]陈玉.曲线拐点的判别法[J].高等数学研究,2008,11(5):9-10.
[8]张乐潓.钆稼石榴石晶体瞬时生长率的估算[J].硅酸盐学报,1980,8(2):114-119.
[9]戴国俊.应用统计软件SPSS拟合生长曲线方程[J].畜牧与兽医,2006,38(9):28-30.
[10]林海明.如何用SPSS软件一步算出主成分得分值[J].统计与信息论坛,2007,22(5):15-17.