国网冀北电力有限公司经济技术研究院 汲国强 李笑蓉 丁健民 单体华 王智敏 秦砺寒 吴小明
基于数据挖掘的唐山地区用电量与空气质量相关性分析
国网冀北电力有限公司经济技术研究院 汲国强 李笑蓉 丁健民 单体华 王智敏 秦砺寒 吴小明
唐山是典型工业城市,其用电量受大气污染防治政策冲击严重。文章以2014年APEC会议期间唐山用电量及空气质量相关数据为基础,采用数据挖掘方法,对唐山空气质量及其影响因素进行了聚类分析,并挖掘了用电量与空气质量之间的关联规则。研究结果表明,高耗能行业限产停产总体上有利于空气质量的改善,但限产停产措施效果还需取决于气象因素。研究成果可以为京津冀地区应对重污染天气及重大事件期间的空气质量保障计划提供参考依据。
空气质量;用电量;关联分析;聚类
唐山是冀北地区主要工业城市,二产用电量占全社会用电量比例高达85%以上。二产用电量中又以高耗能行业为主。近年来,华北地区雾霾天气日益频繁,给社会生产和居民生活都带来了严重影响。为治理雾霾,国家采取了一系列措施[1],包括京津冀地区压减燃煤、限行车辆、对工矿企业采取停产限产或升级改造措施等[2][3]。在政策影响下,唐山地区工业用电量受到严重冲击。除产业结构调整的大环境外,为保障首都地区重大事件期间空气质量而采取的临时性停产限产措施也严重冲击着唐山地区用电量。
为准确把握地区工业生产与空气质量之间的关系,从而为地区电力规划和大气污染治理提供决策依据,本文以唐山地区为示例,采用数据挖掘技术,对重大事件期间用电量与空气质量之间的关联关系进行分析并提取关联规则,所得成果可以类似推广到其它工业城市,并为后续制定重污染天气下空气质量保障计划提供参考依据。
本文选取首都地区重大事件期间周边地市全社会用电量数据加以分析。所谓首都地区重大事件,是指首都地区发生的需要在京津冀地区采取停产限产措施以保障空气质量的政治、体育、文化等类事件。重大事件期间,具有高污染特征的工矿企业受政策影响基本处于停产或限产状态,而污染较少的一产、三产以及居民生活用电则受影响较小。重大事件期间某地区日用电量的变化基本反映了该地区工业企业生产状态的变化。因此,通过对比重大事件时段与普通时段的用电量及其它各项指标即可挖掘出工业生产与空气质量之间的关联关系。
2014年APEC峰会于11月5日至11日在北京举行,属于首都地区典型重大事件。APEC会议包含四个阶段,其中10日至11日的领导人会议是全年APEC活动高潮。在此期间,河北省执行了一系列空气质量保障工作[4][5],对地区用电量产生了严重影响。设定研究时段为10月29日至11月18日共21天,这一期间唐山地区日用电量变化曲线如图1所示。
从图1可见,在APEC会议期间,唐山地区日用电量相比于正常时段出现显著下降,在10日至11日APEC第二十二次领导人非正式会议期间达到最低谷,此时用电量相比于正常时期削减了44.8%左右。
空气质量指数(Air Quality Index, AQI)是定量描述空气质量状况的无量纲指数。唐山地区APEC会议期间AQI指数如下图所示。从图2所示可见,APEC会议期间唐山地区大部分时段空气质量均为良,少部分时段为轻度污染,此外还有极少时段为中度和重度污染。仅从曲线形态来讲,AQI指数与日用电量曲线之间并无显著相关关系。
为准确把握工业生产对空气质量的影响,这里选取每日气压、日平均温度、日平均风速和日平均相对湿度四种气象因素,与日用电量一起作为影响空气质量的主要因素。
采用数据挖掘算法分析唐山地区APEC会议期间日用电量与空气质量之间的相关关系。考虑到AQI指数及其影响因素均为连续变量,处理较为复杂,本文首先对各指标进行聚类分析,将指标样本分解为若干子集,随后采用关联分析算法挖掘各指标子集之间的关联规则。
图1 唐山地区APEC前后日用电量变化曲线
图2 唐山地区APEC前后AQI曲线
4.1 指标聚类
采用k-means聚类算法[6],对AQI指数及其五大影响因素分别进行聚类,设定每种指标聚类个数为两个。聚类结果整理如表1所示。表中给出了各指标每个子类名称及包含样本数。
表1 唐山APEC会议期间指标聚类结果
4.2 关联规则挖掘
采用Apriori算法挖掘AQI及其五类影响因素之间的关联规则,设置最小支持度为20%,最小置信度为50%,共挖掘得到规则243条。其中AQI作为后项的规则共有23条,前项中包含日用电量且后项中包含AQI的规则共有7条,如表2所示。
表2 关联规则挖掘结果
分析上表可得到以下结论。
(1)从规则支持度来看,同时涉及到日用电量和AQI的规则支持度均不高,最高仅为33.33%,表明二者之间并非具有显著相关性;
(2)从提取出来的规则类型来看,有6条规则的前项同时包含了日用电量和气象因素,仅有1条规则前项只有日用电量,表明日用电量单独作用对空气质量的影响程度不如日用电量与气象因素联合作用更为显著;
(3)从规则内容来看,规则1~3表明日用电量较高且气象条件不利于污染物扩散时,往往会导致空气质量较差,规则5~7表明日用电量较低且气象条件有利于污染物扩散时,往往会导致空气质量较好,对比规则4与规则5、7的置信度可见,尽管各规则支持度相同,但日用电量与气象因素联合作用下规则置信度(100%)要高于仅有日用电量作用下的规则置信度(71.43%);
以上分析均表明,空气质量是多种因素综合作用的结果,而并非单纯由工业生产所决定。工矿企业停产限产固然有利于空气质量的改善,但只有与良好的气象条件配合时才能带来显著的效果。
通过对本文分析可以发现,空气质量影响因素繁多且机理较为复杂,工矿企业污染物排放只是其中一个方面,只有在良好气象条件配合的情况下,企业停产限产对空气质量的改善效果才能显著体现。
随着我国国际影响力的提高,首都地区重大政治、文化、体育事件会日益频繁,从而给京津冀地区空气质量保障提出了更高的要求和挑战。基于本文分析结果,可以给出如下建议。
(1)短期来看,保障地区空气质量而采取的停产限产措施必须与气象条件紧密结合起来,当未来一段时间气象条件不利于污染物扩散时,必须有针对性的采取更加严格的空气质量保障措施,从各个源头尽可能减少污染物排放;
(2)长期来看,高耗能行业的转型升级总体上有利于空气质量的改善。京津冀地区应继续大力推进去产能政策,减少高污染高耗能行业,大力扶植新兴产业,保障大气污染防治行动计划的顺利实施。
[1]国务院大气污染防治行动计划[R].国务院办公厅,2013.
[2]京津冀及周边地区落实大气污染防治行动计划实施细则[R].环境保护部,国家发展和改革委员会,工业和信息化部,财政部,住房和城乡建设部,国家能源局,2013.
[3]河北省大气污染防治行动计划[R].中共河北省委,河北省人民政府,2013.
[4]亚太经合组织会议河北省空气质量保障措施[R].(冀政办函〔2014〕82号),河北省住房和城乡建设厅,2014.
[5]2014亚太经合组织会议空气质量保障措施编制原则[R].河北省环保厅,2014.
[6]数据挖掘导论[M].人民邮电出版社,2011.
汲国强(1986—),男,博士,现就职于国网冀北电力有限公司经济技术研究院。