服务于区域光伏预测的天空图像K-means云空辨识模型

2017-12-26 11:19李红萍严玉廷Engerer米增强
关键词:红蓝像素点聚类

苏 适, 李红萍, 严玉廷, 陆 海, 王 飞,3,任 惠, N.A.Engerer, 米增强

(1.云南电网有限责任公司电力科学研究院,云南 昆明 650217; 2.新能源电力系统国家重点实验室,河北 保定 071003,3.美国伊利诺伊大学厄巴纳-香槟分校,伊利诺伊州 厄巴纳 61801,美国;4.澳大利亚国立大学环境与社会学院,堪培拉 2601,澳大利亚)

服务于区域光伏预测的天空图像K-means云空辨识模型

苏 适1, 李红萍2, 严玉廷1, 陆 海1, 王 飞2,3,任 惠2, N.A.Engerer4, 米增强2

(1.云南电网有限责任公司电力科学研究院,云南 昆明 650217; 2.新能源电力系统国家重点实验室,河北 保定 071003,3.美国伊利诺伊大学厄巴纳-香槟分校,伊利诺伊州 厄巴纳 61801,美国;4.澳大利亚国立大学环境与社会学院,堪培拉 2601,澳大利亚)

地基天空图像的云空辨识及云团预测是研究区域电网光伏发电功率分布与变化的前提,对支撑调度提高光伏发电消纳比例具有重要意义。首先分别采用较高的红蓝分量比值和较低的红蓝分量比值作为固定阈值分割地基天空图像,依次提取辨识结果中的天空像素点和云像素点的位置信息并获取原图像中对应位置的天空像素点和云像素点的RGB值;其次对获得的天空像素和云像素求均值并将各自均值中的红蓝分量相除获取初始聚类中心;然后使用K-means算法,利用加权欧式距离计算每一个聚类样本与聚类中心之间的距离,通过数次迭代得到聚类结果,进而将聚类结果还原成矩阵得到地基天空图像的云空辨识结果图;最后利用云南某光伏电站全天空成像仪TSI-VIS-J1006采集的天空图像进行仿真,结果表明该方法较固定阈值法的收敛速度更快、聚类精度更高,能够有效实现地基天空图像的云空辨识。

初始聚类中心; 天空图像; 云空识别; 区域光伏预测

0 引 言

气候问题、资源短缺使得充分利用可再生能源已经成为全球共识。以太阳能、风能为代表的大规模可再生能源并网发电已经成为新型电力系统不可阻挡的发展趋势,对电力系统深层次的影响正在凸显[1]。然而光伏发电由于受太阳辐照度、环境温度等不确定因素的影响导致其出力具有间歇性和随机波动性。为降低光伏发电并网对电网带来的冲击,提高太阳能的利用率,准确的功率预测是首要任务。目前,光伏发电功率预测方法主要根据历史气象要素数据和光伏电站输出功率数据进行统计分析或神经网络方法进行预测,如基于人工神经网络的预测模型[2]和基于支持向量机的预测模型[3]。上述方法在晴空条件下功率预测误差较小、精度较高。但在多云天气下由于未涉及云团移动造成的辐照度变化导致在多云天气下光伏发电预测精度有限。为解决上述问题,文献[4]通过云团分类识别与云团运动预测环节预测未来云团运动图像预测水平面总辐射值。文献[5]利用数值天气预报和地基云图相结合,根据预测时间的范围采用不同的云提取模型和辐射衰减模型。由于云团形变在短时间内变化缓慢,未来时刻的运动可通过云团的跟踪学习对云团移动速度和移动方向进行预测从而得到未来时刻此云团的位置,计算出云团未来时刻对辐照度的影响。上述两种方法由于涉及云团提取、运动预测和云团遮挡提高了光伏发电功率预测的准确性和可靠性。由于地基观测设备拍摄的天空图像具有观测点灵活、易操作、方便快捷和成本较低等优势,因此云提取多采用地基天空图像。现阶段国内关于地基天空图像云团提取的研究尚处于起步阶段。

天空图像的云空辨识涉及一种图像分割技术,阈值分割技术是最经典和流行的图像分割方法之一[6]。文献[7]对RGB图像进行处理选取红蓝波段比值0.77为分割阈值,即大于0.77为云,小于0.77为天空,获得较好的云检测效果。但是,固定阈值法由于所选阈值的单一性不能适用于所有天空图像。为了克服这一缺点,文献[8]提出了一种自适应算法计算分割阈值。该算法选取使类间方差最大的最优阈值分割天空图像取得了较好的云空辨识效果。但是此算法处理少云、多云类型的天空图像时因云空像素点数量的不平衡导致辨识结果误差很大。同时,对于云空辨识结果分析通常是通过人眼对比,始终缺乏一个通用的评价标准,这将给天空图像的云空辨识带来一个巨大的挑战。

本文在阈值法的基础使用K-均值聚类算法进行云空辨识。K-均值聚类算法,又称为K-means算法,是一种无监督模式识别学习方法,初始聚类中心依据相似性和相邻性构造分类器,从而将给定的数据对象分割为若干不同的类[9]。该算法对初始聚类中心具有很强的依赖性。文献[10,11]提出了初始聚类中心的选取方法。通过对图像中云和天空像素点的颜色特征的提取得到初始聚类中心,同时引入云图像素归一化红蓝比值[12],利用K-means算法实现对天空图像的云空辨识。将此方法应用于云南地区光伏电站中的地基设备TSI-VIS-J1006采集的天空图像,结果表明该辨识方法能够较准确的辨识各种类型的天空图像,具有很高的应用价值。

1 天空图像采集

近年来,电荷耦合器件(Charge Coupled Device, CCD)等硬件技术的不断发展,很多地基遥感测云仪器研制成功,其中以全天空成像仪(Total Sky Imager, TSI)为代表。TSI具有成本低、易集成、易维护性的优点,因此在大多数地基天空图像采集系统中选均用TSI作为对云进行观测的硬件设备。本文使用型号为TSI-VIS-J1006的天空成像仪采集实时天空彩色图像,其分辨率为1083×1083,采样频率为1 min/张。TSI-VIS-J1006由EKO Instruments公司研制的自动、全彩色天空成像系统,能够满足各种天气下对局部地区天空的观测需要[13]。该设备采用具有数字图像处理功能的新型摄云机Total Sky Camera J1006。摄云机上的半球形遮光屏可以避免阳光直射起到保护TSI的作用。图1为TSI-VIS-J1006的外观。

由于TSI采用球面成像,天空图像的边缘部分会产生较大的畸变并且会受到TSI安装位置周边建筑物的影响导致天空图像中建筑倒影的存在。TSI VIS-J1006自带畸变校正和噪声去除的软件,将天空图像复原。图2(a)是TSI拍摄的天空图像,图2(b)是复原之后的天空图像。文中采用的云空辨识算法均是在复原图像的基础上进行操作。

图1 Total Sky Imager VIS-J1006Fig.1 Total Sky Imager VIS-J1006

图2 TSI拍摄的天空图像以及复原图像Fig.2 Sky image and restored image

2 基于K-means算法的图像分割算法

K-means算法用于图像分割是通过提取天空图像的颜色特征构成聚类样本,根据选定的聚类数和聚类中心按照选定的距离测度将每一个样本划分到某一类别中,使得分类结果中同类别中样本点的相似度较高而不同类别中样本点的相似度较低,从而实现图像分割,具体流程图见图3。由于传统的K-means算法随机选择聚类中心使得每次聚类都可能产生不同的分类结果。文中针对每一幅图像的颜色特征选择聚类中心,使用加权欧式距离对样本进行分类,使K-means算法更具针对性。

图3 云空图辨识流程Fig.3 Cloud identification flow chart

2.1 提取复原天空图像的特征矩阵

TSI拍摄的天空复原图像是真彩色图像,图像由红、绿、蓝三个通道构成,即图像中每个像素点都采用相互独立的红(R)、绿(G)、蓝(B)三色光相互叠加来实现混色。真彩色图像采用3个维度相同的二维数组表示并且各数组元素均用0至255的整数表示各基色分量的强度。提取复原天空图像的R矩阵(红色分量矩阵)、G矩阵(绿色分量矩阵)、B矩阵(蓝色分量矩阵)。R矩阵、G矩阵、B矩阵中采用行和列体现天空复原图像中像素点的位置信息,元素值为对应基色分量的在此像素点的像素值。然后根据公式(1)提取的红蓝分量归一化差值矩阵。四矩阵为同型矩阵,分别将四矩阵中的每一列按列编号顺序排列成一个列向量,根据公式(2)获得复原天空图像的特征矩阵f。图2(b)复原图像中存在黑色背景区域,为去除背景区域的影响需将复原天空图像通过rgb2gray函数转为灰度图像并提取灰度矩阵,灰度矩阵中灰度值为0的像素点构成的区域为黑色背景区域,提取0灰度值像素点的位置信息并将特征矩阵中对应位置行向量设为空值即可去除背景区域的影响。应用K-means算法对四个列向量构成的矩阵聚类,得到聚类结果。若复原天空图像分辨率较高,可适当进行缩放以提高云空辨识效率。

(1)

式中:r为红色分量像素值;b为蓝色分量像素值;d为红蓝分量归一化差值。

f=[rc,gc,bc,dc]

(2)

式中:rc为红色分量列向量;gc为绿色分量列向量;bc为蓝色分量列向量;dc为红蓝分量归一化差值列向量。

2.2 K-means算法原理

K-means算法是基于硬划分准则的常用聚类算法,其核心思想是通过不断迭代更新聚类中心,使非线性目标函数聚类误差平方和最小,从而得到最优的聚类效果。非线性目标函数聚类误差平方和J的计算公式为

(3)

式中:k为分类的类数;nk为第k个聚类中的数据总数;xj为第k类的数据;yk为此类的聚类中心。K-means算法的具体步骤如下:

步骤一: 确定需要分类的类数k。将复原天空图像进行云空辨识即将天空图像分成云和天空两部分,因此聚类数为2。

步骤二:选取k个类的初始聚类中心。k为2即分别选取云像素点的聚类中心和天空像素点的聚类中心。太阳光由波长不同的红、橙、黄、绿、青、蓝、紫七种颜色构成。根据瑞利散射散射光强度与波长的四次方成反比,当太阳光透过大气时,波长较短的蓝光和紫光碰到大气分子、冰晶、水滴很容易发生散射现象,由于人眼对紫光不敏感使得晴朗天空呈蓝色。云是由小水滴和空气中的粉尘组成,它的直径大于任何一种颜色的光的波长,因此云可以反射所有光线,使得云在天空中呈现出白色。采用红蓝通道的比值运算可以突出不同波段间光谱的差异,提高对比度。文献[7]中用红蓝波段比值0.77为固定阈值分割地基天空图像,大于0.77为云小于0.77为天空。以此方法为依据获得K-means算法的初始聚类中心,具体步骤如下:

(1)提取复原地基天空图像的R矩阵、G矩阵、B矩阵;将R矩阵和B矩阵对应位置元素的相除得到红蓝波段比值矩阵If;

(2)以0.77为阈值分割If时由于所选阈值的单一性会造成云的误识或漏识,为确保初始聚类中心云像素点和天空像素点具有较高的可信度,选取较大阈值进行云像素点的选取,选取较小的阈值进行天空像素点的选取。当阈值较大时,辨识结果图像中检测出的云的范围将缩小,对云的误识概率大大降低;反之,当选取的阈值较小时,天空像素的误识的概率降低,因此用较小阈值分割If所得的辨识结果中的天空像素的可信度较高。综上所述,选取较大的红蓝波段比矩阵的分割阈值Th满足0.77

(3)根据公式(4)选取较高可信度的云像素点和天空像素点:

(4)

(4)提取步骤3中选取的云像素点位置信息,通过此位置信息获得复原图像中对应位置像素点的颜色特征即红、绿、蓝分量值,然后分别求取云像素点红、绿、蓝三分量的均值,求取红蓝均值的归一化差值,并将其组成一个一行四列的行向量作为云像素点的初始聚类中心。同理提取与步骤3中获得天空像素点同位置处的复原天空图像中像素点的红、绿、蓝分量值,然后分别求取均值并求取红蓝均值的归一化差值,组成一个一行四列的行向量作为天空像素点的初始聚类中心。综上所述,复原天空图像特征矩阵的聚类中心是2行4列的矩阵,矩阵中第一行为天空像素点的聚类中心,第二行为云像素点的聚类中心。对聚类中心矩阵的规定能使复原天空图像中采用K-means算法辨识出的天空像素点的类型标识符为“1”,云像素点的类型标识符为“2”。

步骤三:基于加权欧式距离的K-means算法,根据初始聚类中心对复原天空图像的特征矩阵进行聚类计算,计算特征矩阵中各行向量与当前聚类中心的距离,找到离它最近的聚类中心,并将该行向量分配到该类;加权欧式距离的计算公式为

(5)

图3 误辨识天空区域与云区域对比Fig.3 Mistaken identification area sky and clouds contrast

式中:xi和yi为像素点特征矩阵中行向量第i维数值,yi为当前聚类中心第i维数值;ai为特征行向量第i维数值的权重系数。权重系数的设定对于云空辨识结果影响较大。由于红蓝波段归一化差值在云空辨识中精确度较高,因此需设定较高的权重系数来凸显这一优势。然而,若权值过大则会使加权欧式距离的计算只依赖与红蓝波段归一化差值,红绿蓝通道的影响大大降低,造成云空辨识采用的天空图像特征量较少使辨识结果存在较大偏差。为了把红绿蓝三个彩色分量作为一个整体进行聚类,并体现红蓝波段归一化差值的优势,通过大量的仿真验证,将红蓝波段归一化差值的权重设定为2.5,红绿蓝分量的权重均为1。

步骤四:分别计算新生成的各类中所有对象的均值,并作为新的聚类中心。聚类中心的计算公式为

(6)

式中:w为第k类聚类的特征行向量的个数;xij为第j个特征行向量的第i维数值;ci为新的聚类中心的第i维数值。

步骤五:计算非线性目标函数聚类误差平方和,若其收敛则停止聚类否则重复步骤三~步骤五。

2.3 聚类结果还原

K-means算法聚类的结果是只包含每个样本类别信息的列向量。采用K-means算法将不包含黑色背景区域的复原天空图像像素点分成两类,因此聚类结果中只包含类型标签1和类型标签2。为使云空辨识结果图中包含黑色背景区域,建立一个与R矩阵同型的零矩阵,根据聚类结果确定矩阵中复原天空图像各像素点所属区域的类型,将该矩阵中每个元素(矩阵中只包含0、1、2三种元素值)乘127.5,使矩阵元素分布在0至255之间得到云空辨识图像。聚类结果中天空像素点的类型标识符为“1”,云像素点的类型标识符为“2”,正比例变换后天空像素点的像素值为127.5,云像素点的像素值为255,因此辨识结果图像中天空呈现灰色,云呈现白色。

在用此方法处理图4(f1)时,由于图4(f1)中存在由于强光照射白光掩盖了蓝色,使天空呈现白色。在处理此类型图像中此方法会将由于强光照射造成的白色区域误辨识为云。为解决这一问题,首先提取由于强光造成天空呈现白色区域(下述中统称为误辨识区域)的红绿蓝三通道的值;然后提取天空图像中云的RGB值。采集两种类型的像素点各254个,绘制折线图如图3所示。通过对比分析数据发现,误辨识区域的B分量值较大,并且各通道之间存在较大的差值,然而云像素点的红绿蓝各通道之间存在较小的差值。因此误辨识特征为

在进行云空辨识之前首先找出满足以上三个条件的像素点,并将此像素点标记为天空像素点。即找出满足条件的像素点在聚类结果中的对应位置,将其类别编号设置为1;然后提取剩余像素点构成的复原图像的特征矩阵,采用上述方法选取聚类中心,使用K-means算法得到云空辨识结果。

3 仿真结果与分析

基于上述云空辨识方法针对云南某光伏电站TSI设备采集并进行形变矫正、去噪处理后的复原图像进行云空辨识。根据天空图像中云量的不同从云南地区2015年7月22日至8月16日地基天空图像中选取200幅进行云空辨识。在本文中只选取较有代表性的6幅图像进行仿真示例。图4(a1)的拍摄时间为7月22日19时55分2秒,天空图像中无云。图4(b1)拍摄于8月12日8时29分2秒,天空图像中云量较少,图4(c1)拍摄于同一天的15时11分2秒属于中等云量类型的天空图像。图4(d1)拍摄于7月30日10时3分2秒是多云类型的地基天空图像。图4(e1)拍摄时间为8月16日16时47分2秒,图中全部为云,是多云类型地基天空图像的特例。图4(f1)拍摄时间为8月7日18时27分2秒,图中左侧天空区域由于强光照射呈现白色,此区域易误辨识为云。图4(a2)~(f2)分别为图4(a1)~(f1)的云空辨识结果图。图4(a2)~(f2)中白色区域为使用上述云空辨识方法提取出的对应图4(a1)~(f1)的云,灰色区域为对应图4(a1)~(f1)的天空区域。

图4 复原天空图像与云空辨识结果图Fig.4 Restoration sky images and cloud identification results

对全部为云和全部为天空的特殊天空图像进行云空辨识,通过上述算法产生一组聚类中心,聚类结果中类别编号仅有一类,因此,图4(a2)准确的检测出图4(a1)中的全部天空,图4(e2)准确的检测出图4(e1)中的全部的云。对比辨识结果图4(b2)~(d2)与天空图像图4(b1)~(d1),图4(b2)~(d2)中均出现较薄云层漏检的情况。这是由于较薄的云层各通道像素值低于普通云层各通道像素值并且高于天空各通道像素值,聚类过程中由于较薄云层像素值距离天空聚类中心的距离较近,聚类结果中便将较薄云层的像素点归类为天空像素点,从而出现了对较薄云层的误检。图4(f1)中左侧天空区域在较强太阳光的影响下呈现白色,此处天空区域极易被误辨识为云,本文采用K-means算法通过三个限制条件的设定识别出此区域并将其标记为天空大大降低了此类天空像素点的误辨识率。

4 算法对比

将K-means算法与文献[7]中用红蓝波段比值0.77为固定阈值分割地基天空图像的方法进行对比。图5为采用固定阈值0.77分割图4(a1)~(f1)的红蓝波段比值矩阵所得的云空辨识结果。图5(a)和图5(e)云空辨识结果均不存在云像素点的误检和漏检现象。图5(b)~(d)和图5(f)存在不同程度的云像素点的误检和漏检现象。

图5 阈值法云空辨识结果图Fig.5 Threshold cloud identification results

由于对云空辨识效果缺乏统一的评价标准给结果分析带来巨大的挑战,同时由于使用云覆盖百分比作为云空辨识效果的评价标准并不能反应针对云或天空像素点同时存在误判和漏判时导致云覆盖百分比无变化这一情况下的云空辨识效果,为解决这一问题需要结合辨识结果图边缘与人工提取结果边缘的叠加图像反应该情况下的云空辨识效果。图6中白色较粗线条为人工提取图4(b)~(d)和图4(f)的云边界线,分别提取K-means算法和固定阈值法所得云空辨识结果图中云边界线并与人工分割结果叠加形成对比图。图6(a1)~(d1)中白色细线为使用K-means算法所得云空辨识结果图的云团边界线,图6(a2)~(d2)中白色细线为采用固定阈值进行云空辨识所得辨识结果中云团的边界线。通过对图6(a1)和图6(a2)的观察可得两种算法均存在云像素点的漏检,图6(a2)中存在将天空像素误检为云的情况。对于图4(c1)采用K-means算法和固定阈值法进行云空辨识所得结果与人工分割结果较为相似,图6(b1)和图6(b2)更直观的体现出这一较好的处理结果。K-means算法和固定阈值法对图4(d1)和图4(f1)的处理结果存在较大偏差,采用K-means算法进行云空辨识误差较小,和人工分割结果相近。图6(c1)~(d1)和图6(c2)~(d2)体现了这一处理效果。表1对比了K-means算法、固定阈值法处理结果与人工分割结果中云覆盖百分比(云覆盖百分比=辨识为云像素个数/天空图像总像素数),将表1中两种算法得到的云覆盖百

图6 K-means算法与固定阈值法云空辨识效果对比图Fig.6 K-means algorithm and fixed threshold method cloud identification results comparison images

分比分别与人工分割结果的云空覆盖百分比相减得到表2。表1和表2体现了上述对比分析,K-means算法处理图4(b1)所得结果与固定阈值的处理结果相比较差,但两种方法误差相差0.15%表示其处理结果相似。K-means算法处理云量较大的图4(c1)时云覆盖百分比的误差为1.09%明显优于固定阈值法6.54%的误差值。对于图4(f1)的处理,两种方法差异明显,K-means算法的云空辨识结果虽仍存在将呈现白色的天空区域误辨识为云的现象,但相较固定阈值法处理结果误辨识比例明显降低。

表1 云覆盖百分比对比

表2 误差对比

对比K-means算法和固定阈值法进行云空辨识性很难实现各类型天空图像较准确的云空辨识效果。本文基于K-means算法针对每一幅地基天空图像求取聚类中心,克服了传统K-means算法由于聚类中心的随机选择造成聚类结果不稳定,聚类准确率低的缺点。在提取效率方面两种方法的云空辨识时间相差无几。综上所述,K-means算法与以红蓝波段比0.77为固定阈值的云空辨识方法相比更具有普遍适用性。

5 结 论

本文提出了基于K-means算法的云空辨识方法,通过设定固定阈值更加合理的选择出云聚类中心和天空聚类中心。并且通过对强光影响的天空区域颜色特征的提取总结此类型区域的特征,实现此类型区域较好的云空辨识。通过对比K-means算法与固定阈值法的云空辨识结果、分析各自的优缺点可以得出:K-means算法处理地基天空图像取得较好的效果。但是,由于K-means算法中加权欧式距离的权重根据经验设定,造成云空辨识效果稳定性较差。如何更加合理的选择权重系数将是下一步的研究重点。

[1] 丁明,王伟胜,王秀丽,等. 大规模光伏发电对电力系统影响综述[J]. 中国电机工程学报,2014,34(1):1-14.

[2] ADEL M, ALESSANDRO M P. A 24 h forecast of solar irradiance using artificial neural network: application for performance prediction of a grid-connected PV plant at Trieste, Italy[J]. Solar Energy, 2010, 85(50):807-821.

[3] 王飞,米增强,甄钊,等. 基于天气状态模式识别的光伏电站发电功率分类预测方法[J]. 中国电机工程学报, 2013, 33(34):75-82.

[4] 丁宇宇,丁杰,周海,等.基于全天空成像仪的光伏电站水平面总辐射预报[J]. 中国电机工程学报, 2014,33(1):50-56.

[5] 朱想,居蓉蓉,程序,等. 组合数值天气预报与地基云图的光伏超短期功率预测模型[J]. 电力系统自动化, 2015, 39(6):4-10.

[6] 杨丹,赵海斌,龙哲,等. MATLAB图像处理实例详解[M]. 北京:清华大学出版社, 2015.

[7] KREUTER A, ZANGERL M, SCHWARZMANN M, et al. All-sky imaging: A simple, versatile system for atmospheric research[J]. Appl Opt,2009,48(6): 1091-1097.

[8] YANG J, LV W T, MA Y, et al. An automatic ground based cloud detectionmethod based on adaptive threshold[J]. Journal of Applied Neteorologial Science,2009,20(6):713-721.

[9] 李翠,冯冬青. 基于改进K-均值聚类的图像分割算法研究[J].郑州大学学报(理学版),2011,43(1):109-113.

[10] 吴晓蓉. K-均值聚类算法初始中心选取相关问题的研究[D]. 长沙:湖南大学, 2008.

[11] 张靖,段富. 优化初始聚类中心的改进k-means算法[J]. 计算机工程与设计,2013,34(5):1691-1694.

[12] 杨俊,吕伟涛,马颖,等. 基于自适应阈值的地基云自动检测方法[J]. 应用气象学报, 2009, 20(6):713-721.

[13] 朱想,周海,丁杰,等.全天空云图图像复原算法[J].计算机辅助设计与图形学学报,2014,26(6): 896-902.

Cloud Identification Model Based on K-means for Regional Photovoltaic Forecasting

SU Shi1, LI Hongping2, YAN Yuting1, LU Hai1, WANG Fei2,3, REN Hui2,N.A. Engerer4, MI Zengqiang2

(1. Electric Power Research Institute of Yunnan Power Grid Co., Ltd Kunming 650217, China; 2. State Key Laboratory of Alternate Electrical Power System with Renewable Energy Sources, North China Electric Power University, Baoding 071003, China; 3. University of Illinois at Urbana-Champaign, Urbana 61801, USA; 4. Fenner School of Environment and Society, The Australian National University, Canberra ACT 2601, Australia)

Cloud space identification of ground sky image and cloud prediction are the premises of studying the distribution and change of photovoltaic power in regional power grid. They are important for supporting scheduling and increasing the proportion of consumptive PV power generation. Firstly, the high and the low ratio of red and blue components were adopted respectively as fixed thresholds to segment ground sky images. We sequentially extracted the location of the sky and the cloud pixels in the identification results and got the RGB value of the corresponding cloud and the sky pixels in the original image. And then we calculate the average of the sky and cloud pixels that were obtained and make mean value of the red and blue components divided to get the initial cluster center. Then basing on the K-means algorithm and Weighted Euclidean distance, we calculate the distance between each cluster sample and cluster center. We get the clustering results by several iterations. Then the clustering results are reverted to a matrix so as to obtain the cloud space identification results of ground sky images. Finally, we use the sky images collected by the total sky imager TSI-VIS-J1006 of a PV power station in Yunnan to carry out simulation. And the results show that comparing with the fixed threshold method, this method is faster and its clustering accuracy is higher, and it can effectively realize the cloud space identification of the ground sky image.

initial cluster center; sky image; cloud identification; regional PV power forecasting

2016-09-29.

国家自然科学基金资助项目(51577067,51277075);北京市自然科学基金资助项目(3162033);河北省自然科学基金资助项目(E2015502060);河北省科技支撑计划重点项目(12213913D);云南省新能源重大科技专项(2013ZB005);新能源电力系统国家重点实验室开放课题(LAPS15009,LAPS16007);中央高校基本科研业务费重点项目(2014ZD29); 云南电网有限责任公司科技项目(YNKJQQ00000280).

TM615

A

1007-2691(2017)06-0061-08

苏适(1972-),男,高级工程师 ,研究方向为智能电网与新能源电力系统以及光伏风电功率预测。

猜你喜欢
红蓝像素点聚类
最爱红蓝饭
基于局部相似性的特征匹配筛选算法
基于K-means聚类的车-地无线通信场强研究
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割
基于高斯混合聚类的阵列干涉SAR三维成像
基于Spark平台的K-means聚类算法改进及并行化实现
基于改进的遗传算法的模糊聚类算法
红蓝饭飘香