国电电力新疆新能源开发有限公司 孟宪梁 杨 志 黄文广 华风数据(深圳)有限公司 袁昌国 饶 巍
鲁东大学数学与统计科学学院 张中正 付恩强 刘广臣
随着全球能源不断地消耗,且化石燃料所导致的环境问题日益突出,世界各国对清洁可再生能源的开发研究投入越来越大,其中利用太阳能,光伏发电的技术得到了迅猛发展,广泛应用于各个领域,但太阳能光伏电站在长期运行过程中,会出现一些影响光伏组件安全运行的问题,如隐裂、EVA 黄变、热斑等,其中热斑效应对光伏组件性能影响最大[1],已成为危害最大、发生最频繁的一类故障热斑效应是造成光伏组件损坏的主要原因之一,提早发现光伏组件热斑效应并及时解决,可有效减少损失[2]。
热斑检测一般使用电气检测和图像分析2种模式进行检测,电气检测是基于分析太阳能发电的电气数据,通过对发电数据的波动分析出是否存在故障[3]。该方法需要线路接入和电路监控,会增加光伏组件的额外成本。图像分析通常对红外图像进行分析,运用图像处理技术在红外图像中找到热斑的位置。小规模的光伏组件热斑检测可使用便携式红外仪进行直接观测,但大规模光伏发电站采用这种检测方式效率低下,而利用人工智能技术能达到快速、便捷及高效的完成检测[4]。
目前,光伏电站运维工作一般是先通过监测光伏发电系统的输出功率和输出电压粗略判断运行故障,然后根据经验对故障类型进行分类,再进行相应的处理。
但随着光伏电站规模的不断扩大,光伏系统的运行故障类型及频次也在不断上升,这不仅增加了光伏电站的运维工作量及工作难度,而且增加了运维成本。所以,传统的运维模式显然已经不再适用于当前的大规模光伏电站。
围绕此问题,国内外都进行了相应研究。在分析Otsu 法和最大散度阈值法的基础上,提出自适应最大散度阈值差法来进行红外图像识别[5]。基于边缘检测方式,使用Canny 边缘检测算子作为诊断模块进行光伏板故障识别[6]。先对光伏电池片的各种运行状态进行状态分类编码,然后通过可扩展脉冲神经网络方法实现了对光伏热斑的识别[7]。利用深度学习算法的CNN 对光伏板图像进行自动识别判断,找出有故障电池板的精确位置,以及确定故障的类型[8]。
在基于人工智能技术的光伏电站巡检系统中,无人机遥感技术、地面数据分析站等技术虽然已经相对成熟,但是在后期数据的处理方面,尤其结合深度学习算法的应用方面,国内外的研究和应用都还较少,因此这是一个值得探究的领域。
本文采用基于多层卷积神经网络的光伏组件红外热斑故障识别方法,解决由于特征数目过少,无法精确分类,即欠拟合问题或由于特征数目过多,导致在分类过程中过于注重某个特征导致分类错误,即过拟合的问题。通过深度学习算法对实时数据、无人机采集图像等数据的综合分析,快速、准确地进行故障定位及检测,不仅可以做到故障早预防、早发现、早解决,避免电量损失及事故发生,还可以进行智能化的故障定位及识别,大幅度提高光伏电站的发电量,降低维修事故及成本。
分析时间跨度:某天上午8:00-14:00光伏板红外录像数据。
图片采样频率:红外视频每12帧间隔采样图片数据。
图片命名方式:具有热斑的标记为1,其余标记为0。
为了使算法能够在红外图像中更加准确的识别到热斑和异物,我们采取了如下的操作:首先将训练集和验证集中的红外图片(如图1所示)转换成黑白两色,以使图片特征更加明显。由于光斑和异物明显的呈现黑白两色,将其转换成单通道的图片并不影响识别过程。为了获得更多的数据,我们将图片随机水平翻转、随机旋转,并将数值归一化至[0,1]。测试集不执行数据增强工作。处理之后的图片展示如图2。
图1 红外状态下的图片数据
图2 黑白转换后的图片数据
卷积神经网络是一种人工神经网络,其的结构可以分为3层。
2.1.1 卷积层——主要作用是提取特征
卷积层是CNN 的核心,卷积层由多个卷积核组成,每个卷积核和上一层特征图的局部区域相连接,卷积核是一个权值矩阵,卷积核通过在上一层特征图上不断移动进行卷积运算,从而完成特征提取,卷积核移动的过程中,在同一层上其权值参数是共享的。卷积运算后,通过非线性激活函数的作用,增强网络的表达能力。卷积层对应的计算公式如下所示:
式中:xlj 为经过卷积运算后第l 层第j 个神经元的输出,xil-1是第l-1层第i 个神经元的输出,*为卷积运算,为卷积核,blj 为偏置,f 为激活函数。
通过卷积层,网络的特征图通常变得更深,可以对输入数据进行深层次分析,充分进行特征提取。网络训练时,为卷积核中权值和偏置设定初始值,训练过程中不断调整卷积核中权值和偏置,使网络性能达到最优。
2.1.2 池化层——主要作用是重采样,却不会损坏识别结果
池化层通常在卷积层之后,类似于卷积层,池化层和上一层特征图的局部区域相连接,进行池化操作。常用的池化操作包括平均池化和最大池化,平均池化是对特征图局部区域求取平均值,最大池化是对特征图局部区域求最大值。和卷积层不同,池化层没有权值等参数,只是一种运算规则,池化层不会改变上一层网络特征图的个数。池化层的计算公式如下所示:
式中:subsampling 表示池化函数
2.1.3 全连接层——主要作用是分类
全连接层位于CNN 的最后部分。经过卷积和池化操作后,特征图平铺为一维向量作为全连接层的输入,其中每个神经元和下一层所有神经元全部连接。根据任务要求,设定合适的全连接层和输出层神经元节点数,完成相应的分类或回归任务。其计算公式如下所示[9]:
为了避免过拟合,全连接层通常要采用随机失活(Dropout)技术,Dropout 是一种正则化技术,通过设置Dropout 值的大小,使得网络中部分节点不参与CNN 的训练过程,从而降低模型的复杂度,提高模型的适应能力。
CNN 能够有效的将大数据量的图片降维成小数据量,有效的保留图片特征,符合图片处理的原则图像,解决了需要处理的数据量太大,导致成本很高,效率很低,图像在数字化的过程中很难保留原有的特征,导致图像处理的准确率不高等问题。通过获得的数据,我们首先对其进行分类,将正常的光伏图片标记为0,将不正常的图片标记成1,对图片进行灰度处理,对数据进行数据增强,将数据分为训练集、验证集和测试集,将处理过的数据放入到神经层进行训练,首先对预处理后的数据进行卷积化操作,然后进行池化操作,这个过程中提取数据中重要的特征,抛弃对于学习累赘的特征,这个过程我们重复多次,提取特征中最重要的数据指标,然后将神经层中的数据进行全连接,通过全连接层输出0,1这两种类别。
本文利用无人机拍摄太阳能光伏板的远红外视频,结合图片处理和深度学习的方法,解决智能识别太阳能光伏板故障的问题。
我们先对数据进行采集,最终应用于样本数据进行训练的图片一共有4100张,其中正常图片1100张,故障图片3000张,将图片划分成70%的训练集,20%的验证集以及10%的测试集。
后对采集数据进行预处理,将经过预处理理后的图片划分为训练集和测试集,其中训练集占70%,测试集占30%,随后基于训练集利用卷积神经网络算法进行模型训练,并将训练得到的模型带入测试集中进行评估验证,最后利用经过评估验证的模型进行热斑红外图片的识别。
CNN 算法在光伏组件红外热斑故障识别中具有较大的优越性,为了展示模型的效果,在同样条件下建立多个其他模型与其进行对比,用与CNN 相同的70%的训练集,20%的验证集以及10%的测试集展示预测效果,综合分析各个算法模型指标。数据显示,CNN 算法在光伏组件红外热斑故障识别中能力显著优于其它算法,该算法预测的准确率高、时效性好、稳健性强。综合来看,我们选取CNN 算法模型。图3展示了CNN、Resnet18和Resnet50等多种算法模型在训练、验证及上的准确率,图4展示了各种算法的损失函数。评估各项评价指标对比结果后,针对bach_size 不同的取值如32或者64等参数的调优将数据带入模型中进行训练。
图3 不同模型Train Acc(A) 和Val Acc (B)对比图
图4 不同模型Val Acc_Loss 对比图
通过训练得到的数据,我们将迭代后稳定下来的结果进行平均值处理,对比模型的优劣。
我们从得到的结果可以看出CNN 算法总体上优于Resnet18以及Resnet50算法,在计算耗时上,如表1的数据显示CNN 算法耗时较短,具有更好的时效性,避免产生不必要的损失。在模型的准确率上,由上图3和表1所示CNN 算法较其他两种算法准确率高,图4可知CNN 的loss 值最低且不断地在降低,没有到达局部最优解。综上所述,CNN 算法在光伏组件红外热斑故障识别中效果最优。
表1 不同模型之间数据的对比
确定卷积神经网络的超参数;对红外图片进行卷积池化操作,其中用BatchNorm2d 方法对卷积层处理过的红外图象数据进行归一化操作,以免因数据过大而导致的网络性能不稳定,并且运用交叉熵损失函数和Adam 优化器进行训练,防止出现过拟合现象;对处理好的数据进行全连接操作;经过5次卷积完成对红外图片的特征提取。
对卷积神经网络的多种超参数进行确定,以优化模型的精度;通过卷积神经网络对于图像的训练集和验证集进行训练,得到的模型带入测试集,并验证模型准确率;通过不同超参数下准确率的比较,选取准确率高的超参数;通过不同参数之间的比较,发现当批处理(batch)=64时模型的准确率会比较高并取预测结果稳定下的平均值为0.938,达到预期的结果。
通过模型导出测试集的csv 文件进行构建混淆矩阵并计算其AUC[10]。即对所有正负样本获得一个score,然后对score 从大到小排序,令最大score 对应样本的rank 为n,第二大score 对应样本的rank 为n-1,以此类推。然后把所有的正类样本的rank 相加,再减去所有正样本和正样本配对的情况(即排在它后面正例的个数)。得到的就是所有的样本中有多少对正类样本的score 大于负类样本的score。然后再除以M×N,从而得到AUC 如下:
其中M 为正类样本的数目,N 为负类样本的数目,rank 的值表示能够产生score 前大后小这样的组合数。
计算所得混淆矩阵如表2所示:
表2 基于CNN 模型构建所得混淆矩阵
利用上述混淆矩阵,通过AUC 计算得到结果的准确率很高,几乎完美的分出了想要得到的结果。
通过采用了上述技术方案,本发明可利用无人机拍摄太阳能光伏板的远红外视频,利用深度学习中的卷积神经网络算法,解决智能识别太阳能光伏板热斑故障的问题。
本文利用无人机拍摄的太阳能光伏板远红外图像,采用CNN、Resnet18和Resnet50多种主流深度学习方法建模,并进行对比分析,寻求模型的最优体系。每种深度学习方法基于样本数据进行调参,选出最优的参数组合来拟合模型,达到局部最优。采用无人机搭载红外摄像机获取一手的光伏板图像数据,保证了训练数据的高质量要求。并采用多种图片处理方法,能够有效的提取图片特征,提高了模型的学习效率。可以对光伏板异物进行实时动态监测,极大的减少了光伏板监测和维护工作的复杂度。对可能存在异物遮挡的光伏板进行识别、定位,以便工作人员及时、准确的寻找到损坏的太阳能光伏板,并清理光伏板上的异物,从而提高光伏的发电效率。