基于机器学习的光伏组件故障危害识别研究

2023-03-20 03:22王腾达孙昊李前
电子产品世界 2023年12期
关键词:机器学习

王腾达 孙昊 李前

关键词:机器学习;光伏组件;热斑故障;故障危害识别

1光伏组件热斑故障介绍及产生原因

1.1介绍

光伏组件热斑故障是指光伏电池组件表面出现局部温度升高或局部损坏的现象。光伏组件热斑故障通常是由电池组件中的某些问题引起的,如电池片质量不均匀、电池片间接触不良、接触电阻过大、电池片内部和盖板中存在缺陷等。热斑故障会对光伏组件的性能和寿命产生不利影响。局部温度升高可能会导致光伏组件的整体效率下降,因为热斑会消耗一部分光能,使其不能转化为电能。热斑故障可能会导致局部电池片损坏,使得整个组件的性能下降,并最终影响电池组件的寿命。

1.2产生原因

光伏组件热斑故障的产生受到多种因素影响,因此需要综合考虑并采取相应的措施来预防和解决。具体影响因素如下:①电池片质量不均匀。在光伏组件制造过程中,可能会存在电池片质量不均匀的情况,导致部分区域的电池片性能较差,易发生局部升温,形成热斑。②电池片间接触不良。光伏组件中的电池片通过电池片间的导线连接,如果连接方式有问题或存在松动现象,可能导致局部电池片间接触不良,产生局部高电阻,使得该区域温度升高,引发热斑。③电池片内部缺陷。电池片内部可能存在生产过程中出现的缺陷,如晶体缺陷、金属污染等,这些缺陷会导致局部电池性能下降,产生热斑。④盖板缺陷。如果光伏组件的盖板存在缺陷,如局部失效、损坏,可能导致太阳能光线过度聚焦在局部区域,引起局部温度升高,产生热斑。⑤接触电阻过大。如果光伏组件中的连接件存在接触电阻过大的情况,会使得局部电路过热,形成热斑。⑥温度梯度效应。当光伏组件表面存在温度梯度时(不同区域间的温度差异),可能会导致局部热斑,尤其是在不均匀的发电场景下,易产生此效应。⑦遮挡物影响。光照条件良好,任何遮挡物都可能导致局部区域过度受热,从而在光伏组件表面形成热斑。⑧污染和覆盖。光伏组件表面的污染或长期的阴影覆盖可能导致局部区域的温度升高,引发热斑。

2相关算法介绍

2.1决策树

决策树是一种机器学习模型,模拟了一个树形结构,结构中的每个节点代表一个特征或属性,每条边代表该特征可能的取值,主要用于分类和预测任务。其通过一系列的决策规则来对数据进行分类或预测,每个决策规则都基于特征的属性。决策树的构建过程是通过对数据集进行分割,直到達到终止条件则停止。新数据会按照相同规则被决策树分类到最终的叶节点,从而得到相应的预测结果。决策树模型能够为问题提供清晰而直观的解释,进而推断结果,因此得到了广泛应用。决策树具体算法根据不同的特征选择策略被划分,这些算法在决策树构建和分裂的过程中采用不同的策略和指标。迭代二分器3代(iterative dichotomiser 3,ID3)算法使用信息增益来选择最佳的特征进行分裂;分类回归树4.5代(classification and regression trees 4.5,C4.5)算法是ID3算法的改进版本,使用信息增益比来选择特征,并且C4.5还可以处理连续型特征;分类回归树(classification and regression trees,CART)算法是一种既可用于分类,又可用于回归的机器学习算法。在决定如何对数据进行分裂时,CART算法使用基尼指数来评估特征的重要性,从而选择最佳特征进行分裂。

2.2梯度提升决策树

梯度提升决策树(gradient boosting decisiontree,GBDT)是一种集成学习方法,通过将弱分类器(通常是决策树)组合成一个强分类器来提高预测性能。GBDT使用的梯度提升算法是一种迭代的优化算法,通过逐步优化损失函数来构建一个强大的集成模型。在每次迭代中,GBDT都会尝试调整损失函数的梯度方向,不断拟合残差,从而逐步提升模型的性能。GBDT的基学习器通常采用决策树,每棵决策树都可对已构建决策树的预测误差进行优化,逐步减小残差,最终构成一个强大的集成模型。为了避免过拟合,引入正则化项,将决策树的深度限制在一定范围内,以避免模型过于复杂。同时,设置叶子节点的最小样本数,保证每个叶子节点中包含足够的样本数据,提高模型的准确性和鲁棒性。在训练完成后,通过将多个弱分类器的预测结果进行加权求和,集成学习可以有效地减少学习器的偏差和方差,并提高整体模型的鲁棒性和泛化台旨力。

3基于机器学习的光伏组件故障危害识别

3.1故障特征提取

在深度学习中,数据集的数量和质量对模型练习和预测结论都具有重要影响。模型拥有更多数据,这有助于获取新的信息,使模型可以更好地学习数据里的模型和关联性。但是,数据的品质也非常重要,既需要准确和完备的数据,同时还需要防止噪声和极端值的影响。特征工程的任务是将繁杂的原始数据转换成适合机器学习算法模型的高效特征,包括获取有关特征和筛选具有较强预测能力的特征。通过选择适合模型的特征,模型可以更好地捕获数据间的模型和关联性,提升模型的预测精密度;可以帮助提升模型的输入数据质量,增强模型的预测能力。因此,特征工程在机器学习算法中至关重要。

3.1.1热斑数据特征提取

为了获取热斑温度的有关特点,应该考虑热斑与周围环境温度的差异。通过对比热点区域温度和光伏发电板正常区域温度,可以计算差异值,而不是直接应用热点的温度值。为了尽可能获取更多特征,文中所选的温度有关特征包括:热点区域最高温度和正常区域平均温度的差异、热点区域平均温度和正常区域平均温度的差异、热点区域最低温度和正常区域平均温度的差异、热点区域温度标准偏差、热点区域温度标准差、正常区域温度标准偏差、正常区域温度标准差和热斑区域最大温差。通过选取热点区域长度、宽度和总面积,描述热点特征。在特征处理环节,对提取特征开展综合处理,清除失效特征,保证最后参加提取的特征合理。

3.1.2光伏组件数据特征提取

为了能获取故障光伏组件的信息特性,本文结合故障光伏组件的特性和目前数据处理流程,利用光伏组件损害的特性进行故障诊断。因为光伏组件的伤害程度与热斑的特性、数量相关,所以要从这两个方面开展特征获取。热点的级别和面积与光伏组件的伤害程度相关,挑选光伏组件中热斑故障的最高级别、单个热斑区域内的最大面积、全部热点区域内的占地面积和热点的最高温度作为热点特征的有关特征。挑选获取热斑数、高风险级别热斑数、中危热斑数和低危热斑数作为热斑数的有关特征。特征获取结束后,对标值特征开展归一化处理,对热点故障伤害级别开展量化处理。同时,清除失效特征,对特征进行相应降维处理,保证最后特征集具有代表性和可执行性。

3.2故障分类流程

本文采用两个分类模型对光伏组件的故障危害进行分类。第一个分类模型是热斑故障危害等级分类模型,负责对光伏组件上的热斑进行分类并划分出不同的故障危害等级。第二个分类模型是光伏组件故障危害等级分类模型,根据第一个模型的分类结果,对有热斑的光伏组件进一步划分,以确定其故障危害等级。本文通过联立两个分类模型,构建了光伏组件故障危害分类模型,实现了对光伏组件故障危害等级的准确划分。光伏组件故障危害等级分类流程如图1所示。

本文使用人工标注的方法对7030张光伏组件的图像进行热斑识别危害等级的划分。通过这种方式,建立了热斑数据集,并从中提取相关特征。其中,训练集占比为80%,验证集占比为20%。采用交叉验证的方法来评估模型的性能。

4实验结果与分析

本文提出一种以决策树为基础分类器的梯度提升决策树算法,对光伏组件故障进行识别,并提取热斑故障的相关特征,对热斑危害等级进行分类。通过选取K近邻(k-nearest neighbors,KNN)算法和支持向量机(support vector machines,SVM)算法作为比对算法,进行不同机器学习算法下的光伏组件故障分类方法研究。

4.1热斑故障分类

先对热斑故障进行分类,热斑故障分类算法指标评价结果如表1所示。由表1可知,相较于KNN、SVM算法,GBDT算法在热斑故障分类算法中各个指标上都能取得较优的效果。

4.2光伏组件故障分类

在对热斑故障进行分类后,再对光伏组件故障进行分类,光伏组件故障分类算法指标评价结果如表2所示。GBDT算法同样在不同的指标上取得最优效果,特别是错误率大大降低。在实际应用中,可以提前发现和诊断光伏组件故障,并采取相应的维护和修复措施,以确保光伏系统的正常运行和发电效率具有重要意义。

5结论

本文針对光伏组件的安装位置和数量较多、监测成本高昂、检修困难等管理问题,提出了光伏组件故障危害识别算法。利用红外图像的温度信息来判别热斑故障,并采用机器学习模型进行热斑故障的分类识别。通过对红外图像的数据进行处理和分析,得到热斑故障的相关特征,然后利用机器学习算法建立相应的分类模型对热斑故障进行精准检测和分类。本文使用KNN、SVM和GBDT 3种算法进行光伏组件故障危害分类,并对其性能进行测试。结果表明,GBDT算法相较于KNN、SVM算法在不同的评价指标上能取得较优的效果,可为光伏组件故障的准确诊断和危害等级划分提供有效的解决方案,提高光伏电站的运行维护管理水平和运行可靠性。未来,可将机器学习技术与其他领域的先进技术结合,如物联网、大数据分析,进一步提升光伏组件故障识别的能力。

猜你喜欢
机器学习
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
下一代广播电视网中“人工智能”的应用
基于支持向量机的金融数据分析研究
基于Spark的大数据计算模型
基于朴素贝叶斯算法的垃圾短信智能识别系统
基于图的半监督学习方法综述
机器学习理论在高中自主学习中的应用
极限学习机在图像分割中的应用