基于大数据的电机性价比评价方法探索

2021-09-10 19:13吴超
科技研究 2021年17期
关键词:多元线性回归大数据

摘要:商用空调中电机的成本占整体成本的比重较大,研发过程中需要对其成本合理性进行重点审视,结合大数据、云计算等新兴技术的出现,可以借助現有的历史数据,为电机成本的评判建立一定分析依据,并分析不同自变量的因素影响,结合电机选型进行综合分析,本文阐述了大数据相关概念及电机冷/价比(空调冷量/电机成本)构成的主要成分,通过运用SPSS统计软件及统计学原理,对电机的成本/空调冷量构成建立模型,并结合整体数据分布情况,得出相关分析意见,对性价比评价方法得出一定经验。

关键词:大数据、商用电机、成本冷/价比、SPSS、多元线性回归

引言

商用空调中电机属于“心脏”部分,据内部数据统计,电机占到空调平均成本的30%以上(水冷、多联、单元等机型),一款电机的成本的性价比,将直接决定整机成本的合理性,而其中如何去评估电机的成本构成,传统是按照参照电机(原型电机)的历史数据,通过做对比来实现差价估计,但因受不同厂家工艺、技术方案的差异,往往评估出来的价格,与实际核价(最终定价),存在较大的差异,以此来计算电机的冷/价比(制冷量/成本),则误差更大。在现今大数据日益发展的今天,我们可以考虑通过大数据基本分析思路,结合统计学中的一些基础理论,借鉴已有的数据分布,采用大数据分析软件,来推导出评估电机成本的合理模型。

一、项目研讨背景:

①大数据发展趋势:在互联网和信息技术的不断发展的前提下,人们所产生的相关数据也随之增多。例如微信聊天、网上购物、乘坐公交地铁、打电话等过程都在不断的产生很多数据。我国的数据储存量也在不断的增长。这些数据主要包含结构化和非结构化两种类别,数据单位从最开始的 GB 向最终的 ZB 急速增长,已经大大超出了人们目前所能处理的范畴。在这样巨大的数据库里面,如何更好的加强数据管理,快速的使用数据以及高效处理数据等问题已经越来越被人们所重视,在这样的前提下,大数据时代随之到来了。我国相关计划显示,要加强互联网、大数据、云计算等和现代产业的相结合,从而不断的推动电子行业、工业互联网等的健康发展,同时提出了我国在 5 ~ 10 年的时间内,应完成相关的大数据发展和目标实现,随后并提出了我国大数据的战略目标[1]。

现阶段对于大数据的定义标准并不统一。大数据课程内容显示:大数据就是一个数据库,它的容量非常大、类别较多,且关于数据集内容的管理和储存无法用传统数据库工具来完成。它的特点不仅仅是大,还表现为一定的重要性和复杂性。大数据主要具备了以下特点:数据类别较多、处理数据速度较快、数据体量巨大、数据价值密度相对较低等。数据类别较多指的是数据的种类较为丰富,已经不再是之前较为单一的结构化数据,其来源较为丰富;处理数据速度极快指的是在数据量较为庞大的状况下,还依然能够保证数据处理的实时性;数据体量巨大主要指的是在现目前的规模较大的数据集中,数据量一般可以达到 10TB 至 1PB 之间;数据价值密度相对较低指的是在对数据联系不断的提起过程中,有用数据相对较少,如何通过相应的手段加强算法来完成数据价值的有效提取,已经成为了现目前大数据时代下必须应当解决的难题之一。

②商用空调电机存在现状:商用空调中电机的主要作用,包括对房间进行换热循环、室外侧冷媒与空气热交换、室内新风运送等,可谓商用空调的“心脏”,其重要性不言而喻,而电机的大小选型一般取决商用空调的制冷量,一般冷量越大,所需要的换热能力越强,对应的电机功率则需要更大,通过分析商用空调的成本构成,当中电机的占比可达30%以上(不同机组电机占比有较大差异,室内机电机成本占比可达60%),行业一般采用整机对应冷量/电机成本的方式(冷/价比),整机冷量是明确的指标,但成本存在变动,如何有效、合理评价一款商用电机的成本,是现今各家电企业都必须面临的一个难题。

二、本文介绍了对商用电机的数据分析方法。

首先对历史数据进行必要的数据预处理,采用多元线性回归分析方法,使用SPSS 软件对样本数据进行分析,找出相关系数,总结运行规律,得出了电机冲片、电机功率、电机转速三个影响因子与电机冷价比的关联关系,使用残差分析方法对模型进行了评价,模型的建立方法分为4 个步骤:数据采集、数据预处理、模型学习、输出结果。将这4 个步骤总结可得出如图1 所示的流程图。

三、模型建立的流程:

电机成本构成,在影响因子与电机成本总在一个最优值上下浮动。在找到这一关联关系的基础上,可计算出一组给定影响因子对应的电机成本,最佳电机成本是决定整机性价比的前提。多元线性回归能有效地挖掘出多个自变量与因变量之间的关联系数,可以对海量的历史数据进行快速分析。常用的曲线拟合方法是最小二乘法,常见软件为SPSS。

3.1 数据预处理

利用总结提炼已有电机的冷/价比——冲片——功率——转速——使用机型等相关因素。但是针对不同机组的电机使用条件,可能会存在某些特殊情形,如:高端机组选用高静音特制电机、适用于海岛地区的高防腐性能电机、高湿环境下应用的高密封防护电机,这些会形成成本的干扰因素,直接影响对数据模型的判断,这些数据无法正确地反映出这些自变量和因变量的影响关系,对于分析结果影响很大,因此需要对原始数据先进行预处理,对部分极端值进行剔除和筛选,提出非常规应用场合、特殊客户需求、高端性能工序复杂等非常规电机数据,最后得到处理后的数据样本。

3.2 模型建立

本文选用的影响因子为:电机冲片、电机功率、电机转速; 被评估的能耗指标为:整机冷量/电机成本。使用SPSS 软件进行多元线性回归,将笔者单位近5年来的电机数据作为输入进行分析。总数据条目数为698 条,数据库格式如下:

通过SPSS软件对数据源的录入,并运行“多项Logistic”得出的结果为:

y =-0.008 8 x1 + 0.515 x2 + 0.001 x3

式中:y 表示电机冷/价比;x1表示电机转速;x2表示电机冲片尺寸;x3表示電机功率。

四、模型评价

对得到的运算结果进行解读:

1、电机转速每上升(下降)1转,冷/价比会相应下降(上升)0.0088,即电机转速每上升(下降)100转,则冷/价比相应下降(上升)0.8,此点与电机n=T/P关系一致,即相同涉及扭矩下,转速与功率成反比,转速越高(低),功率需求越低(高),冷/价比亦可更低(高);

2、电机冲片每上升(下降)1mm,冷/价比会相应上升(下降)0.515,即冲片越大,电机成本越高,此点符合常规电机开发的认知;

3、电机功率每上升(下降)1W,冷/价比会相应上升(下降)0.001,即电机功率每上升(下降)100W,则冷/价比相应上升(下降)0.1,功率越大,所需电机成本越高,但在经验较丰富的空调厂商,采用较科学的电机选型方法后,其对应的整机冷量也同步上升,因此冷/价比基本持平(或者说影响较小);

根据模型分析结果,对模型预测值与实际值的偏差进行计算,计算出R、R 平方、调整后R平方、标准偏斜度错误,结果如表1。R 表示复相关系数,R 越大,线性关系越密切。表1 显示R = 0.743,可认为电机转速、电机冲片尺寸、电机功率这3 个量与电机冷/价比的关系较为密切。

表2 展示了模型的系数及显著性检验结果,可以发现各个系数( 电机转速、电机冲片、电机功率的系数) 的显著性都为0,明显低于0.05。可认为模型系数与样本之间的差异为纯机会变异; 之前的假设与真实情况是一致的。

表3 展示了模型的残差估计结果:在632个正误差之中,最大值是34.89,中位数是4.46,说明大部分正误差维持在一个比较小的水平。出现最大值偏差较大,不排除与部分电机选型是非标工况,同样冷量下需要更大的功率电机,如T3工况、低温严寒工况,需要能效比仍然为一级能效的空调需求;

正误差的方差为5.12,为一个较小的值;

结合平均值、中位数以及方差可以认为正误差较小,模型精度较大,同样道理我们也可以分析负误差,可以得到负误差较小,模型精度较大。考虑绝对误差,发现与正负误差比较,其中位数无太大变化。模型标准差较小,说明了模型正/负离散程度均较小,模型得出的数据较为稳定。

这一结果证明了整个模型的残差整体集中在较小的一个区间内,多元线性拟合结果较符合实际情况。

五、结论

基于大数据分析的评估模型(商用电机冷/价比模型)全面地考虑了整机冷量、电机功率、电机冲片、电机转速影响整机成本、电机成本的多个影响因子,通过预处理数据,多元线性回归等分析方法,最终结果有助于设计人员更加全面、细致地了解商用空调中电机性价比的评价方法,为进一步提升开发机组的性价比,提供了明确的方向。

参考文献

[1]梁宵.大数据视角下电商企业精准营销策略研究[D].鞍山:辽宁科技大学,2018.

作者简介:吴超,男,1980.4.17,汉族,广东潮州,本科学士学历,电气工程自动化专业,高级工程师,就职于格力电器股份有限公司技术部,现为对外经济贸易大学统计学院在职人员高级课程研修班学员,从事商用空调电气研发工作。

猜你喜欢
多元线性回归大数据
基于组合模型的卷烟市场需求预测研究
基于多元线性回归分析的冬季鸟类生境选择研究
我国上市商业银行信贷资产证券化效应实证研究
云学习平台大学生学业成绩预测与干预研究
基于大数据背景下的智慧城市建设研究