基于多元线性回归的船体补偿量优化

2021-10-28 06:37张佳宁李慧君
造船技术 2021年5期
关键词:优度因变量回归系数

丁 也, 张佳宁, 李慧君, 房 明, 鲁 宁

(1.大连船舶重工集团设计研究院有限公司,辽宁 大连 116006; 2.大连海事大学, 辽宁 大连 116026)

0 引 言

裕量补偿量加放是造船精度管理中的重点和难点,细化补偿量加放数值是精度管理发展的大趋势和方向之一,目前日本、韩国等发达国家的主要船舶企业已建立良好的补偿量系统,通过生产现场的数据统计与积累,基于不同船型的焊接收缩数据库进行分析,预测船体建造过程中各影响因子对焊接收缩量的影响数值,构建基于数据、面向生产制造的船体补偿加放过程模型和加放体系,从而使补偿量系统能够真正地提高建造质量和生产效率。

按照《中国制造2025》的战略部署,在高技术船舶领域,重点推进产品绿色化、智能化、数字化和产品结构高端化。以某型在建海洋工程产品环形段数据统计分析为依托,通过全工序全过程的跟踪测量,对可能影响焊接收缩值的因素进行统计,再通过统计学的相关回归模型和方法进行分析,形成各工序的焊接收缩规律,并通过VB宏语言(Visual Basic for Applications,VBA)编程,制作焊接收缩值的预测计算程序。

1 计算模型参数

多元线性回归分析是统计学中趋势预测的一种数据分析方式,通过建立相应的数学模型,描述各自变量与因变量间的相互关系,从而实现输入影响因子预测相应因变量的数值。多元线性回归计算模型的一般表达形式为

Y=β0+β1X1+β2X2+β3X3+…+βkXk+μ

(1)

式中:Y为因变量;β为回归系数;X为自变量;k为自变量X的数目;μ为去除k个自变量对Y影响后的随机误差,误差反映除线性关系外的随机因素对Y的影响。

由式(1)表示n个随机方程的矩阵表达式为

Y=Xβ+μ

(2)

若X的列满秩,可采用普通最小二乘法估计,其估计值如下:

(3)

在通过最小二乘法确定多元线性回归的函数后,还需要对各个变量的参数进行检验。由于无论变量间是否存在线性关系,通过最小二乘法均可计算对应的方程。对回归函数的检验主要包括拟合优度检验、显著性检验和各自变量的检验,如果回归函数无法通过相应的检验,则说明无法使用计算得到的回归函数进行后续的趋势预测[1]。

R2=SSR/SST=1-SSE/SST

(4)

式中:R2为多重判定系数,该系数越靠近1,则观测数值可被回归直线解释的比例越高,回归直线越趋近合理。

在实际的应用与判定过程中,自变量X的数量即k值越大,会导致多重判定系数越大,越靠近1,因此为避免出现由于统计量增大导致拟合优度高估,增加修正拟合优度判定,记为Rα2。

(5)

式中:Rα2含义与R2类似,区别在于修正的多重判定系数考虑的样本总量不同;n为样本数量。

(2)显著性检验(F检验)。在原假设H0成立的条件下,统计量服从自由度(k,n-k-1)的统计验定值F分布,如下式所示:

(6)

确定显著性水平α(通常取0.05)即置信度为95%,根据分子自由度和分母自由度查表可得到F的临界值Fα。若F>Fα,则拒绝原假设H0,表明变量间的线性关系显著;若F

(3)自变量检验(t检验)。即使通过拟合优度检验,也无法证明每一个自变量与因变量都相关,因此还需要进行每个自变量的相关性检验[5]。根据相关性检验公式可计算每一个变量的回归系数检验t值,在给定显著性水平α(通常取0.05)的情况下,根据自由度查t值分布表,可得到相应的t值临界值。如果计算得到的t值绝对值大于分布表中的t值临界值,则拒绝原假设,可认为该自变量与因变量间的线性关系显著;反之,则说明其相应变量的线性关系不显著,可考虑删除该变量后再进行一次多元回归分析及检验。

2 应用实例

为开展研究工作,采集某型海洋工程产品相关变量数据。自变量为板厚X1、纵骨X2、横向结构X3、纵向结构X4、横向结构焊脚X5、纵向结构焊脚X6等;因变量为分段在长度、宽度方向的总收缩。表1为某型海洋工程产品分段建造数据。

表1 某型海洋工程产品分段建造数据

通过数据初步筛选,发现纵骨焊脚均相同,因此将纵骨焊脚变量剔除,仅以宽度收缩计算为例。

通过数据分析软件SPSS进行回归统计,计算结果如表2所示,方差分析结果如表3所示,显著性水平分析结果如表4所示。

表2 SPSS软件回归统计计算结果

由表2可知:拟合优度R2约0.950,说明方程拟合度较为理想。由表3与表4可知:回归方程的显著性试验Fs远远小于显著性水平α,但各自变量回归系数的显著性水平较差,只有2个t检验的Fs小于置信水平;同时,X2、X5、X6回归系数与预期相反,其可能存在多重共线性问题,对自变量再进行相关性检验,计算结果如表5所示。

表3 方差分析结果

表4 显著性水平分析结果

表5 自变量相关性检验结果

由上述数据可见:纵向结构X4与纵向结构焊脚X6的相关性较高,超过0.9。通过分析发现:在统计中部分无纵向构架的分段,统计人员将其纵骨焊脚统一标注为0。尝试将纵向结构焊脚数据剔除,重新对X1~X5再次回归,输出结果如表6~表8所示。

表6 X6数据剔除后的回归统计计算结果

表7 X6数据剔除后的方差分析结果

表8 X6数据剔除后的显著性水平分析结果

由上述计算可知:优化后的方程为

Y=0.017X1+0.614X2+0.113X3+

0.282X4+0.537X5

(7)

其拟合优度R2为0.889,各项自变量的回归系数均通过t检验,整体拟合度较好,且不存在多重共线性问题。

在数据统计分析理论模型的基础上,通过对各类型分段焊接收缩数据的分析,形成各类型分段的焊接收缩公式,为后续船舶补偿量的加放提供理论基础,并以此为基础,通过VBA的程序编写,制作相应的计算软件,在船舶补偿量的加放中,直接输入相关的变量,即可计算焊接收缩的预估值,使计算过程更加简洁化、标准化、程序化,编写的程序如图1所示。

图1 焊接收缩计算程序

3 结 论

(1) 研究确定一种运用多元线性回归预测船体分段补偿值的预测过程模型,该模型可较好地适用于船舶建造过程中分段的补偿量加放。

(2) 在数据统计分析计算过程中应注意多重共线性问题,避免各自变量之间相互影响。在通过回归模型确定因变量与自变量关系过程中,如果某一自变量的回归系数检验未通过,则必须进行多重共线性的检验。

(3) 根据补偿量的计算公式编写计算程序,使计算过程更加简洁化、标准化、程序化。

猜你喜欢
优度因变量回归系数
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
勘 误 声 明
如何正确运用χ2检验
——拟合优度检验与SAS实现
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
多元线性回归的估值漂移及其判定方法
电导法协同Logistic方程进行6种苹果砧木抗寒性的比较
偏最小二乘回归方法
多元线性模型中回归系数矩阵的可估函数和协方差阵的同时Bayes估计及优良性
可拓方法的优度评价在输气管优化设计中的应用
可拓优度评价法在CRM软件供应商选择中的应用