一种基于决策树和词义相似度的N1+N2结构语法关系判定方法

2021-01-06 08:57杨泉
计算技术与自动化 2021年4期
关键词:显著性

杨泉

摘 要:多元线性回归模型通常用来研究一个因变量依赖多个解释变量的变化关系,但它有一个前提条件就是解释变量之间不存在相关关系。在实际的应用中,特别是计量经济学中,解释变量之间一般都存在有高度相关关系或近似相关关系,从而使得模型估计不准确。为此,通过协方差计算变换矩阵,提供一种变换矩阵消除随机变量之间相关关系的方法,通过spss25进行实证分析,最后发现通过矩阵变换变换后的数据t检验的显著性值明显降低。

关键词:多重共线性;协方差;显著性;

中图分类号:O212.4      文献标识码:A

多重共线性是指在所构建的模型中,解释变量之间存在的高度相关关系或近似相关关系[1]。做模型预测时,一般均是建立函数模型,其前提条件是解释变量之间都不具有相关性、不存在多重共线性,但在实际建模过程中,拿到的数据都会存在一些多重共线性。特别是在实际计量经济学问题中,由于经济数据的限制使得模型设计不当,解释变量之间往往存在某种近似的相关关系,导致模型失去了预测的意义。

在目前的研究背景下,文献[2]中介绍了三种比较常用的消除多元共线性的方法,第一种方法是手动剔除法,自变量之间存在共线性,说明自变量所提供的信息是重叠的,可以删除不重要的自变量减少重复信息。但从模型中删去解释变量时如果删除不当,会使模型产生设定误差,使得模型失去该有的意义;第二种方法是逐步回归法,逐步回归方法解决解释变量多重共线性的问题实质是基于解释变量之间的相关性筛选变量,将一些变量剔除,不进入模型建模。如果被剔除的变量在实际问题中具有很强的重要性,那么就要考虑其他的方法,而且

逐步回归中越早被删除的解释变量,共线性越严重,误删的可能性也就越大[2]。第三种方法是主成分分析法,文献[3]中提出利用主成分分析法去消除多重共线性是一种错误的观念[3]。文献[4]中举例指出:主成分分析法无法对数据的重复信息或存在的相关关系做出改善,认为在选取解释变量时,选的越多越好[4]。

对于上述问题,运用协方差和Pearson相关系数的定义及计算公式[5-6],再结合协方差的性质,计算出二阶、三阶和四阶的可逆矩阵,将原始数据通过该矩阵变换得到一组新的数据,进而消除原始数据的多重共线性。該方法是通过变换模型中变量的形式对原设定的模型形式进行变换,可以有效地消除模型中解释变量之间的多重共线性。最后通过spss25进行实证分析,最终发现该变换矩阵能够在不改变原始数据的数据结构情况下降低t检验的显著性值[7]。

2 协方差和相关系数

在概率论和统计学中,协方差的主要作用是用来甄别两个随机变量的总体误差。

4 实证分析

为了验证变换矩阵的有效性,根据文献[8]中地区生产总值与四个解释变量的实例数据进行分析并对比,对原始数据通过spss25进行回归分析得到:

5 结 论

二维、三维和四维具有一定相关性的随机变量可以通过一个二阶、三阶和四阶的可逆矩阵转换成不相关的随机变量,充分利用了协方差与相关系数。这在实际生产中具有重大意义,文中仅仅是对二维、三维和四维的随机变量进行了研究,在计量经济学模型中,会有更多的解释变量出现,因此还可以接着对高维的情况进行更深入细致的研究。

通过上面的实证分析,可以看出四阶变换矩阵在处理多重共线性问题时的有效性,在解决更多的比如计量经济学、水文模拟、地质建模等实际问题中也能够发挥有效的作用。

参考文献

[1] 刘芳,董奋义.计量经济学中多重共线性的诊断及处理方法研究[J].中原工学院学报,2020,31(1):44-48.

[2] 范圣岗,奚书静.多元线性回归模型中处理多重共线性方法对比——以人口迁移冲击教育资源模型为例[J].科技风,2020(23):157.

[3] 王惠文,朱韵华.PLS回归在消除多重共线性中的作用[J].数理统计与管理,1996(6):48-52.

[4] 陈伟.主成份分析法用于评价需注意的若干问题[J].人类工效学,2002(1):30-33.

[5] 樊嵘,孟大志,徐大舜.统计相关性分析方法研究进展[J].数学建模及其应用,2014,3(1):1-12.

[6] 臧鸿雁,傅双双.问题导向的相关系数概念产生过程及应用研究[J].大学数学,2020,36(4):53-59.

[7] 张露,李永安,王崇.基于相关分析和回归分析的能源消费影响因素研究[J].中国能源,2020,42(6):42-47.

[8] 许露露.我国地区生产总值影响因素的实证分析[J].黑河学院学报,2019,10(11):61-63.

猜你喜欢
显著性
欧盟法院判决明确欧盟商标通过使用获得显著性的地域认定标准
浅谈商标的显著性对于商标应用的影响
声音商标的保护问题研究
商标显著性的司法判断(一)
浅谈利用数码设备提高课堂演示实验显著性的方法
基于马尔科夫随机场模型的图像融合
我国声音商标审查规则研究
对我国立体商标显著性认定分析与建议
基于视觉显著性的红外与可见光图像融合
基于PSO和视觉显著性的棉花图像分割算法