Logistic回归模型及其应用

2019-01-13 08:46:35鲁亚洲
魅力中国 2019年29期
关键词:因变量线性概率

鲁亚洲

(华北电力大学,河北 保定 071003)

Logistic回归模型主要是用来对多因素影响的时间进行概率的预测,是将普通多元线性回归模型进一步拓展的非线性模型。通常可分为有序和无序变量、分组和未分组、二分类和多分类等多种形式,目前我们对二分类的Logistic回归模型研究较多。Logistic回归模型现已经在在医学、工学、经济学和社会学中得到了较大的应用。

一、Logistic回归模型概述

Logistic中的变量是二分类变量,我们在将概率作为方程因变量的取值范围时是从0-1,但是与此同时方程右边的取值范围趋向于无穷大或者无穷小。如果我们将线性回归模型置于Logistic回归模型中就会出现方程两边的取值区间不同以及非直线关系。在这个时候我们就需要引入Logistic回归。

Logistic回归的实质是发生概率除以没有发生概率得到的结果再取对数。在这个过程中,我们把发生概率和未发生概率作为一个缓冲的比值,在将取值范围扩大后进行对数的变换,这样因变量就发生了变化,正是这样简单的操作变化改变了取值区间的矛盾以及因变量和自变量之间的曲线关系。这种使因变量和自变量之间呈现线性关系的变换是经过大量实践总结得来的。所以,可以说Logistic回归能够有效的解决因变量不是连续变量的问题,Logistic回归能够将很多的现实问题与自身模型相吻合,继而实现较大的推广。

虽然线性回归的分析原则也适用于Logistic回归模型,但是线性回归和Logistic回归是不同的。线性回归的结果变量和自变量之间的关系是线性的,而Logistic回归中二者的关系则是非线性的。其次我们在线性回归中结果变量的观测值有正态分布,但是在Logistic回归中观测值是二项分布。最后,在Logistic回归模型中不存在线性回归模型的残差项。所以,我们在利用Logistic回归进行应用时,一定要注意Logistic回归模型的适用条件:首先,各观测对象间相互独立,而且自变量和Logistic概率是线性关系。其次,我们要求残差和因变量都要服从二项分布,因为二次分布对应的是分类变量,那么我们自然无法使用正态分布以及最小二乘法来进行方程估计和检验问题,而是应该采用最大似然法来完成相关的操作。最后重复计数现象指标不适用于Logistic回归。

但是需要注意的是Logistic回归模型在进行拟合的过程中经常会遇到拟合优度的问题,而拟合优度本身是没有统计学的意义,不能说明该模型中增加变量的关系,只能说在当前模型变量的情况下这个模型和最优模型本身是没有太大的统计差异的。

二、Logistic回归模型的应用

Logistic回归模型能够帮助我们找到危险因素、预测与判别。

在我们建立Logistic回归模型后就可以根据模型来预测在不同的自变量情况下发生某种情况的概率大小。根据Logistic回归模型我们来判断属于什么情况的概率大小,简言之就是看这个事件有多大的可能性属于某种情况。Logistic回归模型直接根据指标情况求出某一事件的发生概率,限制条件较少,且对资料的需求量也少,能够较好的应用于定性和半定量的指标来估计应变量的发生概率,在判别和筛选中具有较大的发展前景。但是一定要注意资料的分布类型以及收集方法,要在充分选择模型以及了解各参数意义的基础上再使用Logistic回归模型进行判别预测。

我们在自动控制中,考虑到多种因素的印象,对反应变量为分类变量时如果采用线性回归模型就不合适了,而是应该采用Logistic回归模型的方式进行统计分析。当然任何一种的判别方法采用的样本总具有局限性,那么根据这样的样本得到的判别准确率难以得到保障,所以我们要加大判别效能的提高。相比于其他方法,Logistic回归模型在定性和半定量的判别预测上具有较大的优势。我们在运用Logistic回归模型进行判别时,要充分注意不同的Logistic回归模型有不同的使用条件,需要在保证样本具有代表性的前提下对指标进行筛选以便找到对应的变量作为指标建立回归方程,然后通过多种方法来检验判别效果。

以上是Logistic回归模型最常用的应用,实际上Logistic回归模型的应用还有很多,尤其是在工学领域,Logistic回归模型已经成为了自动控制中常用的方法。当然还有很多其他的较好的分类方法,但是Logistic回归模型与多重线性回归相比优势较明显,所以Logistic回归模型是应用最广的分析方法。

小结

Logistic回归模型主要包括一元二分类、多元二分类、有序多分类以及无序多分类等,在统计学领域应用较多。但是我们需要意识到Logistic回归模型也存在一些问题,比如Logistic回归模型的变量选择以及参数估计中的变量选择是相互独立的,但是实际问题中的各个自变量不是独立的而是存在一定的线性关系,这样一来就会导致Logistic回归模型回归系数不明显,最终导致判断的失误,在对Logistic回归模型进行推广时一定要注意这些问题的存在,继而实现Logistic回归模型效能的最大化。

猜你喜欢
因变量线性概率
渐近线性Klein-Gordon-Maxwell系统正解的存在性
第6讲 “统计与概率”复习精讲
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
中国药房(2022年7期)2022-04-14 00:34:30
第6讲 “统计与概率”复习精讲
概率与统计(一)
概率与统计(二)
线性回归方程的求解与应用
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
二阶线性微分方程的解法
偏最小二乘回归方法
文理导航(2017年20期)2017-07-10 23:21:03