张相斌,梁 啸
(南京邮电大学 经济与管理学院,南京 210046)
多元线性回归分析是一种重要的处理变量间相关关系的数理统计方法,不仅可以提供变量间相关关系的数学表达式,利用概率统计知识对此关系进行分析,以判别其有效性;还可以利用关系式,由一个或多个变量值,预测和控制另一个因变量的取值,并进行因素分析。我们在建立多元线性回归模型并进行预测的时候,首先会对各个自变量进行预测,这种预测往往只反映出自变量单一的可能性,即自变量只取单一的预测值。然而在未来,自变量的取值是具有多种可能性的,不同的自变量的取值都会对预测值产生影响。在这种情况下,概率排序型的预测方法可以考虑到不同的自变量取值对预测值的影响,并通过期望值的最大最小值和方差的最大值描述预测的结果并衡量预测结果的波动性,对未来的预测更加贴近实际。
目前基于多元线性回归反映自变量的多种可能性以及将概率排序的预测方法应用到多元线性回归模型的研究还很少,本文针对运用多元线性回归进行预测时,由于自变量的不确定性导致的预测值的波动性,提出了概率排序型的预测方法,并用期望值的最大最小值和方差的最大值作为预测的指标,描述预测的结果并衡量预测结果的波动性,最后结合示例说明该方法的有效性。
在实际问题中,我们研究的变量往往会受到很多因素的影响。例如对于某件商品的需求量会受到消费者的收入、自身价格、相关产品的价格等因素的影响。这就涉及到一个因变量与若干自变量的相关关系问题,对于这样的问题,我们常常通过多元线性回归分析的方法来解决。
如果影响影响因变量 y的因素有n个,分别记为:x1,x2,…,xn,y 与 x1,x2,…,xn之间存在线性相关关系,那么多元线性回归的数学模型的就可以表示为:
目前,利用多元线性回归进行预测时,如果求得回归系数,那么只要知道当期 (x1,x2,…,xn)具体的值,就可以通过多元线性回归方程,预测出下一期y的值。但是这种方法的问题在于,预测是对未来的判断,而未来是不确定的,每一个因素都可能会有若干个可能的取值,并且各个取值出现的概率也有可能不一样。因此,我们在利用多元线性回归模型对下一期进行预测的时候,应当通过调查问卷、专家调查法等方式,得到未来变化的波动性范围,比较出不同组合出现的概率大小,这样才把未来的变化导致的不确定性考虑了进来。
表1 不同概率下各种组合及其对应的结果
从表1中可以看出,在实际的预测分析中,决策者对未来状态出现概率的了解是处于既有所了解但又不足以单值地计算出准确数值来。换句话说,决策者只知道N个未来状态的概率将呈现出这样的顺序:p1≥p2≥…≥pN,或 pi-pi+1≥0,而不知道 pi的具体数值。在这种情况下,概率排序型预测方法不失为一种实用并且有效的方法。
在概率排序型预测中,由于无法确定各个需求的准确概率数字,所以也无法准确地计算其期望值,但是我们可以通过求得期望值的最大值和最小值来确定期望值可能的取值范围,因此,用f(x)的最大期望值和最小期望值来描述在需求不确定情况下预测的结果,不失为一个可行的办法。又因为在期望值相同的情况下,需求的波动性也可能有很大的差别。因此,我们在保留期望值的前提下,用方差作为衡量预测的波动性的指标,同时运用到概率排序型预测方法的构建中。
对于每个结果 fi(x)的期望值E(Ai)的最大值和最小值为:
根据克米耶托维茨所著《决策论和不完全信息》中对这种概率弱排序条件下的特殊的二次规划问题研究后,可以得出以下结论:
表2 机电行业销售额与汽车产量和建筑业产值
某地区相关部门对本地区机电行业销售额y、汽车产量x1以及建筑业产值x2进行统计,如表2所示。
根据表中的统计数据和多元线性回归的相关知识,可以得到样本回归方程:
表3 不同组合下对应的预测y值
由于是对未来的预测,所以汽车产量和建筑业产值各个组合出现的概率是无法准确的判定的。但根据各方面的综合研究和市场形势的判断,决策者认为各个组合出现的概率由大到小分别为 y4≥y1≥y5≥y2≥y3≥y6,那么我们就能得到按概率大小排序以后新的预测表4,表中π1≥π2≥π3≥π4≥π5≥π6。
表4 按概率排序后的预测表
表5 预测值的最大期望值、最小期望值和最大方差
本文讨论了概率弱排序的预测问题,对于未来预测值的各个影响因子出现的概率既有所了解,又不足以准确的计算出数值,即由于自变量的不确定性导致的预测值的波动性,提出利用概率排序的预测方法,建立多元线性回归模型进行预测,不仅具有坚实的理论基础,而且更贴近实际。将期望值的最大最小值和方差的最大值作为预测的指标,可以很好的描述预测的结果并衡量预测结果的波动性,方法简单、应用方便。因此,应用该模型企业可以及时的根据相关因素在市场中未来的取值概率对资源进行合理的预测,从而制定相应的对策,实现企业的效益最优化。最后示例验证了模型应用的可行性和有效性。
[1]叶春明,齐静.基于多元线性回归模型的专利技术产业化评价研究[J].科技管理研究,2010,(21).
[2]王振友,陈莉娥.多元线性回归统计预测模型的应用[J].统计与决策,2008,(5).
[3]王义宏.基于多元线性回归分析的县域经济发展程度的评价——以江阴为例[J].生产力研究,2009,(18).
[4]陈刚,蔡远利,穆静,杨卫丽.海量信息异常检测问题的异常概率排序算法[J].西安交通大学学报,2011,(4).
[5]邱涤珊,贺川,朱晓敏.基于概率可信度的区间数排序方法[J].控制与决策,2012,(12).
[6]Kmietowicz Z W,Pearman A D.Decision Theory and Incomplete Knowledge[M].Hampshire,England:Gower Pub,1981.