基于COWA算子期望的模糊线性回归模型参数估计

2018-03-21 10:37龚艳冰戴靓靓胡娜
统计与决策 2018年2期
关键词:因变量参数估计算子

龚艳冰,戴靓靓,胡娜

(河海大学企业管理学院,江苏常州213022)

0 引言

在预测评价与决策等领域,回归分析方法是一个重要且常用的研究方法,但是传统回归往往依赖于精确的统计数值及二值逻辑。在社会经济活动中,部分或者全部的观测数据常常是不精确或者用语言值描述的数据,使得经典线性回归模型受到限制。人们常常使用自然语言值表示定性概念,例如大概、温度不高、相当小等,恰恰是人们赖以识别分析乃至决策的重要依据。针对现实世界语言值的模糊性,日本学者Tanaka等[1]首次提出模糊线性回归模型,主要用于反映自变量和因变量的模糊关系。经典回归模型把真实数据和估计值之间的偏差认为是观测误差,而模糊回归模型将这种误差视为系统结构自身的模糊性,并把数据和其估计值之间的偏差视为系统参数的模糊性,从而由参数模糊化来解决这一问题[2]。国内外许多学者对模糊线性回归模型的参数估计方法进行了大量研究[3-11],并在系统预测、评估和决策等方面开展了大量应用研究[12-15]。

现有估计参数方法主要是最小二乘或最小一乘回归模糊数截集距离方法。模糊截集距离方法一旦隶属度被选择,“硬化”成精确数字,关于概念的所有不确定性都消失了,并且计算较复杂。针对上述方法的不足,本文试图通过引入模糊数的COWA可能性期望,仅仅考虑模糊数的可能性期望区间,并对期望区间信息进行COWA算子集结,从COWA算子期望距离最小的角度估计回归模型的参数。本文方法通过决策中偏好期望的形式反映人的主观模糊性,在某种程度上提升了模糊回归模型的灵活性和合理性。

1 基本概念及定义

定义1:设模糊数A的隶属函数为:

则称A=(a,α,β)为三角模糊数,其中α,β称为三角模糊数的左右扩展。根据Zadeh的扩展原理,可得三角模糊数A=(a,α1,β1)和B=(b,α2,β2)的算术运算法则为[9]:

A+B=(a+b,α1+α2,β1+β2)

定义2[16]:设模糊数A的γ截集为A(γ)=[al(γ),au(γ)],则模糊数A的可能性区间期望为:

定义3[17]:设a=[a-,a+]为区间数,且

其中,Q:[0,1]→[0,1]是具有下列性质的函数:①Q(0)=0;②Q(1)=1;③若x>y,则Q(x)>Q(y),则称f为连续区间数据OWA算子,简称为COWA算子。Q称为基本的单位区间单调(BUM)函数。由文献[17]可知,若令表示决策者的主观偏好,则COWA算子可以表示为:

因此,由定义2和定义3,可以给出模糊数A的偏好期望值为:

特别的,如果模糊数A=(a,α,β)是三角模糊数,则A的偏好期望值为:

2 模糊线性回归模型参数估计

考虑自变量和因变量都为模糊数的线性回归模型,即:

其中,xi=(1,x1i,x2i,…,xpi)表示模糊数自变量向量,yi表示模糊数因变量,bj,j=0,1,2,…,p为回归系数。为方便起见,本文以三角模糊数为例并令三角模糊数xji=(aji,αji,βji)(=0,1,2,…,p;i=1,2,…,n),则模型(7)的模糊数据回归模型可改写成:

由于模型本身的模糊性,上述三角模糊线性回归模型要成立,并不需要对于任意截集都成立,只需要模型(7)的期望值成立,即对于给定的偏好系数λ(0≤λ≤1),模型(7)可以转化为传统回归模型:

为了估计上述模型的参数,本文给出COWA算子期望距离的概念,即模糊数A和B的距离可以定义为:

特别的,令λ=k/m(k=0,1,2,…,m),可以得到离散化的COWA算子期望距离:

结合离散化的偏好期望距离公式(11),可将模糊因变量估计值与观测值间的误差表示为:

将式(7)代入式(12)可得期望误差为:

根据最小二乘法令:

通过求解上述线性方程组(14)和(15)可得到模糊线性回归模型(7)的回归系数的估计值,我们称这种最小二乘参数估计方法为COWA期望距离最小二乘方法(COWA-EDLS)。

为了有效评估上述模糊线性回归模型的性能,需要对模型的误差进行估计。传统的回归分析是针对观测值与拟合值的距离进行比较,利用点对点的差距来评价拟合结果。本文将拟合值与实际值之间的偏好期望距离差作为误差估计的检验依据,当回归方程拟合出来的模糊回归模型具有较小的E值,则说明该模型应该是不错的模型。

3 员工绩效评估的模糊回归应用

为了说明本文方法的可行性,以Chen等[3]给出的人员绩效评估的例子进行实证研究。人员绩效评估是企业人力资源管理中一项重要的功能,显然,由于人员绩效评估的主观性,通常采用语言值来描述评估值,科学合理的评估结果将影响到人力资源管理功能的整体表现。根据人力资源管理的相关理论,考虑工作绩效(因变量y)的四个主要影响因素(自变量)包括[3]:工作能力(x1)、抗压性(x2)、拖延频率(x3)和沟通和协调能力(x4)。假定影响因素评估论域均为[0,100],样本容量为30,并且语言值用三角模糊数表示,如下页表1所示。

应用Matlab软件,选取偏好参数λ=0,0.1,0.2,…,1,即m=10,将上述数据代入线性方程组(14)和(15)可得下列线性方程组:

表1 绩效评估自变量和因变量三角模糊数样本

22181.5b0+1482402b1+1554375.7b2+1402096.9b3+1165618.3b4=1150361.2

20163b0+1329906.8b1+1402096.9b2+1366366.8b3+1026775.4b4=1015677.4

17138b0+1125334.7b1+1.165618.3b2+1026775.4b3+1040556.7b4=898216.9

求解上述线性方程组,可得回归系数:

b0=10.5671,b1=0.8681,b2=-0.170,b3=-0.1489,b4=0.0882

则三角模糊线性回归方程为:

y(xi)=10.5671(1,0,0)+0.8681(a1i,α1i,β1i)-0.1705(a2i,α2i,β2i)-0.1489b3(a3i,α3i,β3i)+0.0882(a4i,α4i,β4i)

从上述回归模型看到工作能力(x1)对员工工作绩效的影响是最大的,沟通和协调能力(x4)对员工工作绩效也存在正面影响,弱抗压性(x2)和拖延频率(x3)这两个变量对工作绩效产生负面影响但影响力度不大,这与实际情况是相一致的。

根据三角模糊数的算术运算法则,计算上述回归模型的预测值yci,并按照距离公式(10)计算预测值yci=(y1i,α1i,β1i)与实际值yi=(y0i,α0i,β0i)之间的偏好期望距离差:

将其作为误差估计的检验依据,结果如表2所示。结果表明,本文的COWA期望距离最小二乘估计方法是可行的,与传统最小二乘方法和截集距离最小二乘方法比较误差也相对较小。

表2 拟合效果与距离误差测度表

4 结论

最小二乘估计方法是模糊线性回归模型中常用的参数估计方法,考虑到三角模糊数的普遍性,针对数据输入、输出为三角模糊数的模糊线性回归模型,引入模糊数的COWA算子可能性期望值的概念,在此基础上,定义COWA算子期望距离,提出了模糊线性回归模型的参数估计方法,并对模型进行了误差分析。通过员工绩效的实例计算和其他模型的比价结果表明,本文的方法具有良好的拟合效果,且计算简单。

[1]Tanaka H,Uejima S,Asai K.Linear Regression Analysis With Fuzzy Model[J].IEEE Transactions on Systems Man,and Cybernetics,1982,(12).

[2]柏林,房勇.基于模糊回归分析的投资组合选择模型[J].系统工程理论与实践,2015,35(7).

[3]Chen L H,Hsueh C C.Fuzzy Regression Models Using the Leastsquares Method Based on the Concept of Distance[J].IEEE Transactions on Fuzzy Systems,2009,(17).

[4]Farhadinia B.Sensitivity Analysis in Interval-valued Trapezoidal fuzzy Number Linear Programming Problems[J].Applied Mathematical Modelling,2014,(38).

[5]Wan S P,Dong J Y.Possibility Linear Programming With Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).

[6]Ebrahimnejad A,Tavana M.A Novel Method for Solving Linear Programming Problems With Symmetric Trapezoidal Fuzzy Numbers[J].Applied Mathematical Modelling,2014,(38).

[7]任燕,郭嗣琮.基于结构元最小二乘序的模糊线性回归[J].模糊系统与数学,2015,29(1).

[8]李俊红,曾文艺.基于梯形模糊数的模糊最小一乘回归模型[J].系统工程理论与实践,2015,35(6).

[9]石苗,王达布希拉图.基于LR模糊数据的线性回归模型[J].广州大学学报:自然科学版,2014,13(2).

[10]彭宇文,郭莉莎,毛超.基于改进模拟退火算法的模糊回归参数估计[J].统计与决策,2014,(1).

[11]岳立柱.系数为一般模糊数的多元线性回归模型[J].统计与决策,2015,(3).

[12]任丽丽,陆秋君.基于模糊线性回归的电子商务交易额预测[J].统计与决策,2013,(3).

[13]赵建有,周孙锋,崔晓娟,王高青.基于模糊线性回归模型的公路货运量预测方法[J].交通运输工程学报,2012,12(3).

[14]张转,常安定,王媛英,王晓晨.基于正态模糊线性回归确定河流横向扩散系数[J].长江科学院院报,2015,32(8).

[15]邵良杉,赵琳琳,温廷新,孔祥博.基于模糊多元线性回归模型的岩石可爆性评价[J].中国安全科学学报,2015,25(7).

[16]Carlsson C,Fullér R.On Possibilistic Mean Value and Variance of Fuzzy Numbers[J].Fuzzy Sets and Systems,2001,(122).

[17]Yager R R.OWA Aggregation Over a Continuous Interval Argument With Application to Decision Making[J].IEEE Transactions on Systems Man and Cybernetics-Part B,2004,(34).

猜你喜欢
因变量参数估计算子
与由分数阶Laplace算子生成的热半群相关的微分变换算子的有界性
斜对角算子矩阵的Weyl谱
基于新型DFrFT的LFM信号参数估计算法
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
Domestication or Foreignization:A Cultural Choice
基于自适应参数估计的三轴磁传感器实时校正方法
QK空间上的叠加算子
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则