基于多元线性回归的森林资源资产批量评估研究

2012-07-07 02:01郑德祥赖晓燕陈平留
中国资产评估 2012年2期
关键词:幼龄林正态批量

■郑德祥 赖晓燕 陈平留

批量评估方法是20世纪70年代兴起的评估方法,它是在评估三大基本方法与财产特征数据的基础上,结合数理统计技术和其他相关技术而形成的一种新的评估技术。目前这种评估方法已在欧美一些国家的财产税税基评估和房地产抵押贷款、融资评估中广泛应用。批量评估是对大量处于一定区域的财产样本建模,并利用模型对任何符合模型要求的目标财产进行估价。批量评估技术的应用从最早的农地评估拓展到目前的以征纳从价税为目的的财产评估领域、房地产估价领域,以及抵押贷款、融资等的资产评估实务中。与传统的评估方法比较,批量评估具有快速评估与成本较低的优势。2003年以来,随着集体林权制度改革的不断深入,集体林区的森林资源资产交易日益频繁,随之而来的是对于森林资源资产评估日益增多的需求,由于林权制度改革形成的林农,以户为经营单位的森林资源资产经营面积一般较小,小班个数亦较少,当在某一集中时段对同一地区的大量林农散户小班进行评估时,如按照一般森林资源资产评估的流程,评估工作量将非常大,计算繁琐,从而耗费大量人力、物力、财力且效率低。在市场经济条件下,应提倡“高效率、低成本”,找到一种新途径,能加快森林资源资产的评估速度,降低森林资源资产评估成本,而这也正符合批量评估的初衷,批量评估能够实现低成本、高效率地完成大规模目标资产的价值评估任务,从而为森林资源资产评估提供了新思路和新方法。因此,本文拟将批量评估模型引入森林资源资产评估,并将其应用到森林资源资产评估实践,希望有助于进一步完善森林资源资产评估方法与理论体系,促进森林资源资产化管理进程。

一、国内外研究概况

最早的批量评估思想可以追溯到1919年,当时在西方就有人将统计学的多元回归分析(Multiple Regression Analysis,这也是现今批量评估中主流的校准技术之一)作为一种可行估算技术,应用于农业用地的价值估计实践。其后,尤其是20世纪80年代末90年代初,西方学者围绕着评估三种基本方法在统计、数学环境中的具体实践做了大量的研究,探讨了多元回归分析技术、适应估计技术(又称回馈技术)(Adaptive Estimation Procedure or feedback)、人工神经网络(Artificial Neural Network)等技术在批量评估中的应用。Robert Carbone,Richard L.Longini(1977)利用回馈技术建立了不动产批量评估模型,并用数据检验了评估模型的可行性。Mark,J.,Goldberg,M.A.(1988)回顾了多元回归分析技术在批量评估中应用的相关问题。John D Benjamin, Randall S Guttery,C F Sirmans(2004)分析了多元回归技术在不动产批量评估的应用。Tay,D.P.H.,Ho,D.K.K.(1991/1992)运用人工智能技术对大量的公寓进行批量评估。Borst,R.A.(1992)指出神经网络技术将成为评估体系中建模的主要技术。Borst R.A.(1995)研究了人工神经网络技术在批量评估中的应用。Borst R.A and McCluskey(1996)分析了神经网络技术在不动产批量评估扮演的角色。Tom Kauko(2007)研究了批量评估方法体系,提出将神经网络技术、模糊逻辑技术等应用到财产评估,并与多元回归技术比较,结果表明前者比后者具有更高的拟合精度。

国内有关批量评估的研究尚处于起步阶段,并且主要集中在金融方面。如:耿星(2004)介绍了不动产批量评估的主要步骤:不动产基本描述、市场信息搜集和估价。金维生(2004)介绍了批量评估在加拿大房地产税征管中的作用。陈滨(2005)介绍了金融不良资产批量评估的主要方法:统计抽样法、经验抽样法、分类逐户法和回归模型法。刘扬(2005)提出了计算机辅助批量评估(CAMA,Computer-Aided Mass Assessment)。郭文华(2005)分析了计算机化批量评估系统(立陶宛)核心——不动产批量评估模型的原理和流程。纪益成,傅传锐(2005)回顾了批量评估产生与发展的历程,阐述了其方法原理和主要的操作过程,并采用市场法为理论基础的模型设立和多元回归作为模型的校准技术对实例进行批量评估,研究结果表明,该批量评估模型表现良好。

二、批量评估基础

批量评估方法将三种传统评估方法(成本法、市场法和收益法)纳入其评估模型设定的基础理论框架,但它不是这三种方法的简单组合,而是考虑到了三种基本方法在不同评估环境下,针对不同类型资产时的适用性问题。在构建批量评估模型时,先根据目标评估资产与特定的评估环境选择适用的基本方法理论作为评估模型设定的理论依据,再根据所选择的模型和所能获得的数据,应用现代统计、数学技术与计算机技术等实现传统评估方法,即获得模型中的系数。任何目的和类型的批量评估都应该包括以下步骤(2005 UNIFORM STANDARDS OF PROFESSIONAL APPRAISAL PRACTICE):

(1)识别待评估资产;

(2)确定资产一致性性状的市场区域;

(3)识别影响市场区域中的价值形成的特征因素;

(4)建立能反映此市场区域中影响价值特征因素相互间的评估模型(模型设定层次);

(5)校准模型从而确定影响价值的各个特征因素的作用(模型校准层次);

(6)将模型中所得到的结论应用于待评估资产;

(7)检验批量评估结果。

其中,第2步是指收集那些与待评估资产处于临近地理位置、相近评估日期,具有相同或相似资产特征的资产,这些资产构成待评估资产的一个市场区域。

上述的模型设定和校准阶段其实是一个反复迭代的过程。在进行第6步前,可以先用测试样本检验模型,若输出结果与预期结果不相符合就必须调整模型的设定,再次校准模型,并且重复上述过程直至模型预测达到一定精度。

三、基于多元线性回归的森林资源资产批量评估应用研究——以幼龄林为例

在森林资源资产评估中实现批量评估的关键是建立自动评估模型,一般来说,建立自动评估模型需要经过下面几个关键步骤:(1)进行数据调查,构建正确的统计分析框架;(2)对数据进行描述性分析;(3)建模:在建模当中,首先要选择适当的理论模型,其次根据理论模型,选择变量,最后选择适当的模型形式;(4)模型精度的度量与模型改进。为说明森林资源资产批量评估模型的建立,以下以基于多元线性回归的幼龄林批量评估模型建模为例予以说明。

(一)多元线性回归数学模型与假设

多元线性回归的数学模型为:

式(1)是一个p元线性回归模型,其中有p个自变量。它表明因变量y的变化可由两个部分解释。第一,由p个自变量x的变化引起的y的变化部分,即第二,由其他随机因素引起的y的变化部分,即 ε。都是模型中的未知参数,分别称为回归常数和偏回归系数,ε 称为随机误差,它服从均值为0,方差为 σ2的正态分布。

多元线性回归模型的假设理论:

零均值假设:随机误差 εi的数学期望为零,即E(εi)=0。

等方差性假设:所有的随机误差 εi都有相同的方差,

序列独立性假设:任何一对随机误差之间相互独立,

正态性假设:所有的随机误差服从均值为0,方差为的正态分布。

不存在多重共线性假设:所有自变量彼此线性无关。

(二)森林资源资产调查与统计分析

为了估计参数、建立森林资源资产批量评估模型,必须收集大量的森林资源数据资料。根据对于森林资源资产评估的影响因子与价值测算过程,在进行建模前主要收集的数据主要有两类:森林资源数据资料和评估的有关经济技术指标。其中森林资源数据资料是最重要的评估模型的输入元素,将直接影响到模型参数的选择和分析方法的采用。采用历史小班数据来鉴别特征因素,构造估算函数,检验推导出的模型的可靠性。当完成必要的森林资源数据调查与相关技术指标资料的收集后,应通过统计分析如专家分析、层次分析法、主成分分析法等以获取影响评估价值的主要森林资源数据因子与经济指标因子,在进行森林资源资产批量评估建模时主要是研究主要特征因素对单位评估值的影响,从而获取包括上述特征因素的评估样本,为建模做准备。例如影响幼龄林单位评估值的主要因素是年龄、平均树高、株数、前三年的营林生产成本,树种;影响中龄林单位评估值的主要因素有:年龄、经营类型(对应主伐年龄)、平均胸径、平均树高、蓄积量、销售价格、直接采伐成本(含短途运输费)、出材率和树种;影响成熟林单位评估值的主要因素有:平均胸径、平均树高、亩蓄积量、销售价格、直接采伐成本(含短途运输费)、出材率和树种。

(三)森林资源资产评估相关数据的描述性统计分析

对于数据的描述性分析实际就是对于数据是否符合建模要求的统计分析,例如在多元回归模型建立之前,必须先检验多元回归分析所具备的前提条件是否满足,这些前提条件包括正态性和线性关系。应注意的是对于每一个单独变量,正态假设在多元分析中是最重要的基础。如果与正态性的要求偏离较大,所得的分析结果将是无效的。以笔者所在专业评估机构福建省福林咨询中心2007年评估实践中所获取的36个幼龄林小班资源数据及其评估结果为基础,结合批量评估建模过程为例说明。

1.正态性检验

由前文的特征因素分析可知,进行幼龄林多元回归批量估算模型研究时考虑的主要因素有:年龄age;平均树高h;株数tr_num;树种(亚变量,离散的)。对上述四个连续变量进行描述性统计结果如表1

表1 描述性统计

上述各因素的正态分布以直方图表示如下:

图1 平均树高的直方图

图2 株数的直方图

图3 单位评估值的直方图

图4 sqh的直方图

上述表1及图1-3表明,年龄a g e的变化范围为4~10,均值为6.5043;株数tr_num的范围为70~320,均值为166.3248;单位评估值value的变化范围为247.62元/亩~800.00元/亩,其均值为559.9190元/亩,可以看出这些变量更具有正态性,而平均树高h的变化范围为0.2m~15.8m,然而均值为4.1658m,偏度系数为0.902,其偏度系数较大,在未做任何处理之前,就将其运用到模型中,将会严重违反正态化假设。此时,可以对变量作变换,如作平方根、对数变换等,为了使变换后的数据也大于0,对平均树高作平方根变换后得到平均树高的直方图如图4所示。可见,经过数据转换处理后得到的新变量,其正态性有所改善。

2.线性检验

在正态性检验之后,还应该确保因变量与自变量之间的线性关系。线性关系可以通过散点图来判断,在SPSS中生成的散点图,如图5所示。从最后一行可以判断因变量单位评估值和年龄age、株数tr_num的线性关系明显,和平均树高sqh的线性关系不明显。

图5 矩阵散点图

(四)森林资源资产评估批量评估回归模型建立与假设检验

1.模型建立

根据上述分析与多元线性回归原理,幼龄林批量估算模型可为如下形式:

式中:分别表示树种、株数、平均树高的平方根;

v4、v5为引入表示树种的亚变量:

v4=0,v5=0,表示树种为杉木;

v4=0,v5=1,表示树种为马尾松;

v4=1,v5=0,表示树种为阔叶树。

在对回归系数进行推导的过程中,采用逐步回归法。先按自变量“重要性”从一个自变量开始逐步引入方程,每引进一个新的变量时,要对新方程中的全部变量再作显著性检验,删除其中不显著的变量,重复此过程,直至没有变量被引入,也没有变量可剔除时为止。在SPSS中采用逐步回归法运算得到最终的多元回归方程如下:

2.幼龄林模型的假设检验

进行多元回归分析的前提是回归模型的假定正确,可以采用残差分析法来评估误差项正态分布假设,以及方差性假设、方差独立性假设的满足情况。

检验残差的正态性:对幼龄林批量评估模型进行残差K-S检验。如果检验结果残差不服从正态性,应考虑修改模型、进行适当变换,或增加新的自变量、剔除异常观察值等方法来补救。经过反复试验,当对株数变量tr_num取自然对数时,模型满足假设。用ltr_num表示经变换后的株数。

再采用新变量后,利用逐步回归进行系数推导。将得到的回归系数代入方程,得到最终的多元回归方程如下所示:

当树种为杉木、阔叶树时,其批量评估模型为:

当树种为马尾松时,其批量评估模型为:

3.修改后的模型假设检验

第一步,正态性检验,直至残差服从正态性分布。

第二步,检验零均值与等方差性,直至等方差性的假设成立。

第三步,检验序列独立性。

经检验,通过变量变换,所建立的模型满足假设,该多元回归模型成立。

(五)模型有效性确认

模型建立完成后,要对其有效性和准确性进行检验,从该地区森林资源资产评估案例数据中选择具有代表性的数据,得到检验样本,将以上幼龄林测试表中参数分别代入相应的多元回归模型,经计算得到相应的单位评估值的预测值,将预测值与实际值进行对比,比较结果。经检验在本案例中,幼龄林批量评估模型对于检验数据的吻合性较高,测试数据实际值与预测值平均绝对误差为23.92,相对误差绝对值最大的不超过10%,模型可应用于该地区幼龄林评估。

四 小结

1.批量评估在国内外的评估实践中已得到广泛的应用,其理论与方法已具有较广泛的应用基础,其快速评估与成本较低的优势同样适用于集体林权制度改革后日益频繁的森林资源交易现状,研究表明,批量评估原理同样适用于森林资源资产评估,将有效提高森林资源大规模目标评估的需要,其应用将为森林资源资产评估提供新思路和新方法。

2.基于多元线性回归的批量评估模型是建立在多元回归分析基础上的,该方法是建立在特定的理论模型基础之上,在使用时有较多的模型限定条件,如:模型都要求变量满足正态性、线性条件,模型必须满足基本假设等。在很多情况下,当数据并不符合线性条件或某个假设时,需要采用模型补救措施,并反复进行残差分析以满足拟合模型的条件,否则将造成拟合的模型质量较差或没有意义,因此如何进行数据的统计分析将是批量评估模型的建模基础。

3.批量评估在我国的应用研究相对较少,尽管本研究结合了笔者及同仁近十年的森林资源资产评估实践,但受森林资源资产评估发展与区域影响,尤其是数据影响,其实际应用还需作进一步的研究与验证,因此本文拟抛砖引玉,以期使批量评估在森林资源资产评估理论与方法领域中得到更多的关注,促进其理论与实践的完善。

[1]Robert Carbone,Richard L. Longini.A Feedback Model for Automated Real Estate Assessment[J].Management Science.1977,24(3):241-248.

[2]Mark,J.,Goldberg,M.A..Multiple regression analysis and mass assessment:a review of the issues[J].Appraisal Journal,1988,89-109.

[3]John D Benjamin,Randall S Guttery,C F Sirmans.Mass Appraisal:An introduction to Multiple Regression Analysis for Real Estate Valuation[J].Journal of Real Estate Practice and Education.2004,7(1):65-77.

[4]Tay,D.P.H.,Ho,D.K.K..Artificial intelligence and the mass appraisal of residential apartments [J].Journal of Property Valuation & Investment.1991/1992,10(2):525-40.

[5]Borst,R.A..Artificial neural networks:the next modeling/calibration technology for the assessment community [J].Property Tax Journal.1992,10(1):69-94.

[6]Borst,R.A..Artificial neural networks in mass appraisal[J].Journal of Property Tax Assessment&Administration.1995,1(2):5-15.

[7]Borst,R.A and McCluskey.The Role of Artificial Neural Networks in the Mass Appraisal of Real Estate[C].paper presented to the Third European Real Estate Society Conference,Belfast,1996:26-28.

[8]耿星.开征物业税中的评估问题[J].税务研究,2004,04:53-55.

[9]金维生.加拿大房地产税的征管及特点[J].海外税收,2004,09:54-58.

[10]陈滨.金融不良资产批量评估初探[J].中国资产评估,2005,07:18-19.

[11]纪益成,王诚军,傅传锐.国外AVM 技术在批量评估中的应用[J].税基评估,2006,13-17.

[12]纪益成,傅传锐.批量评估:从价税的税基评估方法[J].中国资产评估,2005,11:5-9.

[13]郭文华.为合理计算不动产税立陶宛引入计算机化批量评估系统[J].国土资源情报,2005,06:9-12.

猜你喜欢
幼龄林正态批量
批量提交在配置分发中的应用
利用二元对数正态丰度模型预测铀资源总量
直觉正态模糊数Choquet 积分算子及其决策应用
采用经济数控车床批量车削孔类工件的再实践
抽样分布的若干反例
林业发展中的幼龄抚育对策探讨
林业幼龄林抚育现状与管理措施
多品种变批量数控生产中快速装夹应用技术
不同种源枫香幼龄林生长性状及物候节律研究
标准参数系下Alpha稳定分布随机变量的产生及仿真