荆晶
摘要:自1994年以来,房地产业得到了极大的发展,但是有关我国房产税税基评估的问题一直处于争议,我国也实行了沪渝两地的试点工作。围绕房产税评估的讨论也由此展开,文章系统地总结了房产税评估的模型,并针对地提出了几点看法,最后,对房产税评估的模型提出了拙见。
关键词:房产税;税基;评估模型
中图分类号:F810.422 文献标识码:A
文章编号:1005-913X(2019)03-0080-03
对房产税税基进行评估有许多评估模型,因传统方法存在弊端,目前的评估模型主要是特征价格模型的应用及在此基础上的优化和改进:特征价格模型, 用来描述产品的特征与其价格的关系;参数模型, 即对回归函数常带有基本假设并提供大量附加信息。非参数模型,即针对一般在实际应用资料中,可以随便做出样本总体是符合某分布的假设。半参数模型,即将回归函数分解成参数和非参数结构,直观上看是参数模型和非参数模型的叠加;地理信息系统(GIS),即与计算机技术结合,以电子地图的形式直观地呈现出城市的状况;人工神经网络(artificial neural network, ANN)。当然,还有不依赖特征价格模型的模型,如:随机森林模型、回归决策树模型,具体而言。
一、特征价格模型
自Ridker(1976)[1]指出空气污染会影响房屋价值,第一个把特征价格理论应用到住宅市场分析以来,大量Hedonic模型应用于欧美学术界住宅价格分析的研究。住宅的特征价格模型可以表达为:
P=f(Z)=f(L,S,N)
其中:P 为住宅的市场价格;Z 为住宅特征向量,包括 L、S、N 三个部分;L 为住宅的区位(Location)特征向量;S 为住宅的建筑结构(Structure)特征向量;N为住宅的邻里环境(Neighborhood)特征向量。
线性函数、对数函数、半对数函数和逆半对数线性函数的函数形式,我们称之为基本函数形式。
(1)线性形式:
(2)对数形式:
(3)半对数形式:
(4)逆半对数形式:
其中:P为住宅的价格,β0为常数项,βi为住宅的特征价格,Qi为住宅特征向量,ε为误差项。
此外,还有一种经常使用的灵活的函数形式是Box-Cox变换,而下式是对P和Qi两个变量进行Box-Cox变换:
其中λ为估计参数。
特征价格法根据房地产各个特征的隐含价格进行价格评估,避免评估者主观原因造成的评估偏差。为了克服市场比较法等传统方法的问题 ,取得了良好的评估效果,但也存在一定的问题,如错误设定的问题是不可避免的;由于研究人员的错误,可能导致模型函数形式的错误设定而得到错误的结果;多重共线性可能导致难以置信的回归结果,甚至错误的参数符号;特征价格模型通常无法解释空间自相关问题,但它不会导致回归系数改变地理信息系统。而Box-Cox变换具有自适应性,可用于不同的经济过程,采用不同的变换,但是样本数据的质量与属性极度地影响λ的估计值 。
二、参数模型、非参数模型、半参数模型
在计量经济学模型的参数回归分析中,最小二乘法是我们对线性回归模型参数估计方法,它使用回归函数,即选择合适的参数来确定样本,以便所有样本值的残差平方和(Residual Sum of Square,RSS)最小,即
其中, 为残差平方和, 为样本的真实值, 为样本的估计值。
非参数回归模型对函数形式没有约束,对解释变量和因变量的分布几乎没有限制,它试图从数据本身获得解决问题所需的信息,因此,比参数回归模型具有更大的适应性。设Y 为因变量,是随机变量; X 为解释变量,它可以是确定的,也可以是随机的。对于一组样本观察,建立非参数回归模型:
Yi=m(Xi)+ui(i=1,2,......n)
其中,m⊙是未知的函数,ui是随机误差项。
半参数回归基于参数回归和非参数回归,并提出用于解决实际数据中遇到的问题而提出的。半参数模型分为线性、非线性,线性半参数模型的一般向量形式为:
Y=Xβ+S+ε
其中Y表示为n维观测向量,X为n*p维列满秩设计矩阵,β为 p 维参数向量,ε为n维偶然误差向量,S 表示描述系统误差的n维非参数向量。
非线性半参数模型形式如下:
Y =f(X,β)+S+ε
其中 f 是已知二次可微的函数,其他的量与线性的半参数回归模型相同。
参数回归模型可以分析每个解释变量对因变量的影响,但由于参数回归模型会提前做出许多假设,此外,解释变量和因变量的分布存在限制,导致结果存在偏差。非参数回归模型比参数回归模型接近更实际情况,具有广泛的应用和较好的稳定性,然而,非参数回归并未充分利用样本所携带的关于总体的信息,致使效率会降低,而且存在不能深入分析解释变量、可能会受到限制。半參数回归模型结合了参数回归与非参数回归的优点,结果更接近实际情况,此外,它可以处理参数和非参数之间的许多模型,并且可以掌握因变量的总体趋势,适合于预测。
三、地理信息系统
GIS是地理信息系统,其英文全称是Geographic Information Systems,是非参数模型与计算机技术的结合,用于房地产税基评估。GIS系统具备综合维护和管理多种数据的能力,如:集成电子地图、遥感图片、照片等数据,适合管理房地产周边地区的各种情况,有利于准确估计房地产的真实价值、实时监控房地产对象的变更、管理各种类型的区域以及与这些区域相关的评税因素的参数值、精准计算与地理位置相关的评税因素、可以生成可视化视图,实现空间信息和属性信息的综合管理,评估者可以根据GIS的输出结果,经过适当调整可以形成评估报告。
四、人工神经网络
神经网络通过样本学习并根据样本映射影响因子之间的相关性。评估过程就是利用描述某一区域房地产评估对象特征的信息,即影响房地产价格的因素,作为神经网格的输入向量,以及交易价格为选择足够数量的培训样本,并使用网络内分布的连接权重,通过对影响因素和房地产价格的培训来表达学到的价格评估知识。对它们不断的进行修正,直到满足设定的误差精度。最后,通过自适应学习从网络的正确内部表示获得一组权值和阈值。训练完毕后,即可用训练好的模型对该地区的其它房屋价格进行评估,也是非参数统计与计算机技术的结合,其操作规则如下:
Ykj=f W Y
其中,Y 是k-1层第i个神经元的输出,也是第k个神经元的输入;W 是k-1层第i个元素与第k层第j个元素的连接权值;Y 是k层第j个神经元的输出,也是第k+1层神经元的输出;f通常是Sigmoid函数,f(x)= 。
BP神经网络在计算中具有并行性的特点,网络的计算速度得到了很大的提高。神经网络比其他数理模型更具有适应性,更接近人脑的运行规律;神经网络将知识存储在连接权重中,并且可以实现各种非线性映射;神经网络具有很大的容错性,整体输出的规律受到之前错误数据的不会影响很大。然而,在实际使用中需要解决的另一个问题是数据的可获得性,即如何在将来获得快速评估,以及如何收集和存储所收集的数据。
五、随机森林模型
随机森林是 2001加州大学伯克利分校统计系教授Breiman L[2]提出的统计学习理论,从而将非参数统计引入机器学习领域,所以出现了随机森林模型,随机森林模型的建立可以分为以下几步:
首先,应用 Bootstrap 抽样方法从总体样本中抽取 K 轮形成原始训练集 S形成训练集序列。
其次,CART 算法用于为每个新生成的训练集建立相应的决策树以获得分类器。
最后,将多个决策树的预测结果的平均值作为随机森林的最终回归和猜测结果,由于最终的结果由很多树的组合决定,因此将之称为Forests。
随机回归森林具有如下定理:
当k→∞,
EX,Y[Y-avkh(X,θk)]2→EX,Y[Y-Eθ(X,θk)]2
假设对所有的θ,EY=EXh(X,θ),则
PE*(forest)≤ρPE*(tree)
其中,ρ是残差Y-h(X,θ)和Y-h(X,θ')的加权相关系数,且θ和θ'相互独立。
随机森林作为新型的机器学习统计模型,其需求样本数据少、分类速度快,具有很高的預测准确率、对异常值和噪声具有较好的容忍度,该算法具有需要调整的参数较少、不必担心过度拟合、分类速度快、能高效处理大样本数据、能估计特征因素的重要性以及有较强的抗噪音能力等特点。与传统的线性回归方法不同,随机森林的使用可以充分证明数据挖掘的优势,而且该方法不用函数形式预先假定,避免了假设误差。
六、回归决策树模型
回归树是一种特殊的回归,实际上是非参数非线性回归。该方法由Breiman(1884)提出,其在叶节点处具有常熟值,并且使用方差作为杂质的量度。CART回归树分割选择的测度方法如下:
其中c1,c2分别用下式估计:
avg{yi|xi∈R1(j,s)},avg{yi|xi∈R2(j,s)}
目的是使平方和 i(yi-U(xi))2最小,j 为分裂变量,s 为分裂点。
CART预测模型为:
U(x)= cmI(x∈Ri)
其中,Ri为区域,I 为节点处的信息,cm为区域对应为势最大的类,M为所有的区域数量,x为待预测点。
回归决策树不需要任何先验假设,因此,模型设定没有问题;回归结果简单明了、易解释;在构建树的过程中,分类和回归树不根据纯度选择最优的分割变量,从而消除了选择变量的麻烦。然而,回归结果只限于几个值,并且结果的经济影响尚未完全测量。
各类房产税税基的评估模型都有一定优缺点,并不是相互排斥的。特征价格模型在国内的研究虽然不成熟,但是具有广阔的发展空间,对房产税税基的评估,可以基于特征价格模型,引入其他模型或技术,以特征价格模型为主,其他模型为辅,相互结合的房产税税基评估体系。随着社会的进步,科学技术的不断发展,可以结合人工智能、区块链等高科技对房产税进行批量评估,但必须指出的是使用前注意模型的适用性。
参考文献:
[1] Ridker R G, Henning J A. The Determinants of Residential Property Values with Special Reference to Air Pollution[J].The Review of Economics and Statistics,1967(2).
[2] Breiman L. Statistical Modeling: The Two Cultures (with comments and a rejoinder by the author)[J]. Statistical Science, 2001(3).
[责任编辑:王 旸]