杨春华 杨玲 李玲 王景艳
摘 要:文章首先介绍了部分回归模型、空间变系数模型及估计方法等相关理论知识。通过对以前所研究的半参数模型,将单个自变量非线性函数与空间变系数模型进行有效组合,提出了半参数空间变系数回归模型两步估计方法,并从试验设计、模拟试验结果分析两个方面入手,对该估计方法运用效果进行模拟,结果具有较高的可靠性和稳定性,实现了对常值系数的有效计算和估计,为相关人员提供有效的借鉴和参考。
关键词:半参数空间 变系数 回归模型 两步估计法
中图分类号:F224文献标识码:A
文章编号:1004-4914(2023)09-021-03
一、引言
半參数模型除了表现出参数模型优点外,还表现出非参数模型的优点,该模型被广泛地应用于生物、GPS定位等领域中,并取得了良好的应用效果。最近几年,赵珂等学者大胆提出一种新模型,即新型加权半参数模型,该模型在实际运用中,可以对参数和半参数两者所占比例进行分析和比较,并对最终比较结果进行加权处理,从而验证该新型模型的可靠性和优越性;朱晋伟等学者充分应用半参数模型误差低等特点,全面地分析企业运营、绩效相关影响因素。现阶段,大量学者均加入到半参数模型的研究中,该模型主要包含以下两种模型,分别是线性模型和变系数模型,将这两模型进行组合,从而形成相应的研究热点。Zeger等人通过运用迭代法,估计非参数部分,并运用后移算法,对线性部分进行有效估计,然后,将该半参数模型与医学领域研究进行充分结合,从而发挥和利用该模型的应用优势;Lin等学者在研究半参数模型期间,主要运用广义估计方程,对线性模型进行全面化分析和研究。He等人在对半参数模型进行估计时,主要采用M-估计法,对该模型线性部分进行分析和研究,并采用回归样条方法,对该模型的非参数部分进行分析和研究;封维波等学者严格遵循均方误差等准则,全面地分析和比较了半参数模型以下两种估计方法,一种是两步估计方法[1],另一种是最小二乘估计方法,同时,所获得的参数两步估计结果精确性和真实性相对较高,远远超过最小二乘估计方法所获得的估计结果。但是,运用该模型分析和解决实际问题期间,部分变量在影响因变量时,表现出一定的空间差异性,而其他变量在影响因变量时,并没有表现出空间差异性,而是表现非线性差异性。为此,本文通过对以前所研究的半参数模型内部的线性部分进行处理,并将线性部分处理和推广为非线性函数,然后,将单个自变量非线性函数与空间变系数模型进行有效组合,从而提出相应的半参数模型估计方法。
二、相关理论知识
(一)部分回归模型
1.参数与非参数模型。在实际生活中,多个变量既相互独立,又相互依赖。如果回归系数函数形式不同,所获得的模型为非参数回归模型,该模型在实际运用中,要优先选用大样本方法,同时,还要结合检验统计分布复杂性等特点,选用极限分布法,对非参数进行全面化统计。例如:使用直方图估计密度函数期间,仅仅参考少量数据,难以保证估计结果的精确性和真实性。在实际估计期间,适当地增加数据数目,可以保证估计精确性得以大幅度提高,因此,需要将样本容量设置在50以上,并采用直方图法,对非参数模型进行估计。
2.一元非参数回归模型估计方法。在估计一元非参数回归模型期间,为了保证回归函数估计结果的精确性和真实性,要利用高阶泰勒法,对其进行有效估计,并运用最小二乘估计法,获得各个点所对应的估计值。这种估计方法被称为“局部多项式光滑方法”。
3.变系数模型及估计方法。非参数回归模型在实际运用中,表现出一定的灵活性,但是,当自变量维数增加一定程度时,会增加估计计算难度,为了解决这一问题,现研发一种新型变系数模型,通过运用该模型,可以降低自变量维数,确保模型运用的科学性和灵活性。目前,比较常用的变系数模型主要包含部分线性模型、变系数模型等多种模型。其中,变系数模型在实际运用中,可以将参数系数直接设置为另一个自变量,可以有效地避免高维数问题,提高模型应用灵活性和有效性。
(二)空间变系数模型及估计方法
在具体应用实践中,数据会变得越来越复杂,此时,如果仅仅考虑回归系数,难以满足实际应用需求。以某城市房价为例,影响房价因素主要包含房子面积、地理位置等因素。另外,为了更好地预测房价变化趋势,除了考虑以上几个因素外,还要在参照变系数模型,充分考虑空间因素。地理位置不同,所对应的系数函数具有一定的差异,通过运用该方法,不仅可以突破空间非平稳性问题,还能确保所获得的数据真实、有效地反映出实际情况,此时,还要利用空间变系数模型,影响房价的空间位置因素进行分析和研究,经过分析发现,通过将空间信息与空间变系数模型进行有效结合,可以确定出相应的回归系数。此外,通过运用回归系数所对应的估计值,可以预测和评估回归系数未来空间变化趋势。
三、半参数空间变系数回归模型及估计
在构建空间变系数回归模型期间,当空间位置出现变化时,所允许的回归系数也出现明显变化,但是,在实际问题分析和解决中,需要做出以下合理假设[2];当空间位置变化时,回归系数会出现改变,其他的系数为常数,本文构建半参数空间变系数回归模型表达式如下:
y=β+βKx+βvx+ε(1)
在对空间变系数回归模型进行研究期间,通常会用到以上模型,通过运用该迭代算法,对该模型进行分析。该迭代算法在实际运用中,会出现计算耗费时间长等问题,只能获得常值系数近似估计值,而且在半参数空间变系数回归模型的运用过程中[3],会导致矩阵呈现出非对称幂状态。结合以上模型特点和存在的问题,本文提出一种行之有效的两步估计方法,并运用该方法,在指定的条件下,获得精确的常值系数估计值。首先,利用常值系数向量,对模型进行转换处理,使其转变为空间变系数回归模型[4],该回归模型表达式如(1)式所示,,并采用GWR方法,对该模型进行拟合处理,同时,利用加权最小二乘法,对变系数进行精确化计算。其次,结合变系数最终估计结果,确定出合适的线性回归模型形式,并采用一般最小二乘法,对常值系数进行估计。通过采用两步估计方法,可以获得良好的拟合效果。
四、模拟试验
与半参数回归模型相比,保证常值系数估计的有效性,在确定各个自变量对因变量的影响程度以及相关空间位置变化情况等方面具有重要作用[5]。通过采用模拟试验方法,对该模型常值系数估计方法进行验证,验证该方法的精确性和稳定性。
(一)试验设计
在进行模拟试验期间,需要将m-1个单位正方形进行组合,从而形成相应的空间区域,然后,观察空间区域边长在m×m个格子点上,并计算各个格子点之间的距离,经过计算,发现该距离值为一个长度单位。然后,使用x、y别代表观测点所对应的横坐标和纵坐标,同时,严格按照从左到右、从下到上的顺序[6],对各个观测点进行有序排列。此外,还要模拟处理多个混合空间变系数回归模型,该模型模拟所获得的误差项完全满足正态分布N(0,σ2)规律,为了更好地分析和研究噪声方差对估计值的影响程度,现将σ值分别设置为0.2,0.6,1。各个模型中,自变量值均满足正态分布规律[7],在单个模型中,将σ分别设置为0.2,0.6,1,将m分别设置为6,7,8,9,10,然后,对其进行科学模拟。当m、σ和模型确定后,需要对误差向量进行改变[8],并将重复计算次数设置为500次,对于单个常值系数而言,可以获得500个估计值[9],然后,对500个估计值求平均值,所获得的平均值就是该常值系数的最终估计值,并用“■■”表示,获得样本标准差计算公式,通过运用该公式,可以实现对该估计方法有效性和稳定性的有效衡量。
(二)模拟试验结果
本次试验,所获得的试验结果如表1所示,从表1中的数据可以得出以下几个结论:(1)模型不同,所对应的m、σ也不同,通过运用后向拟合法,可以获得常值系数最终估计值,该估计值与其真实值相吻合,这表明该估计方法具有较高的有效性和稳定性。(2)观测点会随着m的不断增加而呈现出不断增加的趋势,尽管估计精度并没有明显提高,但其稳定性不断提升。(3)当σ越来越大时,说明噪声方差不断增加,该模型表现出较高的干扰程度,估计精度并没有出现明显的变化,但其稳定性有所下降。(4)该模型变系数项不断增加时,该模型中会出现两个变系数项,说明估计精度越来越低。
五、半参数空间变系数回归模型及两步估计方法在经济领域中的应用
在经济水平的不断提高下,通过运用本文所提出的两步估计方法,对某城市房价数据进行定量分析,从而研究出该城市房价空间差异结构及其影响因子,为房地产行业发展提供重要的依据和参考。
(一)数据收集
本文以某城市多个小区的空间数据为样本,这些样本部分数据如表2。
(二)空间变系数模型建立
运用相关性分析法,确定出小区的房龄、公交站个数、距地铁站距离、距医院距离,并将这些变量标记为X=(X1,X2,X3,X4),使用(U,V)坐标表示小區实际的空间地理位置;使用(x1,x2,x3,x4,μi,vi,Yi)表示第i个小区的观测数据,i=1,2,...,n。基于空间系数回归模型如下:
Y=β(μ,v)X+εi (i=1,2,...,n)(2)
(3)式中β(μ,v)(m=1,2,...,p)代表(μ,v)观测点位置处所对应的影响因子系数参数,εi代表正态误差项。
(三)数值模拟
以小区的空间数据为样本,运用Matlab软件编程法,对该空间数据进行处理,模型自变量系数运行结果如表3所示。
从表3中的数据可以看出,学校、医院参(下转第27页)(上接第22页)数变化幅度相对较大,其影响量级相对较高,这表明学校、医院参数会对房价空间差异性产生明显影响。地铁参数变化幅度相对较小,并对房价空间差异性产生影响程度较小,这表明地铁对房价整体影响程度较小。
六、结束语
综上所述,本文结合半参数空间变系数回归模型构建情况,提出两步估计方法,并确定出常值系数的精确估计表达式,通过对该方法进行大量数值模拟,有效地验证了该方法的有效性、合理性。另外,通过运用Bootstrap方法,实现对常值系数估计偏差和方差的有效研究。最后,将本文所提出的两步估计方法被广泛地应用于房价空间差异性分析,应用结果表明:影响房价空间差异性较大的因子是学校、医院。但是,本文研究仍然需要进一步优化和完善,需要相关人员不断创新和改革两步估计方法,便于后期更好地推广和应用该方法。
[基金项目:云南省哲学社会科学规划项目“复杂数据半参数分位数回归模型方法在社会经济领域应用研究”中期成果(项目编号:YB2021096)]
参考文献:
[1] 陈建宝,乔宁宁.半参数变系数回归模型的空间相关性检验[J].统计研究,2015,32(07):87-92.
[2] 魏传华,梅长林.半参数空间变系数回归模型的Back-Fitting估计[J].数学的实践与认识,2006,36(03):177-184.
[3] 程慧燕,朱道元.半参数空间变系数模型的局部线性二阶段估计[J].数学的实践与认识,2017,47(07):292-296.
[4] 陈建宝,乔宁宁.半参数变系数空间误差回归模型的估计[J].数量经济技术经济研究,2017,34(04):129-146.
[5] 唐庆国,晋鹏.空间半参数变系数部分线性分位数回归中的B-样条估计法[J].统计与信息论坛,2018,33(06):9-13.
[6] 袁芳.纠正传统回归误差的半参数变系数估计模型设定及应用[J].统计与决策,2018,34(03):20-24.
[7] 胡亚南,王金天,田茂再.半参数空间分位回归模型的估计与变量选择[J].数理统计与管理,2022,41(04):647-661.
[8] 曹连英,张博.非线性半参数空间变系数模型的两步估计[J].统计与决策,2016(22):12-14.
[9] 梁永玉,田茂再.空间部分线性变系数模型的分位回归估计[J].统计与决策,2022,38(09):36-41.