基于互联网大数据的实时房屋租赁价格指数编制研究
——以济南、青岛为例

2019-05-30 07:45田金方李泽鑫
山东财政学院学报 2019年3期
关键词:价格指数房屋价格

田金方,李泽鑫

(山东财经大学统计学院,山东济南 250014)

一、引 言

2003年8月,国务院下发《关于促进房地产市场持续健康发展的通知》,正式明确房地产业是国民经济的支柱产业。在过去十几年里,中国城市住房价格基本上一直处于上涨趋势,与房价上涨的幅度相比,租金上涨幅度则微乎其微[1]。房产的资本溢价弥补了租金收益的不足,其结果是房屋租售比持续下降,房地产市场出现严重的“租售失衡”,由此引发众多城市于2017年7月之后陆续试点房地产行业的“租购同权”。为此,急需研发适应大数据时代的房屋租赁价格指数,其一在于房地产租赁市场是房地产发展状况的晴雨表,其租金涨跌指数直接反映房地产市场的景气状况[2];其二建立房屋租赁价格指数有助于解决房屋租赁信息发散、失真和不对称等问题,有利于指导市场参与者理性消费和理性投资,是房屋行政管理市场化、规范化的必要技术手段。

随着房屋租赁在房地产市场中的地位越来越重要,以及互联网+房地产商业模式的出现,如何将现有统计指数理论与租赁行业开源大数据进行结合是目前学界和业界高度关注的研究方向。梳理相关研究学术史来看,就房地产价格指数编制理论而言,指数计算方式从定基方法转向链式方法、最佳指数①若一个指数是某种灵活的函数(如效用函数、生产函数、单位成本函数等)的精确反映,这一指数就称为最佳指数,最佳价格指数可以用来精确地估计理论上的真实生活费用指数。得到认可并应用于统计实践,但不同计算方法的选择在指数变化趋势上没有实质性的区别。如,Defusco等[3]使用DataQuick房价数据创建了Repeat-sales与Hedonic两个版本的价格指数,发现两个不同指数的升值率之间相关系数超过0.9。这表明不同编制方法所计算的房价指数结果不存在明显的差别。就房地产价格指数编制的数据资料而言,传统房地产价格指数的编制主要依靠抽样调查,采用房地产经纪机构上报、房地产管理部门提供与调查员实地采价相结合的方式收集数据,导致数据采集的成本较高,且并不能够很好地满足数据质量的要求。随着大数据时代的到来,开源大数据逐渐应用于价格指数的编制实践中[4],这类研究较为关键的技术要素是数据的获取以及适应异质开源信息的价格指数编制方法。Cavallo[5]认为从在线零售商处收集的价格可用于构建日常价格指数,以补充官方统计数据。顾光同等[6]提出了使用网络爬虫获取数据并编制房地产价格指数的思想。孙易冰等[7]从某大型B2C电子商务网站手机分类中抓取数据共计35万余条,并参照官方CPI的制度方法,设计了一种基于网络爬虫技术的价格指数计算模型;陈柯等[8]利用网络爬虫技术收集微观土地交易数据,爬取了2007年至2015年上海市土地成交数据,剔除未标明价格或面积的非划拨地块和住宅用地中政府福利性质显著的经济适用房、廉租住房等信息,从中筛选出具有面积与价格两个关键信息的1.12万余条土地出让记录数据,进行土地价格指数的编制。

与“房屋租赁”相关的研究成果汗牛充栋,为学界和实业界提供了重要借鉴,但尚需进一步深入研究的是:(1)现有文献聚焦于分析房屋租赁市场价格变动的影响因素,属于理论范畴的研究,鲜有从应用视角量化测度房屋租赁价格的动态变化特征,更没有从指数角度深层次研究房屋租赁市场的景气状态。(2)传统房地产价格指数发布频率较低,难以及时反映总体价格水平的实时变动,较大的时间滞后性致使人民不能及时了解房地产市场动态,严重降低了指数的市场风向标作用。(3)房地产产品异质性极强,不同区位、质量和结构的房产价格差异有时会非常大[9],为此Osland等[10]学者推荐使用Hedonic方法编制房地产产品等非同质性商品的价格指数,但是该方法的基本思想是基于回归分析的,没有充分考虑指数反映价格变动的本质内涵。

综上所评述,基于现有研究问题,本文从房屋租赁价格影响因素及其传导机理出发,借鉴最佳指数编制理论的思想,利用网络爬虫技术实行自动化采集与解析房屋租赁开源挂牌交易网页数据信息,得到房屋租赁交易的结构化数据,并在此基础上提出了既能满足开源数据异质性又能满足最佳指数编制理论的统计方法:Hedonic-Fisher链式指数模型,利用济南、青岛两市2017年12月至2018年3月的样本数据,实证分析该方法的有效性并进行指数质量检验。本文的主要贡献体现在:(1)将最佳指数理论与Hedonic模型结合,提出满足开源数据异质性的实时房屋租赁价格指数编制方法,使用实际数据验证了该方法的有效性,并对其进行质量检验。(2)开源数据的利用实现了房屋租赁价格指数的实时性。利用爬虫技术抓取房屋租赁挂牌交易信息,提高数据的收集频率,获得与传统月度或季度指数相比更稳定和即时的数据,且区位分布均匀,日数据量充足,对市场待租房源价格有很好的代表性,避免了传统抽样调查因随机性而造成的抽样误差,节约大量的成本。指数的实时性比传统的月度房地产价格指数在时效性上具有先行性,可以更好地服务房屋租赁行业,为房屋租赁市场提供价格指引,指导市场参与者理性消费和理性投资。

二、理论分析与研究假设

(一)房屋租赁价格形成机理

房产的价值量大、使用期限长,价值将随着时间逐渐损耗、折旧。因此,可以采取出售一定时期内闲置房屋使用权的方式来弥补价值损耗,即房屋租赁。在租赁期内,承租人向出租人支付租金,并享有房屋的使用权;出租人并不是一次回收房产的预付资金和利润,而是以加价的方式,通过租金逐渐收回。将特征价格理论运用于住宅产业,可以将住宅产品看作是由多种不同特征属性构成的,价格由所有特征属性带给人们的效用决定[11],从价格形成角度出发,可以将租赁房产的特征属性分为三大类:房产建筑特征(包括建筑面积、采光面、户型、装修情况、所在楼层、楼层总数等)、邻里特征(带看次数、浏览人数、房产信息的发布时间、绿化率、物业费、物业资质、社区生活配套等)与区位特征(房屋所在位置、周边交通情况、距离CBD的距离等)。

图1 房屋租金价格影响因素及其传导机制

房屋租金作为房产使用价值的限时出售,不仅要考虑到购置房产的成本,还要考虑房屋租赁市场的供求关系,其包含的内容要比房价复杂,影响因素也较多。因此,房屋租金的构成不仅要包含房产特征,即建筑特征、邻里特征和区位特征,还应该考虑租赁市场的供求关系、承租人的消费倾向和出租人所购置房产的属性。

主流微观经济学理论认为,市场的供给和需求是决定市场价格的基本力量,任何商品的价格都是由商品的需求和供给这两方面的因素共同决定的,同时商品的价格又反过来影响消费者和生产者行为。房屋租赁行业也不例外,房屋租赁的本质是房屋使用价值的零星出售,因此,房屋租金必定会受房屋交易价格的影响,进而影响租赁市场的供给与需求。近年来,我国房屋交易价格的上涨已成常态,逐渐改变着房产的商品属性,促使房产从消费品变成投资品,进而成为投机品。不同的房产属性在租赁市场中扮演了不同的角色,当房产作为纯粹的消费品时,人们对于房产的需求要么通过买房实现,要么通过租房得到满足,故按照微观经济学理论,租房与买房具有替代关系[12]。短时期内住房市场的供给和需求是一定的,房价上涨促使部分需求者的目光由买房转向租房,这将导致房屋租赁市场的需求增加,房屋租金上涨。当房产作为投资品和投机品时,购置房产为的是逐利,购房者不仅享有房屋租金的收益,还可以享受房产随着房价的高升所带来的资本溢价。从购房者投资房产的角度来说,房产的闲置会造成财产损失,只要房屋租金能维持房产的基本税费,就足以使任何房屋都具有投资价值,继而增加了房屋租赁市场的供给,房屋租金下滑。图1显示了房屋租金价格的影响因素及其传导机制。

(二)研究假设

房屋租赁市场不仅由供给与需求驱动,也与承租人群的消费倾向有关。据58集团房产数据研究院调查显示,2017年租房人群中,30岁以下人群占比超过67%,青年租客占据主导地位。年轻人的消费信心更强,这意味着其对未来的乐观程度较高,这将会影响到他们的个人消费决策[13]。另外,年轻人更加强调生活的质量,愿意支付高额租金以获得更好的居住条件,其先进的消费观念助推租赁市场的发展。传统的租赁市场所提供的房屋居住条件较差,无法有效回应和满足青年租客随着消费升级衍生的品质租赁需求,低质量房屋被迫翻新重装或被逐出市场。然而,对租金水平更为敏感的承租人来说,更加关注对独立生活环境的基本要求,他们需求的是稳定、安全的居住场所。在这种住房需求的驱动下,部分出租人对房屋进行改造,利用隔断和户型优势切分居住空间,以单间形式出租住宅以获得合理配置资源的超额收益。

在理论和实践中,一般都用房屋租售比[14]这一指标表示房产供给成本和租赁价格的关系。一般来说,正常的房屋租售比应在1∶130~1∶170之间,当租售比小于1∶250时,则意味着房屋出租无利可图,出租人从而减少租赁房屋的供给。而近年来,我国一线城市房屋租售比长期维持在1∶330~1∶500之间,如此低的租售比将造成住宅租赁供不应求的市场形势,最终影响租房者的租房需求。

基于以上几个方面,本文提出假设:承租人群的消费倾向通过影响房屋租赁市场的供需来影响房屋租金;在房屋租赁市场供需不平衡和承租人消费理念的双重作用下,短期内房屋租赁的总体价格水平是适度上涨的。

三、变量与模型的选择

(一)价格影响因素的确定

住宅价格的不同,反映了住宅本身特征数量的差异[15],这一观点已经被普遍接受。不同地区房屋租赁价格的影响因素不同,各影响因素对房屋租赁价格的影响程度也不同。本文通过上述理论研究与假设,确立了表1所示的影响房屋租赁价格的典型变量并进行量化处理。

表1 房屋变量及量化值

表1列出的房屋变量中,很多变量具有共线性,需要筛选变量并剔除,以达到数据降维的目的。比如房屋户型与客厅数、卧室数、建筑类型、建筑年代存在很强的关联性,只需选择房屋户型这一房屋变量即可。根据这一思路,并考虑山东省住宅租赁市场特点与开源数据的可得性,初步确定影响房屋租赁价格的因素包括以下几个方面:建筑面积、带看次数、总楼层数、房屋户型、房屋所在楼层、房屋采光面(朝向)和所属辖区等。

(二)指数计算方法

世界各国的房地产价格指数种类很多,其编制方法也不尽相同。归结起来,指数编制方法可分为平均数价格法、重复交易法、Hedonic模型和混合模型四种。

平均数价格法对指数计算的环境条件要求较低,在反映住房市场价格变化时存在一定误差,无法克服房地产市场中天然存在的异质性,只能作为描述市场运行的直观工具[16]。重复交易法可以考察房屋在不同时期的价格变动[17],但不能保证房产在不同时期品质守恒,适用性较差。Hedonic模型又称特征价格法,特征价格理论认为房地产产品由众多不同的特征组成,利用回归的方法将产品的各种特征剥离出来,得到各种特征的“隐含价格”,Hedonic模型在类似于房地产产品这样异质性商品的研究中应用最为广泛[18]。Case等[19]在1991年提出结合了Hedonic模型和重复售出模型的混合模型。虽然混合模型在方法上较为完美,但其计算过程复杂,在实际应用中有一定难度。

传统的价格指数编制主要使用拉氏指数、派氏指数等传统商品价格指数计算方法计算,虽然结果真实权威,但在实际运用中仍存在局限性。拉氏和派式指数容易忽略了房产特征随时间的变化性与房地产产品异质性,导致非市场影响因素较大,不能真实反映当地房地产市场供求关系,从而失去意义。Fisher指数对称地使用基期和计算期的权重,可以在一定程度上调和拉氏与派氏两种指数的矛盾,这种处理方式能够反映消费者或生产者由于产品相对价格变化所引发的替代行为[20]。在大数据时代,开源数据在稳定性和及时性上的优势日益凸显,能够较好的弥补Fisher指数需要计算期权数的缺点。综上所述,充分考虑开源数据特点与指数编制简单化原则,设定Hedonic-Fisher链式指数模型形式为:

四、实证分析与质量评估

(一)模式比选与变量选择

Hedonic模型的函数形式对模型的解释意义与合理性有重要影响,正确选择Hedonic模型的函数形式可以得到更准确、可靠的结果。应当根据理论和经验初步设定模型的函数形式,并与主流形式对比,选择模型拟合度最优的一种。Hedonic模型的函数形式一般为线性、对数、对数线性和线性对数形式,根据国内外应用Hedonic模型的经验,在房地产市场交易数据中,房屋价格与房屋各种特征之间一般不是简单的线性关系,使用对数变换的价格比未使用对数变化的价格更好,因为对数变换的模型假设与现实更为接近[21]。

房屋租赁价格分为挂牌租赁价格和成交租赁价格两种。在房屋租赁交易过程中,最理想的因变量选取应为房屋租赁交易的实际成交价格,但是获取实际成交价格有很大的阻碍。虽然网签程序(交易双方在交易合同签订完毕之后到相关房地产部门进行备案,并将交易信息在公布在网上)在山东省房地产买卖领域已经得到推广和使用,但其大部分为房屋买卖数据,实际网签数据仍然具有较大时滞且不易获取。

2004年温海珍[22]博士曾利用杭州市房产交易数据,对房地产合同的成交价格和挂牌价格进行对比分析,发现挂牌价格与合同成交价格并无太大差异,并获得下式:

(3)式中,Pd和Pl分别表示成交价格与挂牌价格,判定系数R2为0.983,模型在95%置信水平上显著且有较好的拟合度和较高的解释能力,可以用来分析和解释挂牌价格和成交价格的关系。因此,以房屋租赁挂牌价格变化表征房屋租赁价格总水平变化是有意义的。

由于所获得的房屋租赁挂牌数据不具备某些特征且部分变量存在共线性,故对部分属性进行逐步回归分析,如建筑面积、带看次数、总楼层数、房屋户型、房屋所在楼层、房屋采光面(朝向)和所属辖区等。为比较上述四种模型的拟合度,选定较为合适的函数形式,本文以2017年12月1日青岛市房屋租赁数据为例进行模型构建,结果(置信度取95%)见表2。

表2 Hedonic模型函数形式比较

表2函数式中,Xi为房屋特征连续变量,如建筑面积、带看次数和总楼层数等;Dj为房屋特征虚拟变量,如房屋户型、所在楼层、房屋采光面(朝向)房屋类型、所属辖区等;α0为模型常数项;αi为各连续变量回归系数(i=1,2,…,m);βj为虚拟变量的回归系数(j=1,2,…,n);ε是服从正态分布的干扰项。 当在模型中出现对数形式时,由于虚拟变量Dj取值为0或1,无法进行有效的对数化处理,所以一般在这类模型中仅将连续变量Xi进行对数处理,而对虚拟变量不做任何处理。在对连续变量进行对数处理时,个别变量有取值为0的情况(如带看次数),将只对取值不为0的连续变量进行对数处理。见表3。

表3 对数线性形式的Hedonic模型系数及其显著性检验

在租赁市场方面,房屋所在楼层位置与房屋租赁价格呈负相关;户型越大越不容易租出理想的价格;在影响租赁价格的所有因素中,区位因素对租赁价格的影响最大,沿海发达地区与其他地区相比租金水平高,符合居民居住偏好与城市生活现状。由表2、表3可知,对数形式的Hedonic模型不仅可以较好地拟合租赁价格同房屋属性之间的关系且经济意义更为合理,因此在指数计算时将采用对数线性形式的Hedonic模型。

(二)实证分析

透彻掌握房屋租赁产业的实际情况是指数编制成功与否的重要基础。为保证数据质量,本文每天21:30定时采集国内代表性房产服务平台链家网的房屋租赁挂牌数据,对获取的数据进行清洗和量化并存储于数据库中,每套房产的租价与房屋属性最终都会对指数结果产生影响。

山东省省会济南与沿海重要城市青岛的城市版图不断外拓,房地产市场规模较大,房屋租赁交易数据较为充分,能够较好的代表山东省房屋租赁价格总体水平变化趋势。因此,以济南与青岛为例进行房屋租赁价格指数的试算较为科学合理。样本空间时间跨度为2017年12月至2018年3月,其中济南市所收集到的数据总计265 504条、青岛市所收集到的数据总计274 620条租赁信息。设定2017年12月1日为基期,基期的价格指数为100,即济南市、青岛市2017年12月1日房屋租赁价格指数为100。进行指数试算并与传统中位数价格法和我国官方计算商品住宅销售价格指数的双加权平均计算方法进行比较,计算结果见图2、图3。

图2 济南市2017年12月1日至2018年3月13日房屋租赁价格指数试算结果及比较

从总体上看,用不同方法计算的三类指数在趋势上是一致的,不同租金指数的计算方法各有侧重。由于Fisher公式对称地使用基期和计算期的权数,平均了整体模型的变动程度,Hedonic方法计算的指数较为平稳;中位数法计算的指数波动率较小,计算结果受数据结构的影响较小,但无法敏感的反应房屋租赁市场的短期波动,在测度房屋租赁价格的长期走势上来看效果并不好。根据我国《住宅销售价格统计调查方案》计算的双加权链式指数采用双加权的指数计算方式,即分别利用租赁面积和租金作为权数计算价格指数,然后将两个价格指数再简单平均计算。加权价格指数的计算方法简单易行,但未考虑同质可比,计算结果受数据结构影响较大。

从图2、图3中可以看出,2018年3月中旬济南和青岛两市的房屋租赁价格总水平较基期分别上涨3.84%和6.25%,符合居民日常生活感知。2017年末济青两市房屋租赁价格水平处于比较稳定的状态;随着2017年12月20日中央经济工作会的召开,两市均受“租购并举”政策影响,租赁价格有了明显的提速。

图3 青岛市2017年12月1日至2018年3月13日房屋租赁价格指数试算结果及比较

(三)质量评估

为了进一步验证Hedonic-Fisher模型的优势,根据指数质量检验的前沿研究[23-24],选择三种常用的检验方法,即差分序列的自相关系数AC(1)、波动率(Vol)和用Hodrick-Prescott Filter剥离出的趋势序列的离差平方和(SSD)[25],对济南、青岛两市的房屋租赁价格指数进行趋势平稳性、波动性和相对趋势的离散程度三个维度的检验,并将之与双加权平均法和中位数价格法的试算结果进行比较,结果见表4。

表4 模型估计效果对比分析

计算结果清楚地表明,根据Hedonic-Fisher链式指数模型编制的实时房屋租赁价格指数无论在波动性(Vol)还是相对趋势的整体离散程度(SSD)方面,均具有最高的计算质量;在趋势平稳性(AC(1))方面,中位数价格法具有最高的计算质量。相比之下,本文提出的Hedonic-Fisher链式指数对房产等异质性商品的处理更为科学,能有效地降低因质量变化而引起的价格指数的偏差,可以准确反映租赁价格总水平的变动。

五、结论与建议

本文结合大数据思维与技术,摒弃了房产机构上报与调查员实地采价相结合的传统数据收集方式,使用网络开源房屋租赁挂牌数据测度房屋租赁价格的动态变化特征,并在此基础上提出了既能满足开源数据异质性又能满足最佳指数编制理论的统计方法:Hedonic-Fisher链式指数模型,通过实际数据验证了该方法的有效性并进行指数质量评估。得出的主要结论:(1)基于Hedonic-Fisher链式指数模型构造的实时房屋租赁价格指数,相比于双加权平均法和中位数价格法具有较好的计算质量,能够客观真实地反映了流通环节中房屋租赁价格的变动方向和变动幅度,可为租房者、投资者以及房屋租赁中介商提供及时、可靠的价格参考。(2)该指数能够揭示房产属性变量与房屋租赁价格的异质关系,在时效性上具有先行性,领先70个大中城市商品住宅销售价格指数约35~45天,可以更好地服务房屋租赁行业,为房屋租赁市场提供实时价格指引,指导市场参与者理性消费和理性投资。(3)指数的实时性从可视化的角度检验了宏观经济政策的微观效度,验证了房屋租赁价格适度上涨的客观事实。在党的十九大报告提出“租购并举”住房制度的前后,济青两市受政策影响,房屋租赁价格呈现出先平稳后适度上涨的走势。

在深化租赁市场改革的过程中,指数的“锚定效应”不仅有利于稳定市场预期,降低租赁市场参与者的投资、经营风险,而且可以指导租赁市场参与者理性消费、理性投资。为此,我们建议,我国政府应当加强房地产行业实时价格指数的编制力度,鼓励政府部门、科研机构和龙头企业等结合产业现状与现有开源数据创新指数编制方法,为深化市场化改革提供可行途径。除此之外,在我国房地产市场“租售失衡”的背景下,国家的政策制定尤为重要,特别是政府是否能够及时实施有效的宏观经济政策。在不考虑时滞的情况下,从宏观经济政策的公布对房屋租赁市场的微观效度来看,政策效果较为显著。因此,需要国家相关部门在制定房产调控政策时,应当重视政策的针对性和导向性,更好地发挥宏观经济政策的作用。

猜你喜欢
价格指数房屋价格
春市营销环比回升 价格指数环比小涨
1月巴西生产者价格指数上涨3.92%
UMAMMA历史房屋改造
房屋
转租房屋,出现问题由谁负责?
8月百城价格指数环比连续16个月上涨
7月百城价格指数环比连续15个月上涨
价格
价格
价格