基于互联网房屋租赁信息的住房租金微观影响因素研究

2017-06-03 00:21范雅静卢守东
现代经济信息 2017年8期

范雅静+卢守东

摘要:随着我国经济水平飞速增长,城市间人口流动日益频繁,房屋租赁市场日趋繁荣,房屋的租金也受到越来越多的关注。而由于互联网的发展,房东与租户通常会在网络上发布并获取信息,因此租房网站中包含丰富的租房信息。本文结合计算机网络爬虫方法从主流租房网站中获取房屋租赁价格,并提取租金及房屋特征,包括所在区域、楼层、配套设备等;然后利用房屋租金作为被解释变量,房屋特征作为解释变量,建立特征价格模型,从微观角度分析北京住房租金的影响因素,考察在北京市房屋租赁市场目前发展水平下,租金的微观决定机制及消费者的偏好。

关键词:房屋租赁;微观因素;广义线性模型

中图分类号:F49;F822 文献识别码:A 文章编号:1001-828X(2017)009-0-03

Micro Determinants of Apartment Rent: Evidence Based on the Online Apartment Advertising in Bejiing

Fan Ya-jing, Lu Shou-dong

School of Information and Statistics, Guangxi University of Finance and Economics, Nanning, Guangxi, 530003

Abstract: With the rapid growth of China's economic, the inter-city population is becoming more and more frequent. Thus the rental market is becoming more and more prosperous and the rent of the house is receiving more and more attention. Because of the development of the Internet, landlords and tenants usually publish or read rental information on the network. The websites contains lots of rental information. This paper makes use of the web crawling method to get the house rental information from main rental website and extracts the house features, including the size, floor, auxiliary equipment etc. Then we construction hedonic pricing model to analyze the micro determinants of apartment rent price and examine the micro-decision mechanism and the preferences of consumers in the current rental housing market in Beijing.

Keywords: Apartment rent; Micro determinants; General linear model

一、引言

近年來我国房价一直持续增长,使得购房价格、租房价格成为人们经常谈论的话题。对于作为房价最高的城市之一——北京,还承载着全国各地移民,因此,租房也成为了大部分人解决住房问题的主要途径。而租房价格,通常会收到很多因素的影响,如地理位置、配套设施甚至楼层,因此在研究住房价格时,需要更多考虑与生活相关的因素。当前,许多学者已经开始了对房地产价格的研究。对于住房租金,大多数学者只是从宏观的角度,研究宏观经济与租赁价格的关系。而对于微观影响因素的研究大多集中在写字楼的租赁价格当中。这主要是因为,写字楼是公共场所,其特征容易通过研究者现场观察获得,但对于私人住宅,研究者很难获取大量的住宅特征数据。

本文的研究恰好弥补了住房租金微观影响因素的空白。随着互联网的发展,许多房东以及租房者纷纷选择在网上发布、获取信息的方式交流租房信息,因此,许多租房网站包含了丰富的租房信息。本文利用计算机网络爬虫技术,获取北京市租房信息,并利用这些信息建立价格特征模型,分析北京市住房租金的微观影响因素。

二、模型理论

本文将利用特征价格模型对北京市住房租赁价格微观影响因素进行分析。特征价格模型来源于特征价格理论。A.T.Court(1939)首次对汽车价格进行了研究,构建了汽车价格指数。随后,Lancaster(1966)提出消费者偏好理论,认为消费者购买一个产品,是由于产品的特征符合消费者的需求。Rosen(1974)则完善了Lancaster偏好理论,理论上构建了特征价格供需特征模型,为特征价格模型奠定了基础。随后,特征价格模型开始广泛的应用于住房、写字楼价格研究领域,学者们主要研究住房微观特征,例如住房属性、结构、地理位置、房龄等对房屋价格的影响。

特征价格模型的构建主要通过回归模型实现。对于如何正确选择特征价格模型中的函数形式,从而使得模型能够正确表达自变量和因变量之间的关系,理论上还没有一种明确的检验方法,因此,大多数研究者都是凭经验初步设定函数形式,然后不断地尝试和修正,直到认为函数形式能够解释样本数据的差异,并使得模型对样本数据的拟合满足要求。在过去的研究中,特征价格模型主要有线形函数、对数函数、半对数函数和对数线形函数四种基本函数形式,其模型结构如下:

①线性形式:

②对数形式:

③对数线性形式:

④半对数形式:

过去,学者大多选用一般线性回归模型,应选用最小二乘法作为估计方法。在本文中,作者拟采用广义线性回归模型进行特征价格模型的构建。广义线性模型(generalized linear model)由Nelder & Wedderburn(1972)首先提出,是一般线性模型的直接推广,它使因变量的总体均值通过一个非线性连接函数(link function)而依赖于线性预测值,同时还允许响应概率分布為指数分布族中的任何一员。连接函数解释了线性预测子与分布期望值的关系,函数形式的选择可视情形而定,通常只要符合链接函数的值域有包含分布期望值的条件即可。本文在进行多次尝试后,根据模型拟合优度,最终使用伽马分布,并以倒数形式作为连接函数。

三、实证分析

1.数据来源及数据预处理

本文所使用的数据来源于56同城网站。58同城(http://58.com)是国内第一中文分类信息网站与免费信息发布网站,内含海量的房产信息,包括全国各主要城市的房屋出租信息。对于每一条租房信息,其主要项目有发布日期(时间)、所在城市、房源名称、租金、面积、户型、类型、楼层、配置以及所在的小区与地址等。在分析该网站及相关网页结构的基础上,基于.Net框架,采用C#语言,自行设计了一个颇具通用性与灵活性的租房信息采集程序,并通过Windows系统中的“任务计划程序”,每天按指定的时间与间隔启动之,依据所设定的采集方案与规则,成功地实现了各有关城市一定数量的租房信息的自动采集,同时将所采集到租房数据持续地添加到SQL Server数据库中。

本文主要选取了2015年11月4日-2015年12月6日期间发布的北京市住房信息,并将租金、面积、楼层、装修程度、配置以及所在城区作为模型变量。在缺失值删除、异常值删除之后,得到1459个样本。其中,由于网站租房信息发布的特殊性,对个别变量作如下处理:(1)在租房信息中,出租者通常只给出楼层范围,为将其转换为数值型变量,本文对楼层范围计算出平均数,作为实际楼层;(2)装修程度通常分为简单装修、中等装修、精装修与豪华装修,本文将这四类装修用分数表示,分值为1-4分。

2.价格影响因素选择

结合以往文献对住宅价格模型的研究,并基于数据可得性,笔者构建了北京市房屋租金的特征价格模型:

租金=f(区位、楼层、配套设施、装修程度)

笔者认为,住在租赁价格主要收到区位特征、楼层、配套设施、装修程度四个因素的影响。其中区位特征以所在城区表示,北京现辖16市辖区。其中地处北京二环路以内的东城、西城两个区是传统上的中心城区。规划中北京市城区的范围由大约北京四环路以内的中心城区和十个四环外围城区组成。不同城区的区位功能以及距离中心城区、CBD的距离远近等因素,决定了该城区居住适宜程度,也进而决定了该区域租金价格范围。本研究中数据样本涵盖北京市除延庆区之外的15个城区。其次,房屋楼层也是人们在选择住宅是重点考虑的因素。不同楼层均存在不同的优势和缺陷,将楼层纳入到特征价格模型中,可以观察租房者对不同楼层的喜好。此外 ,配套设施及装修程度影响了租房者的居住环境、住房感受,也决定了租房者在入住之后是否需要二次消费,因此将该因素纳入特征价格模型中。

3.北京租房价格特征

其每平方米单位价格如下图所示:

其余定量变量描述统计结果如下表所示:

通过观察原始数据可以看出,随着出租房屋配套设施数量的增加,单位面积价格升高;此外,单位面积价格还会随着楼层的增加、装修程度的提升而提高。根据地段不同,单位房租价格也有很大差异,其中占据北京市中心的东城区、西城区价格最高,其次是朝阳区、崇文区、海淀区以及宣武区。

4.特征价格模型分析

如前文描述,特征价格模型的形式有多重,而如何正确选择特征价格模型函数形式的问题,过去的文献并未提出统一的标准。通过对不同模型的多次尝试,笔者设定如下模型:

RENT=f(DIST,FL,AC,DEC)

其中RENT为单位面积租金(元/平方米),DIST为城区,FL为楼层,AC为配套设施个数,DEC为装修程度。由于区位为定性变量,因此将其转换为哑变量,则共有14个哑变量。根据模型效果,本研究最终采用Gamma分布并以倒数作为链接函数的广义线性回归模型,模型表示如下:

在模型建立过程中,原装修程度分为1-4级,分别代表简单装修、中等装修、精装修与豪华装修,而模型结果显示前三个装修水平,即简单装修、中等装修与精装修不显著,因此将这三个水平合并为普通装修,最后一个等级保留为豪华装修,最终装修程度分为两个级别。对变量做出调整后,最终模型结果如下:

由模型结果可以看出,其中楼层、装修程度以及配套设施均为显著变量,而区位中除朝阳区、崇文区及海淀区外,其他水平均显著。由于该广义线性回归模型采用了倒数函数作为链接函数,因此系数越小表示随着该变量的增加,单位价格也会增加。由上表可知,随着楼层的增加,单位价格也随之增加。同理,装修风格上,豪华装修比普通装修价格更高。而在配套设置的个数上,随着个数的增加,单位价格会有所降低,这与平时感知不符。这可能是由于配套设置的价格差异导致的,有的房屋只有少数配套设施,但价格较为昂贵,这也是租金价格较高的原因。对于不同城区的价格差别,其结果也和感知相符。其中,朝阳区、崇文区、东城区、海淀区和西城区高于平均价格,且东城西城区居首,宣武区单位价格为平均水平,而其余城区房租价格则低于平均水平。

四、结语

近年来房地产市场持续升温,越来越多闲置住房投入租赁市场,同时也有越来越多人选择租房作为居住方式。本文研究了房屋租赁价格的微观影响因素,解释了租金变化规律,研究结论极具应用价值,有助于房东和租客合理评估房屋租金,便于定价。

在房地产价格微观影响因素的研究中,以往学者往往以商业租金为侧重点进行研究。而由于私人住宅的私密性,学者难以获得住宅特征并获取较大的样本进行研究。本文利用互联网租赁信息作为样本,能够较好的解决了这一难题。通过计算机技术,批量获取互联网的租房广告,再利用文本挖掘技术提取房屋特征信息。利用这一方法,可以在较短的时间内获取大量样本信息进行研究。同时,也能够不断拓宽房地产价格微观影响因素的研究,例如可获取不同城市、不同时间的信息,以对该问题进行更广泛的研究。

参考文献:

[1]Rosen S. Hedonic prices and implicit markets: product differentiation in pure competition[J]. Journal of political economy, 1974, 82(1): 34-55.

[2]Marks D. The effect of rent control on the price of rental housing: an hedonic approach[J]. Land Economics, 1984, 60(1): 81-94.

[3]Pagourtzi E, Assimakopoulos V, Hatzichristos T, et al. Real estate appraisal: a review of valuation methods[J]. Journal of Property Investment & Finance, 2003, 21(4): 383-401.

[4]Hirschman E C, Holbrook M B. Hedonic consumption: emerging concepts, methods and propositions[J]. The Journal of Marketing, 1982: 92-101.

[5]劉洪杰.基于特征价格模型的社区商业租金微观影响因素实证研究[D].浙江大学,2010.

[6]郑钱洋.沈阳市写字楼租金的微观影响因素的实证研究[D].浙江大学,2006.

[7]周刚华.城市土地价格的微观影响因素及其实证研究[D].浙江大学,2004.

[8]李钰.基于hedonic模型的景区住宅定价方法及实证研究[D].西安建筑科技大学,2009.

[9]蔡菊花,贾士军.基于Hedonic模型的住宅租赁价格影响因素分析[J].经济研究导刊,2010(30):150-152.

[10]杨鸿,贾生华.基于微观层面的写字楼租金影响因素研究述评[J].技术经济,2008,27(7):77-80.

作者简介:范雅静(1989-),女,广西南宁人,讲师,主要从事经济预测研究。

卢守东(1969-),男,广西岑溪人,高级工程师,主要从事数据挖掘及Web服务研究。

基金项目:2014年广西财经学院数量经济学重点实验室课题(2014SYS12)。