大数据分析技术在我国房地产市场研究中的应用

2015-01-02 14:06范志勇
北方经贸 2015年1期
关键词:预测客户模型

范志勇

(黑龙江大学经济与工商管理学院,哈尔滨150080)

一、引言

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Bigdata)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。简言之,从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。[1]

大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。1秒定律。最后这一点也是和传统的大数据分析技术有着本质的不同。业界将其归纳为4个“V”——Volume,Variety,Value,Velocity。

二、大数据分析在我国房地产市场研究中的必要性

随着房地产行业竞争的加剧,房地产企业要想在竞争中制胜,必然需要充分的信息支持和准确的市场判断。房地产行业拥有大量的数据积累,包括行业信息、经济环境信息、客户信息等。这些数据是房地产企业市场运作的重要参考。面对快速增长的海量数据收集,企业需要有力的数据分析工具将“丰富的数据”转换成“有价值的知识”,否则大量的数据将成为“数据丰富,但信息贫乏”的“数据坟墓”。

大数据分析是从大量数据中发现潜在关联、模式,做出预测性分析的有效工具,它是现有的一些人工智能、统计学等技术在数据库领域中的应用。应用大数据分析有助于发现业务发展的趋势,揭示已知的事实,预测未知的结果,并帮助企业分析出解决问题所需要的关键因素,使企业处于更有利的竞争位置。[2]

三、大数据分析在我国房地产市场研究的应用范围

(一)大数据分析的种类

对于企业的海量信息存储,大数据分析是一种系统地检查和理解大量数据的工具。大数据分析根据预定义的商业目标,对大量的企业数据进行探索和分析,揭示其中隐含的商业规律,并进一步生成相应的分析、预测模型。

大数据分析发现的是以前未知的、可理解的、可执行的信息,所以也被称为“知识发现”(Knowledge Discovery in Databases)。与统计分析技术相比,大数据分析技术能很好地和数据库技术相结合,而且大数据分析工具用以发现数据中隐含的商业规律的方法已不局限于统计技术,还包括神经网络、遗传算法、自组织图、神经模糊系统等统计学科以外的方法。大数据分析发现的“知识”一方面可以用于构建预测模型,另一方面可以被用于丰富统计分析师的背景知识,再被统计分析师应用到数据分析中。

大数据分析任务一般可以分两类:描述和预测。描述性分析任务刻划数据库中数据的一般特性。预测性分析任务在当前数据上进行推断,以进行预测。具体来讲,大数据分析主要用于解决以下几种不同事情。

1.关联分析(Association analysis),是寻找属性间的相关性。两种常用的技术是关联规则和序列模式。关联规则是寻找在同一事件中出现的不同项的相关性,比如某个住宅项目的目标客户对该项目各方面评价之间的相关性序列分析寻找的是事件之间时间上的相关性,如对股票涨跌、房地产周期的分析。

2.分类(Classification)和预测(Prediction)。分类根据某种标准将数据库记录分类到许多预先定义好的类别中。例如,将房地产企业客户根据消费决策模式进行分类;同时可以建立预测模型,给定潜在客户的收入、职业、家庭构成等个人属性,预测他们的购房支出;如将房地产企业客户分为潜在客户、购买者和实际客户。分类系统可以产生这样的规则:“如果客户可以并且愿意承担每月2000元的月供,计划在1年内在某地区买房,那么他/她是一个潜在客户;如果客户至少进行过一次业务访问,那么他/她是一个购买者。”

3.聚类(Clustering)是把整个数据库分成不同的群组。它的目的是要群与群之间差别明显,而同一群之间的数据尽量相似。聚类与分类不同:分类之前已经知道要把数据分成哪几类,每个类的性质是什么;聚类则恰恰相反。

4.演变分析(evolution analysis)描述行为随时间变化的对象的规律或趋势,并对其建模。例如,结合人口构成变动趋势、教育水平发展趋势、社会经济发展趋势进行房地产消费趋向的分析。

5.描述和可视化(Description and Visualization),对数据进行归约、概化或图形描述等。例如,通过空间聚集和近似计算对一些具体的地理位置概化聚类,形成对某区域的形象化描述。

(二)大数据分析的市场研究价值

大数据技术在商业上实际应用十分丰富。应用大数据分析技术,可以帮助房地产行业找出有价值的信息,十分有助于企业发现商机、制定开发计划与营销策略。对于房地产市场研究,大数据分析可以应用于宏观经济形势研究、市场发展趋势研究、楼盘供应研究、竞争对手研究、客户研究。目前,专业市场研究公司对房地产行业的调研主要集中在客户需求分析方面,并积累了一定的经验,因此,笔者主要探讨房地产客户信息的大数据分析。

(三)大数据分析在房地产客户研究中有着具体的应用

房地产行业的客户信息有许多特点,一方面房地产行业面对的客户群广泛,而且客户的特征描述的结构复杂,另一方面房地产客户需求的层次不一,且易受外界因素影响,具有多层次性和多变性。[3]

对于复杂、多样而且擅变的客户信息,房地产行业客户信息的大数据分析有助于识别客户购买行为,发现客户购买模式和趋势。从而,帮助房地产企业改进服务质量,取得更好的客户关系和满意程度,设计更好的营销方案,减少商业成本。根据已有的大数据分析经验,大数据分析在房地产行业的应用可以归纳成以下几个方面。

1.客户细分:聚类,有效的划分目标客户群。

2.客户保留:分类回归、关联分析,识别无效的客户及流失的客户的消费决策模式,帮助企业识别现有客户中相似的潜在流失客户,以便采取预防措施。

3.客户拓展:分类,关联分析,有针对性的发现客户的反应行为模式,用来将潜在客户列表中的客户排序,以便找出哪些是对所提供的服务最感兴趣的客户。

4.升级服务:分类,预测,通过对客户行为特点的跟踪分析,对客户将来的行为进行预测分析,用预测得到的评分为每个客户选出最合适的几种服务方案。

5.活动分析:多维分析,通过比较热销期间的销售量和交易数量等有关情况,分析营销手段的有效性。

6.销售预测:特征化、关联分析,在项目开发的不同阶段,如:开盘、热销、封顶、现房,成交客户和意向客户的属性特点。

7.需求描述:特征化、多维分析,提供强有力的多维分析和可视化工具,方便企业进行带有复杂条件的聚集上的分析。

8.需求预测:层次分析、关联分析,通过比较出不同类型的消费者对各种价值构成的排序,找出各价值构成中的相关性。

四、如何在我国房地产市场研究中利用大数据分析技术

(一)明确商业目标

应用大数据分析的首要任务就是明确需要达到什么样的商业目标,并描述出需要解决的问题。目标的描述应该细化、清楚,以便于选择合适的挖掘方法,也方便检测大数据分析效果,判断建立的模型的有效性。

有些目标是大而空的目标:获得客户行为的了解;在数据中发现有用的模型;发现一些有意思的东西。而另外一些目标有较强操作性:发现哪些客户不受某种促销手段的影响;找出项目封顶时哪类客户成交率增加。

(二)数据准备

基于大数据分析的商业目标,提取所需要的数据。为了保证数据的质量,除了对数据进行检查和修正外,还需要考虑不同源之间数据的一致性问题。

如果数据集包含过多的字段,需采用一定的方法找到对模型输出影响最大的字段,适当减少输入的字段。常用的方法包括:“描述型大数据分析”、连结分析等。

很多变量如果组合起来(加、减、比率等)会比这些变量自身影响力更大。一些变量如果扩大它的范围会成为一个非常好的预测变量,比如用一段时间内收入变化情况代替一个单一的收入数据。因此,在数据准备阶段需考虑是否创建一些新的变量。

处理缺失数据也是数据准备阶段的一个重要工作。有些缺值本身就非常有意义。例如:富有的顾客会忽略“收入”,或者不在乎价格的影响。

(三)建立模型

建立模型是一个反复的过程。首先需要选择适合解决当前问题的模型。对模型的选择过程可能会启发对数据的理解并加以修改,甚至改变最初对问题的定义。

一旦选择了模型的类型及应用的方法,所选择的模型将决定对数据的预处理工作。例如,神经网络需要做数据转换,有些大数据分析工具可能对输入数据的格式有特定的限制等。

(四)输出结果的评价和解释

模型建立好之后,必须评价其结果,解释其价值。在实际应用中,模型的准确率会随着应用数据的不同发生变化。但准确度自身并不一定是选择模型的正确评价方法。对输出结果的理解需要进一步了解错误的类型和由此带来的相关费用的多少。如果模型每个不同的预测错误所需付出的代价(费用)也不同的话,代价最小的模型(而不一定是错误率最小的模型)将是较好的选择。

(五)实施

模型在建立并经验证之后,可以有两种主要的使用方法。一种是提供给分析人员做参考,由他通过查看和分析这个模型输出,并做出解释和方案建议;另一种是把模型应用到不同的数据集上。模型可以用来标示一个事例的类别,给一类客户打分等,还可以用模型在数据库中选择符合特定要求的记录,以用其他工具做进一步分析。

五、结论

大数据分析技术在房地产市场研究中还处于尝试阶段,在应用中还有很多具体的问题有待解决,但毕竟给我们提供了一个对房地产市场进行科学研究的方法。[4]在实践中还有很多新领域需要探索,对此我们需要时间和不断实践来磨合,但我们有理由相信在房地产市场研究中大数据分析技术会发挥越来越重要的作用。

[1] 栗 蔚,魏 凯.大数据的技术、应用和价值变革[J].电信网技术,2013(7):6-10.

[2] 李国杰.大数据研究:未来科技及经济社会发展的重大战略领域:大数据的研究现状与科学思考[J].中国科学院院刊,2012,27(6):647-657.

[3] 范志勇.中国房地产政策回顾与探析[J].学术交流,2008(8):60-66.

[4]王飞跃.知识产生方式和科技决策支撑的重大变革:面向大数据和开源信息的科技态势解析与决策服务[J].中国科学院院刊,2012,27(5):527-537.

猜你喜欢
预测客户模型
无可预测
适用于BDS-3 PPP的随机模型
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
为客户节省时间
重要模型『一线三等角』
陪客户喝酒后死亡是否算工伤
模型小览(二)
离散型随机变量分布列的两法则和三模型