文 | 本刊记者 邢帆
链家网:云上楼盘字典的建造者
文 | 本刊记者 邢帆
利用多年来积累的房产数据,链家网建立了国内规模最大的房产信息数据库之一,打造了一个优质的真实房源信息平台。
提起链家网,你的第一反应是什么?是穿梭在楼盘小区中的房产经纪人?还是鳞次栉比的店面?反正你不会习惯性的将之与互联网、大数据、云计算轻易串联起来。但你可知道,目前链家网的存储服务所存储的文件量超过8000万个、每周新增文件100万个。此外,随着移动互联网的兴起,链家集团也加快了向互联网转型的步伐,并于2014年开始采用云服务。并成为集房源信息搜索、产品研发、大数据处理、服务标准建立为一体的以数据驱动的全价值链房产服务平台。
云技术早已不是某一行业的专属,对于发展在今天的众多行业来说,云代表着破局、转变,更代表着成长。
是的,对于今天的链家网来说,最为准确的定义应该形容为:国内房地产行业中规模最大的线上产品技术团队之一,为链家集团的线上、线下业务提供全面的技术平台,主要包括两方面内容:其一是面向经纪人业务的日常作业系统、合同流程处理系统等与房产交易相关的业务系统;其二是面向用户的链家网网站和链家APP。目前,链家集团遍布全国的十万多经纪人每天都使用链家网提供的业务系统进行日常作业、客单跟进、合同签署等操作;有房产买卖意向的业主与客户则通过链家网和链家APP进行线上发布、订阅、浏览房产信息等操作。利用多年来积累的房产数据,链家网建立了国内规模最大的房产信息数据库之一,打造了一个优质的真实房源信息平台,努力通过线上交易的流程化,实现“让房产交易不再难!”的目标。
链家网从2007年起就开始进行大规模的房产信息系统建设,依托各地门店积累起来的丰富数据,建立起完善的楼盘字典数据库,并以此为核心,分别构建起为链家集团经纪人服务的日常作业系统和服务于用户的房产信息发布、查询、订阅系统。这些系统最初都部署在链家网的自建服务器和互联网数据中心(IDC)的服务器上,随着链家集团业务的快速扩展,楼盘字典数据的规模也急剧扩张,截止到目前已经收录了7000万套房产信息数据。这种数据量的急剧增长对原来的IDC托管服务器方式提出了严峻的挑战,如何快速扩容并确保数据的安全可靠成为链家网亟待解决的问题。
另一方面,随着移动互联网的兴起,链家集团也加快了向互联网转型的步伐,面向用户的链家线上系统和链家APP不断完善,吸引了越来越多的用户利用这些资源来完成房产信息的发布、检索、查询。如何保证在用户量爆发性增长时确保系统的可靠性、可用性和快速响应能力,是链家网面临的另一个严峻挑战。
可见,在上云之前,链家网虽然已经建立起了楼盘字典数据库和分别面向经纪人和用户服务的系统,这在行业中已经具备了不俗的竞争力,但这对于链家网来说却并不是晴空万里。
为了应对这些挑战,链家网从2014年起开始使用AWS云服务,并与原有的IDC托管服务器系统形成互补,建立起混合云架构,实现了存储系统的灵活扩容。目前链家网的存储服务,所存储的文件量超过8000万个、每周新增文件100万个。包括交易类型的数据、人员、行为的数据。
链家未来的战略定位于搭建集房产交易平台、房产信息平台和服务者生态平台为一体的数据驱动的价值链房产服务平台,努力打造“住的入口”, 在房产交易、资产管理上提供服务,逐步实现更好的服务体验、更全的房产信息、更好的经纪人生态的协调和一致。链家网在系统上可以按照所服务对象简单分解为:面向经纪人与面向用户的两套系统。而在大数据工作方面,则分为大数据应用(交由业务线团队或其他技术团队)和统一管理的大数据平台团队。
链家自2007年开始便有意识的积累门店数据。链家网将这些数据分为三类:
第一、 物的数据。比如楼盘字典,在线上通过数据的形式能够把一套房子高度还原,让线上用户了解房源基本情况。但是依然需要用户到线下去验证房屋,所以物的数据很重要。
第二、 人的数据。包括从业人员的学历、在服务过程中所产生的动作、过往的痕迹,如果能把人的数据拿到平台上进行分析,最终能够形成对人的能力标签的提取。比如客户想买什么样的房子,应该对应什么样的经纪人。
第三、 行为的数据。目前行业最缺的就是行为的数据,过去所有作业的行为,小一些、管理弱一些的公司基本上是不会通过数据分析去洞察行业的。
对于任何一个行业的交易平台来说,所提供的服务大多包括:信息查询、交易、相应的资产管理、金融服务、仓储、物流等。而对于链家网所服务的行业来说,房屋不需要仓储和物流等消耗大量人财物成本的投入。因此平台的价值一方面通过交易获得,一方面恐怕就是大数据本身所带来的了。那么大数据和营销变现有实际的关系么?表面上看好像没有太大的关系,但其关键是让数据入库,进行多维分析。数据本身不会撒谎,数据本身可以让消费者的决策力,洞察力提升。
未来这个行业可能会出现一个非常大的数据公司,数据能力在未来几年是检测企业发展潜力的关键因素。
链家网是一家正在快速成长的互联网公司,技术团队很年轻,专注于核心产品的迭代更新,没有更多的精力去深入研究和搭建底层的基础架构,因此希望选择可靠的云平台,使整个系统从一开始就有一个稳定、可靠的系统架构。“与其他云平台相比,AWS吸引我们的主要原因是服务功能很完善、产品群之间的脉络很清晰,非常方便实用,这是其他云平台无法比拟的。”链家网平台服务架构师吕毅说。
目前链家网使用的云服务主要包括:用于开发和部署面向用户的线上系统,可以灵活伸缩,轻松应对用户访问量激增的状况。以及主要用于链家楼盘词典的大数据量存储,可以轻松使用对象存储,具有简单的Web接口,可以在Web上的任何位置存储和检索任意数量的数据,并且只需要按照实际使用的存储付费,没有最低费用和准备成本。链家楼盘词典包括图片和文本数据,数据量很大且持续增长,过去采用IDC托管服务器模式时,常常会因为扩展存储空间而投入大量的人力物力,而且也无法方便地实现灾难备份。“迁移之后,我们再也不需要考虑存储扩容问题了,更重要的是我们可以自己定义策略,将长时间不用的数据自动迁移到成本更低的云存储服务上。” 吕毅说。
在链家网的业务系统从数据中心向云服务迁移的过程中,网络连接服务帮助链家网轻松实现了数据中心与云平台的连接,搭建起方便、可靠的混合云架构,既提供了稳定的网络性能,又提升了整个系统架构的安全性,使链家网基于数据中心的老系统与云平台的新系统无缝地融合在一
链家网从2014年开始使用云服务,目前已经利用云服务构建了完整的混合云架构:在云平台上建立了面向用户的在线房产信息发布、订阅、浏览系统,日访问量已经突破2000万;楼盘词典数据库和面向经纪人的日常作业系统则部署在数据中心与云平台构成的混合云架构上,为分布在全国各地的十多万链家经纪人提供快捷、可靠的服务。
从传统的数据中心模式迁移到基于云平台的混合云模式,链家网的业务系统在安全性、可靠性、灵活性等方面都得到了大幅度的提升,同时也降低了系统开发、维护和运营的成本。
云平台的使用增强了链家网房产信息发布、订阅、浏览系统的弹性,用Auto Scaling,链家网可以轻松应对用户访问量的急剧变化,既提高了用户体验的满意度,又节省了成本。
在数据存储方面,链家网楼盘词典数据的可用性提升至99.99%,存储容量可以无限扩展,而且使用简便,原来难以实现的灾备功能也因为服务本身采用的多可用区部署方式得以轻松实现,极大地提升了业务系统的可靠性。