孙泠
什么是真正的数据驱动型公司?LinkedIn的答案是:从数据分析中得出成功需要的硬性条件,团队朝着这个方向全力优化产品,这就是数据驱动型公司。
四年前,来自中国天津的张溪梦加入LinkedIn的“数据科学家”部门,负责基于数据挖掘的产品开发,比如LinkedIn 最著名的“你可能认识谁”,“你可能喜欢的工作”,“你可能会聘用的人”等产品功能都是这个部门开发的。但LinkedIn高层认为,即使如“数据科学家”这样的部门依然与实际业务“贴”得不够紧密。于是入职9个月后,张溪梦得到了第一次提拔,组建了一个与业务紧密联系到极致的新部门——商业分析部。
张溪梦说,LinkedIn的所有业务都基于数据模型——LinkedIn.com上的用户增长和体验生成大量数据,LinkedIn根据这些数据开发新产品为用户提供新产品和服务,这些新产品和服务又进一步刺激增长,增加客户黏度。这是LinkedIn最基本的业务模型,维系这三点反复作用并在其中流动的正是数据。
分析就是谋略和决断
通过在诚信、精准的职业用户平台上搭建与企业用户、个人紧密联系的高价值生态体系,截至2014年4月,LinkedIn在全球30多个国家已经拥有3亿用户;超过300万家公司在LinkedIn上建立公司主页,提供产品、服务、招聘信息和广告。2014年LinkedIn的营收预计会达到20亿美元,主要来自3条主产品线:人才解决方案(招聘者付费进入人才数据库),营销方案(广告主付费)以及高级版定制(个人用户为了更多网络功能以及新发现而付费)。
而张溪梦领导的商业分析部,可以解释为“负责所有和钱相关的分析”。商业分析部直接支持的业务部门有5个——产品、销售、市场推广、开发和运营,其中运营又分不同部门,比如广告运营、销售运营、市场运营、商业运营等。商业分析部将数据分析过程透明化,让业务部门不需了解技术细节而直接看到分析结果,“LinkedIn并不希望所有员工都成为数据分析师。”张溪梦说。
“你可能认识的人”是LinkedIn最受欢迎的功能之一,它可以帮助用户找到自己想要保持联系的人。而从后台运营角度看,这项功能要求数据时刻保持更新状态,这就需要时刻跟踪用户在不同应用间的数据。而最早这项功能基于传统的关系型数据库,因此计算一次需要几天到一个星期的时间,LinkedIn的数据基础设施团队搭建了一个包括针对特定工作负载设计的在线、离线、近线系统的数据架构——在线系统处理用户的实时交互信息;离线系统主要是Hadoop和Teradata的数据仓库,处理批量数据和分析工作负载;近线系统处理类似“你可能认识的人”这类的功能、搜索以及LinkedIn社交图谱数据,这类数据对处理和更新速度的要求不像在线系统那么高。
LinkedIn内部大概有25种不同的数据库和数据解决方案,其中一半以上是由LinkedIn内部开发的。和其他公司一样,过去LinkedIn的数据分析结构是一个“金字塔”形状,最底层是公司的全部业务数据,数据之上分为分析层、报表层、深度分析层、战略分析层和决策层等。“金字塔最精华的部分是塔尖,底层花费90%的时间却没有多大价值。”于是,张溪梦力主将底层做小,由“金字塔”变为“菱形”。首先,需要把待分析数据做得很“薄”,再把很薄的数据切得更“细”,然后把已经又“细”又“薄”的数据放入Teradata、Aster Date以及内部开发系统里继续做分析。这种“在数据模型上做模型”的方式不仅降低了存储成本,也保证了数据分析速度从几小时到20毫秒的飞跃。另外,对于非结构化数据,LinkedIn会首先将非结构化数据结构化。商业分析部技术部门开发了很多基于Java的工具,比如将一份简历的内容打散,进行重组——现任及过去任职的3家公司的信息最被看重,于是会顺序出现在最前面,包括起止时间、任职时间、职位等。
“中国历史上第一个分析师是姜子牙,他是第一个做分析和策略的人。”从小的中国传统文化熏陶让张溪梦从独特的角度去看商业分析,武王子牙、房谋杜断,在他眼里都是做分析的,而分析就是谋略和决断。
第四大产品方向
在销售最初的阶段,张溪梦的商业分析部会先基于数据进行四步的预测工作:第一步,预测客户公司的目标费用是多少;第二步,定位该公司内购买LinkedIn产品的决策者;第三步;判断LinkedIn内部哪个人对该决策者产生的影响最大;第四步,基于以上三步制作完善整体方案后,销售再去谈客户。
LinkedIn最核心的竞争力就是分析人。在人才获取环节,LinkedIn在整个2亿用户的巨大数据库中进行过滤搜索,打破以往只能招聘到岗位申请者的局限,同时招聘企业通过设定地点、技能、以往公司、教育背景等多个关键词,迅速、准确地锚定最匹配的人才,从被动等待“愿者上钩”变成了主动猎取。LinkedIn对一些公司人力资源部门的了解往往比他们自己还多,“比如去年他们招了多少人,从哪个地方招的,都是什么样的学历、资历、职位;流失的员工都去了哪个公司,得到什么样的职位,这些数据LinkedIn全有。”张溪梦说。
对于并非岗位申请者的匹配人才,LinkedIn的信息服务InMail则可以帮助招聘人员与他们感兴趣的人取得联系。但即使他们不想发送InMail信息,也可以随时关注和了解潜在候选人的动向。他们还可以将此人加入到“招聘项目”中,以便了解该公司还有谁在关注此人。甚至还有一项新的测试功能,可以帮助招聘人员从公司内部寻找有关候选人的反馈消息,这一切都可以在与候选人取得联系之前完成。
商业分析部针对销售阶段开发的分析工具,经过不断改进和完善,已经成为公司内部使用率最高的热门工具。“LinkedIn的销售有3000人,而据我们统计,这款产品每天的使用者有3000~4000人,说明很多非销售部门的员工也在用。”用户的选择说明价值,由于功能太过好用,在内部使用3年后,LinkedIn在今年7月将这个产品的一部分功能放到网站上,做成了企业级销售解决方案,同时也成为LinkedIn未来的第四大产品方向。
对于这种内部产品输出,张溪梦对数据驱动的商业分析有更高的梦想——将内部分析、内部产品、外部产品三个层次理顺,形成常态化的商业模式。
相比Facebook和Twitter的强互动,LinkedIn就是弱互动。“有多少CEO每天都有时间上LinkedIn?但就是因为他们很忙,用得没有那么多,所以对LinkedIn来说,小数据反而反映很大的价值。”张溪梦认为,这正是LinkedIn产品的独特价值——很多人一辈子都想跟这些公司的CEO联系上而不可得,而这种联系确实能产生价值以及商业机会。通过社交网络数据,LinkedIn甚至可以分析出各个公司的权利结构,等同于太阳系中的引力关系,“比如,CEO在公司矩阵中的引力最大,跟CEO接近的人引力一定也大,然后和他离得越远的人,如果质量再小的话,引力就小,这是100%可以分析出来的。”
与Facebook围绕“社交图谱”概念打造真实社交网络一样,LinkedIn目前所围绕的概念是“专业图谱”。
实名、高端社交与弱互动(即有限分享),此三者正是LinkedIn取得成功的前端原因。这三个定位保证了LinkedIn可以沉淀下真实世界中最有商业价值的那部分社会关系并作为数据金矿来挖掘。