神策数据:红杉和薛蛮子看好的“百度系”团队

2016-05-25 13:23张从艳
创业邦 2016年5期
关键词:数据源服务器百度

张从艳

私有化部署只提供分析模型,既服务了客户,又可保证数据安全。

自从“大数据”被提出来之后,现在似乎人人都在谈大数据,都在说“我们依靠大数据分析实现XX”。大数据似乎成了一个万能模板,任何公司都可以套用。但是真正能做到大数据分析的公司又有几家呢?

神策数据创始人  桑文峰

这个名为神策数据的“百度系”大数据公司说他们可以做到。神策数据成立于2015年,同年9月产品上线,主要针对互联网创业公司,解决他们的用户行为分析问题。据悉,神策数据已有40多家客户,其中包括美拍、爱鲜蜂、AcFun等。

大数据无疑是未来。在大数据概念未诞生之前,桑文锋就已经在百度干着数据分析的活儿了。他告诉创业邦(微信搜索:ichuangyebang):“那时我们并不叫大数据,而是叫云计算。”

2007年,浙大研究生毕业的桑文锋加入百度,直到2015年才离开。期间他一直在百度围绕着大数据做研发。2008年,他带领团队做了一个基于Hadoop框架的日志统计平台,大大提升了开发效率和运行效率,从而推广到整个公司。2012年的时候,大数据的概念突然就火起来了,这让桑文锋发现自己掌握的技术突然变得更有价值了。

移动互联网的发展导致网上的数据成倍增长,再加上传感器的发展,使数据源的采集成为可能,也为数据的采集提供了多个源头。比如Apple Watch就可以采集用户的运动数据和心率。

人们看中了大数据所带来的变化,但是桑文锋意识到一个问题:数据是变多了,但是数据分析方面的人才依然稀缺,只有BAT这些巨头培养了一批,这块的技术又很复杂,有大数据需求的公司如果想开发一套大数据分析平台系统,起码需要3?5个人做半年以上,并且研发和精力的投入都非常大。

桑文锋告诉创业邦(微信搜索:ichuangyebang):“我想这就是个机会。以我们的积淀,为市场提供一个数据分析工具,来解决大家的需求。”

数据安全的前提是客户的服务器足够安全

“市面上确实有一些很简单易用的分析工具,但是它们也还有一些不足。”桑文锋说。

第一,是数据源方面的不足。一般来说,市面上的一些大数据公司在搜集数据源方面只能通过客户端来收集,但是这样无法采集到服务器和数据库的数据,比如用户的一次点击行为,或者是他订单的运费等信息,数据来源就不够全。

桑文锋告诉创业邦(微信搜索:ichuangyebang):“在百度处理数据的经验告诉我,如果想把数据分析做好,最重要的是保证数据源。要尽量保证数据源的全和细,并且杂乱的数据也需要长时间的整理。”

在这方面,神策数据会派分析师帮助客户对数据进行归类整理,保证数据源的全而细,然后把搜集到的数据放到数据模型中进行分析。

第二,是分析能力方面的不足。“一般来说,它们(指大数据公司)大都提供的是标准的SaaS服务,这也就导致它们只能提供一些宏观基础的统计分析,一些深度的数据分析是做不到的。”比如来自北京的年龄在20~25岁之间的女性用户,最近一个月有10次购买行为,分析她们的客单价情况。

“其中任意因素的排列组合,现在他们做得并不是很好。而我们会帮助客户搭建底层数据库,并提供灵活的多维分析,用户只要把数据接进来就可以达到秒级响应。”

此外,桑文锋还告诉创业邦(微信搜索:ichuangyebang),神策数据是一个“SaaS+PaaS”的结合。客户可以使用已有的基础的SaaS服务,也可以在现有基础上进行DIY设计或者说二次开发,从而对接客户自己的CRM或者做数据挖掘。”

一般来说,神策数据会提供四种基础分析:

1.多维事件分析:分析用户行为中各个维度之间的组合、关系。比如某平台一段时间内成交曲线一直下跌,要分析原因就需要对时间维度进行拆解,如时间、空间、年龄、性别以及支付方式等等。

2.漏斗分析:对于电商、订单相关的产品来说非常重要,因为他们要看不同渠道转化的一些数据,以便实现精准营销。比如,一次购物行为,用户从打开网页到看中商品,到点击商品,到付款,任何一个环节他都有可能离开,这其实就是一个漏斗。而通过逐层分析,可以掌握到不同渠道用户的转化情况。

3.留存分析:分析用户留存某平台的情况,大多数平台肯定都希望用户是回头客。

4.回访分析:其实属于留存的一种特别形式。通过回访分析可以看到用户一段时间内访问的频次,或者访问时间段的情况,其实就是看用户做出某个行为的一些特征。

第三,是数据安全方面的不足。大数据是未来,但也有一个隐患会一直伴随着大数据的发展,那就是安全。如何保证客户的核心数据不被泄露、不被窃取?桑文锋想到一个办法,就是私有化部署。“客户的数据完全在他们自己的服务器上,我们不会拿过来。这样他们就不用担心因为把自己的数据放到第三方平台上而导致数据泄露或者数据被窃取利用。只要你的服务器足够安全,那么就不必担心数据安全性的问题。”

也就是说,神策数据只提供一个分析模型,将其嫁接到用户自己的服务器上,他们自己并不会把用户的数据拿过来。所以,客户数据的安全完全依赖于其自身服务器的安全。

在宣传策略上,用户可以免费体验一段时间神策数据的服务,如果觉得不错,便可以购买。桑文锋每天都会看用户使用神策数据的一些数据分析,比如哪个地方的客户访问量比较多,留存率比较多,那么下一阶段就是针对这些重点客户进行销售了。

猜你喜欢
数据源服务器百度
2018年全球服务器市场将保持温和增长
图表中的交互 数据钻取还能这么用
百度年度热搜榜
不懂就百度
基于Excel的照片查询系统开发与应用
再谈利用邮件合并功能批量生成准考证
百度年度人气萌娃
数据有增加 图表自适应
万有的百度
用独立服务器的站长注意了