郭涛
作为一家以处理机器大数据见长的公司,Splunk追求的最终目标是让大数据可取可用,发挥其最大的价值。Splunk正在努力打造一个大数据生态。
如果让你拥有超凡的大数据能力,你最想改变的是什么?我猜想,在暑期这个旅游高峰,可能很多人都希望飞机不要再延误。英国的盖特威克(Gatwick)机场借助大数据公司Splunk提供的底层技术支持,给人们的外出带来了一种全新的体验。旅客出门前会收到机场发出的提醒,给出建议的出门时间或航班延误通知;95%的旅客可以在5分钟之内完成安检;行李车上装有传感器,可以让旅客在第一时间拿到自己的行李……
除了盖特威克机场,丹佛机场、迪拜机场等也因为应用大数据技术从而提升了人们出行的效率,大数据的应用也从局部扩展到机场服务的方方面面,包括天气预报、航班准点查询、安全检查、行李提取、机场周边交通状况等。这样的应用体验也是Splunk追求的最终目标,就是让大数据可取可用,发挥其最大的价值。
不会被超越
大数据这个概念是由著名咨询公司麦肯锡率先提出的。大约从2010年开始,大数据形成了一股热潮,席卷世界各地。创立于2003年的Splunk作为一家“现象级”的大数据公司,于2012年4月成功登陆纳斯达克,成为全球首家上市的大数据公司。Splunk的上市在当时引起了巨大轰动,大数据的商业价值逐渐显露,也吸引了众多后来者蜂拥而至。大数据因来源不同分成很多种,比如商业大数据、社交大数据等,而Splunk的拿手好戏则是机器大数据的处理,比如各种设备的日志数据、传感器数据等。
从上市到现在,5年过去了,全球大数据市场已今非昔比,大数据已经被公认为是实现数字化深刻洞见的基本工具,而Splunk又发生了怎样的变化呢?“我们仍然是一家大数据软件解决方案提供商,只不过平台解决方案的种类越来越多,既可以在本地部署,也可以在云端部署。”Splunk公司总裁兼首席执行官Doug Merritt(道格·梅里特)话峰一转,“从2012年上市之后,公司的发展速度加快了。上市之前,公司的年收入大约为1.5亿美元,员工人数不足500人。但是去年,公司的年收入已经达到9.5亿美元,员工增长到2800人左右。”
上市后的Splunk成了众多公司模仿的对象,包括技术、商业模式等。对此,道格·梅里特倒并不担心:“没有一家公司能够做到我们所做的一切,他们只是在做其中一部分业务。另外,我们的技术能力与积累也是其他公司不能模仿的。比如,我们的产品无需‘建模即可完成调查和分析。另外,我们十分重视生态体系的构建,这其中既包括合作伙伴,也包括用户。商业的成功没有合作伙伴的支持是不可能实现的,而客户的需求则是我们前进的驱动力。在我们的生态体系中已经有1500多个方案。未来,我们会继续在自己核心的技术领域进行大量投入。”
大数据意味着什么?大数据代表一种智慧,可以让IT产品迈向智能化。大数据安全就是将大数据的处理和分析能力应用于安全防御的一个新兴领域。大数据将成为下一代智能安全不可或缺的一个因子。因为具有出众的大数据分析能力,以及在机器数据方面的先天优势,Splunk也被视为大数据安全领域的一个代表,成为国内一些初创的大数据安全企业学习的对象。
当前,Splunk的业务线众多,主要包括IT运营、应用程序性能分析、安全和合规、业务分析、物联网等。“我们在安全方面的投入非常大,目前安全业务的收入已占公司总收入的40%左右。”道格·梅里特自豪地说:“安全是一切数据活动的基础。在安全和合规方面,我们积累了大量数据和经验,可以为用户业务的方方面面提供帮助和支持。”
Splunk的一个独特之处在于,它采集到的數据不仅可以用于安全,而且还可以应用于改善企业的业务应用、提升开发效率、提供完整性体验等很多方面。就像一句广告语所说:“一直被模仿,从未被超越。”Splunk的业务覆盖更全面,包括业务监控、日志管理甚至物联网,而其他厂商只能做到其中一部分而已。
“无需建模”
最让道格·梅里特津津乐道的是Splunk的技术独特性,比如无需建模即可以实现调查的功能。这也被认为是Splunk难以被模仿的关键一点。
通常来讲,大数据需要算法和建模相结合。其实,Splunk所说的无需建模,并不是舍弃了建模这一步,而是把其他人通常放在第一步要做的事情推后了。传统的大数据分析是先建模,再导入数据,然后进行其他处理。Splunk认为,先建模的做法,既耗费功夫,又容易导致之后的分析结果出错。因为在还不了解需要解决的问题是什么之前就先建模,可能在之后导入数据时,将一些有用的数据屏蔽了,所以有可能导致分析结果出错。
使用过Splunk产品的用户有这样的感受,传统的先建模的方式,就像是先设定好一个Excel的内容,然后再根据Excel的要求导入数据,而Splunk的方式是先将所有原始数据采集起来,然后再输入Excel,这样可以保证所有有效数据被用于分析。两种做法可能会导致不同的结果。Splunk的方式保证了分析结果的准确性,数据的价值可以得到更充分的发挥。
用户不必担心,先收集所有数据会给企业的存储容量带来压力。因为Splunk提供了优化的存储设计,采用了数据压缩、分层等技术,可以将数据存储量压缩至实际容量的三分之一。实践证明,Splunk的产品受到了广泛欢迎,全球知名的托管云服务商Rackspace、中国领先的互联网金融平台快钱公司等都通过采用Splunk的产品改善了管理,保证业务的高效、安全运营。
打造一个中国的生态
与其他跨国企业一样,中国也是Splunk十分看重的一个市场。在2012年上市前,Splunk在全球范围内已经拥有3700家客户,其中就包括30家来自中国的企业。这30家企业也成了Splunk在中国快速发展的“星星之火”。
据Splunk公司亚太区副总裁梅正宇介绍,公司重要的产品线在中国都有落地,其中最受欢迎的核心产品是Splunk Enterprise。它是一个运维智能平台,通過使用预定义规则或通过专门搜索,深入了解数据,驱动安全分析,以及对现代威胁进行持续监控。安全、IT运维、APM(应用性能管理)是中国用户采用最多的Splunk的产品。Splunk还尝试在中国开拓物联网方面的应用,目前还处于起步阶段。
文章开头已经提到,Splunk的大数据产品已经广泛应用于全球各地的机场。中国也有一个机场采用了Splunk的产品和服务,主要用于安全和日常运维。Splunk深入了解并与用户沟通的方式是举办“黑客松”这样的培训活动,通过面对面的交流,让用户对自己的数据有更深入和全面的认知,并将数据充分利用起来。其实,很多用户已经积累了大量的数据,存储在Excel文件或数据库中。Splunk给用户的建议是,将这些不同来源的数据整合在一起,放到一个平台上,就可以用于某一特定用途的分析。比如,机场可以将这些数据用于分析周边交通拥堵情况,或者缩短行李提取的时间等。
Splunk的重要作用是,为用户提供一个汇集和处理数据的平台,让业务人员发挥自己的创意,利用平台上的数据解决自己实际业务中的问题。这样的方式可以在机场以外的更多行业和领域进行复制,比如金融、制造等。
为满足不同用户的需要,Splunk的产品既可以在本地进行部署,也可以用于云端。“中国的企业客户更倾向于在本地进行部署。也有一些在中国的跨国企业采用了云端部署和应用方式。”梅正宇介绍说,“我们希望在中国推动云应用模式,目前正在计划之中。”在云服务方面,Splunk已经与AWS实现了合作,其软件许可证可以在AWS公有云中进行管理。
梅正宇向记者表示,Splunk提供的是一个平台,它在中国的发展离不开各类合作伙伴的支持。除了发展传统的销售渠道以外,Splunk正在加强与OEM伙伴的合作:一方面,在一些特定的产品应用领域寻找OEM伙伴,比如安全网关、应用性能管理、虚拟化数据中心的自动化管理等,上个季度Splunk刚刚与3个此类合作伙伴签约。另一方面,在一些重点拓展的垂直行业寻找OEM合作伙伴,比如交通、医疗、制造等行业。
当前在中国,人工智能是最热的话题。大数据与人工智能是不可能分割开单独存在的。Splunk已经完成了多个与机器学习相关的公司的收购,并且早在两年前便推出了机器学习工具包。道格·梅里特表示,大数据和人工智能对于Splunk来说至关重要,未来也会齐头并进。