程梦瑶
在成功登陆纳斯达克市场5年后的今天,Splunk持续以“跑赢大盘”的评级在资本市场获得瞩目。作为全球第一家大数据上市企业,Splunk正朝着大数据软件解决方案提供商的目标定位不断迈进。
作为全球第一家大数据上市企业,近年来,Splunk在综合日志分析工具型软件产品方面的优势依然显著,而针对云和Hadoop技术的分析平台在行业场景化应用中的表现也可圈可点,正朝着大数据软件解决方案提供商的目标定位不断迈进。
Splunk的核心产品主要包括Splunk Enterprise、Splunk Cloud、Splunk Light,这些产品的共同特性在于快速处理大量数据,并通过可视化呈现最终结果,为使用者提供决策分析的依据。那么,这与传统的BI软件又有何差异呢?尽管对于结构化数据和非结构化数据的处理难度,大家都是有所耳闻,也有不少公司表示具备处理非结构化处理的能力,但实际上,目前市场上真正具备快速处理海量数据能力的公司也不过是凤毛麟角。
谈及Splunk在数据处理能力上与传统BI软件厂商之间差异性,从数据类型、客户群体、解决需求三方面即可做出区分。传统BI软件厂商主要处理数据库中各类业务数据,通常是结构化数据,并以图表方式呈现给业务部门作决策参考,如Tableau。而Splunk则是基于非结构化数据的实时分析,比如日志分析,并提供一系列App帮助用户做数据导入,针对数据的ETL(将数据从来源端经过抽取extract、转换transform、加载load至目的端),使用者多为IT运维人员。从某种程度上说,Splunk更像是提供一个数据搜索的引擎,其更强大的能力主要体现在机器数据的快速分析能力上。
从机器数据到运维智能
这些机器数据隐藏于金融科技、工业4.0、平台经济、DevOps、云端、物联网等各领域,包含数据库数据、安全设备数据、服务器数据、点击流,以及全球定位系统IVR射频识别数据。通过对机器数据的搜索和分析,实时获取运营情报,而后为企业提供安全事故的调查和预测能力、威胁检测能力、内部威胁感知和实时监控能力。
“我们所有的互动都会被传感器所捕捉,跟周边的环境进行数据传递。如何在这样一个互动的世界当中去捕捉数据流,又如何从数据当中去挖掘价值,获取深度的分析?”Splunk公司总裁兼首席执行官 Doug Merritt认为,作为消费者对数据环境的感受已经能够有非常直观的体验,而对于有数字化转型需求的客户而言,从数据当中提取他们希望获得的重点信息,才是关键所在。
在伦敦盖特威克机场,95%的乘客在5分钟或更短时间内通过安检。借助Splunk公司的底层技术支持,盖特威克机场开发了移动App,通过对乘客的航班信息、飞机流量、天气状况、地面道路交通及乘客个人数据进行分析,机场可以将乘客的出行时间提前规划好,并告知乘客,使乘客做到准时登机,并避免误机或在机场徒劳地等待,这大大提高了客户的出行效率。这样的大数据应用场景,在Doug Merritt看来,在Splunk 的客户案例里还有很多。
比如,在印度尼西亚,7-Eleven需要提供比当地非常受欢迎的休闲咖啡馆/商店“Warung”更好的服务,而且考虑到印尼人民的可支配收入在不断增加,应满足他们对“消费得起的奢侈品”的需求。7-Eleven最初的业务分析系统是围绕预定义的模板构建的,销售点数据分析功能有限,并且无法生成用于合理决策的实时深度分析结果。典型的数据处理周期涉及对分散系统生成的销售报告进行多轮次人工分析,这通常需要三到六个工作日才能完成。因此,计划一次促销活动大概需要三个月的时间,严重阻碍了营销工作。
部署Splunk Enterprise之后,印尼7-Eleven能够动态组织其数据资产,全面掌握所有内部数据的概况,并从多个角度分析每个销售点的业绩。该系统还可以从外部来源提取数据,使其与销售点数据相关联,对业务进行更加深入的分析。例如,通过与雅虎天气相集成,7-Eleven可以参考天气预报,准确地预测不同产品的市场需求。在Splunk平台高度自动化和直观的界面中,7-Eleven系统管理员只需几分钟的时间就能够通过触发下拉菜单中的功能生成所有数据的全面视图。
为了促进其营销,7-Eleven每季度推出五项新的促销活动,包括咖啡和面包的优惠券,以及手机服务套餐等。据Splunk平台生成的运营深度分析结果,只需两周的时间就可以准备好启动新活动—与以前的系统相比时间缩短了80%。机器生成的数据是大数据中增长最为迅速和复杂的领域之一。不论何种业务,Splunk都可以将机器数据转化为有价值的洞见,这便是“运维智能”。
“无需建模” 每个人都可取可用
在Splunk平台上,拥有丰富的应用程序和附加组件生态系统,覆盖14000家以上的客户以及超过1300的应用程序。这家总部位于美国旧金山的公司,在全球已经拥有超过2700名员工。
“我们是一个大数据的软件解决方案提供方,既包括云端部署也有本地部署,现在在平台上的解决方案的数量不断上升,目的还是帮助用户解决他们的具体问题。”Doug Merritt对目前Splunk的定位作出了阐释。
Splunk的解决方案主要覆盖五方面:基础架构和IT运维、应用交付、安全与合规、业务分析、物联网和行业数据。针对全球110个国家1.3万名客户,Splunk致力于通过软件提升服务水平,减少运营成本,降低安全风险,实现合规性,加强DevOps协作。通过Splunk解决方案,客户可以打破傳统数据竖井,实现运维智能新高度,将数据的价值转化为业务用户的深刻洞见。
“信息的价值出现了两个越来越集中的趋势,一个是灵活的架构,可以让我们提出各种各样的问题,可以向数据源提出各种各样的问题,这个数据衍生出来的架构能够回答这些问题。另外一个,就是要结合机器学习和人之间的互动,将数据当中提取出来的深度分析做进一步的扩展。首先我们通过机器学习的算法来甄别异常之处,通过人来判断这个异常是否真实,如果它存在潜在威胁,我们再去做深度挖掘,去找到它的根本原因。”Doug Merritt谈到。
Splunk是为非结构数据而生,曾被评为大数据里面的谷歌。通常来讲,Splunk提供的是一个数据分析平台,它可以收集数据、实现数据的实时分析,并提供灵活有效的搜索。Splunk提供了专业的数据存储和处理方式,通过检索手段,用户就可以对数据之间的关联性进行挖掘和探索。在此基础上,用户不需要建模,也不需要关心MapReduce原理,让用户直接上手查找数据,发觉数据背后所蕴藏的价值。
这种“无需建模”的特性最终可以实现人人可用,但这并不意味着放弃建模,而是改变传统大数据分析先建模再导入数据的方式。Splunk认为,传统的大数据分析都是先建模,先建模的问题就是,由于早期认知是有限的,如果早期建模,等于把很多有用的数据和信息先淘汰掉。传统的大数据建模就好比制作一个Excel表格,你们先要定制,要收集什么数据,每一列要什么数据都要事先设定好。但是Splunk的做法是,不要事先设定这个表格,而是先收集原始数据,要想什么东西,在做表格的时候随时可以做。
Splunk在中国
在中国,日志分析市场起步较晚,很多公司都是2014年之后成立的,但资本市场却是十分看好,比如日志易在2015年完成6000万元的A轮融资,HanSight瀚思在2016年完成3000万元的A轮融资。
据透露,在Splunk庞大的客户群中,目前大致有30多家中国客户,而这个数量还在不断增长中。
Splunk公司亚太区副总裁梅正宇谈到,目前在中国最受欢迎的核心产品是Splunk Enterprise。该产品可以实现:收集来自任何来源的日志以及机器数据,并为其建立索引;强有力的搜索、分析和可视化能力可以为各种类型的用户提供支持;应用为信息安全、IT运营、业务分析等方面提供解决方案;可以查看本地、云和混合环境;提供适合任意组织的扩展、信息安全以及可用性;作为软件或者SaaS解决方案提供。
除了用于运维监测外,Splunk在大数据安全市场同样广受好评。安全、IT运维、APM(应用性能管理)是中国用户采用最多的Splunk的产品。Splunk还尝试在中国开拓物联网方面的应用,目前还处于起步阶段。endprint