LSI:大数据“芯”时代

2014-01-20 18:24赵艳秋
IT经理世界 2014年1期
关键词:巨头开源厂商

赵艳秋

“我们是大数据时代的英特尔。”LSI亚太区渠道事业部总经理李东胜在拜访客户时,会对客户的CEO和业务部门这样介绍自己的企业。在大多数企业CEO眼中,LSI比起那些广为人知的IT企业来说是相当陌生的。这是一家在1981年就在硅谷成立的老牌半导体企业,成立时间比今天移动互联时代的芯片巨头高通还早3年。

“对于每个时代来说,都会有一个代表性的芯片公司。”李东胜说,“像PC时代的英特尔,移动互联时代的高通。而在大数据时代,从数据传输、数据存储到数据保护和数据加速分析,都有LSI的身影。”因此,当我们在亚马逊、淘宝上购物、在微信上聊天、在百度上搜索时,我们都在使用LSI的技术。

作为一家老牌芯片企业,LSI曾经经历过硅谷的辉煌时刻,也曾因为过度扩张等策略失误而惨淡经营了一段时间。在过去8年中,因为预测到了即将到来的大数据时代,公司管理层把资源赌注在了大数据相关芯片业务上,并在8到10个市场上取得了前两名的成绩。过去3年,LSI的年复合增长率达到了17%,高于业界平均水平。

互联网企业的速度

LSI公司的高层最近几年要花很多时间与互联网公司在一起。“中美两国互联网巨头的最大不同是速度。” LSI公司执行副总裁兼首席运营官Jeff Richardson边思考边说,“中国企业在极短时间内就开发出数据中心领域非常先进的技术,我在IT行业25年了,从来没有见过这么快的速度。”

赞叹之外,作为一家半导体企业,LSI的高层为什么要频繁拜访互联网企业呢?这可能要从IT产业的变局说起。

云计算、移动互联和大数据正迫使IT生态链发生翻天覆地的变化。LSI所在的数据中心市场,过去每一代产品的更迭需要3到5年,而现在差不多每6个月就要升级一次,这大幅增加了硬件企业的难度。以前,LSI与戴尔、IBM、思科、诺基亚、西门子等OEM企业合作,但现在有时如果等待OEM企业,已经跟不上最终客户——那些互联网巨头的速度了。于是,LSI需要从后台冲到台前。

Jeff说:“随着IT模式的转型,这些传统老牌IT设备供应商们必须要做到两件事。第一件事是在它们传统本业上持续不断地进行创新,就是让它们的传统买家能够更容易来购买它们的IT设备。与此同时,它们也必须交付新的服务,来适应拥有大规模数据中心的这些公司的需求。当然,它们都在进行这种改变。对于LSI来说,这意味着必须要改变原有的一些运营方式,我们现在必须聚焦于更多的客户,除了传统的OEM厂商之外,我们也需要关注大规模数据中心或者基于云的解决方案等等。”

大约在两年前, LSI公司企业战略部和CTO办公室高级专家Robert Ober 通过销售渠道或者OEM企业,首次拜访了互联网企业。“最早与这些企业的架构师面对面地交流,然后逐步地建立起了对话。” Robert 回忆说。

Robert感到这些互联网巨头具有超强实力。此前,一些OEM厂商和ISV(独立软件开发商)占据着全球大部分数据中心市场,但互联网巨头改变了这一格局。为了低成本、高效地满足自身业务发展速度,这些互联网巨头能自行设计架构,制定相关规范甚至还能自己独立构建,谷歌、Facebook都是这么做的。

Robert他们看到,虽然OEM厂商仍发挥着重要作用,但现在出现了更多的新参与者。“组件”或“子系统厂商” 因为能够推出一些创新的、独树一帜的方案而受到互联网公司的青睐,从而有更多机会赢得超大规模数据中心的“设计合同”。越来越多的互联网巨头提出自己的规范,让广达电脑(Quanta)这样的设计厂商来为它们定制产品。Arista等新型网络供应商,因为采用了新架构和新理念设计出低延时的网络,也在与思科的竞争中逐步增加了自己的市场份额。Nebula等一些新型超大规模解决方案厂商不断涌现,他们转向采用开源软件。开源软件是那些源码可以被公众使用,而且使用、修改和分发不受限制的软件。这可能会对OEM厂商和独立软件开发商的业务模式和市场带来重大的消极影响,同时也会有更多新的竞争对手加入市场,包括Quanta、Tyan、Foxconn、Wistron等都通过开源计划提升自己的市场竞争力。一批新兴开源软件企业也冒了出来,Cloudera、Mirantis、Unitedstack等创业公司效仿老牌开源企业红帽,通过对开源软件的支持服务来收费。

英特尔和LSI等芯片提供商也跳到台前,它们与超大规模数据中心架构师建立了合作伙伴关系,探讨新架构和新算法。此前,这些架构和算法主要由OEM厂商提供。2010年,Facebook等互联网企业正在寻找能够让用户体验更佳的新架构和新设计。于是,LSI与Facebook等互联网企业尝试着创造一种闪存卡和一种新架构——X86服务器+闪存卡。如今,人们习以为常的许多互联网应用如果离开了这种闪存产品就难以为继了。

Robert在2013年12月再次来华造访了腾讯和百度。他此行的目的是与这些互联网巨头探讨冷存储的解决方案。互联网公司大都面临一个问题:用户每天要上传数亿张图片、视频、资料,但其中很多资料在几周后几乎就无人问津了。可根据用户协议,互联网公司也不能把它们删除。于是,它们每年要耗费大量金钱存储和管理这些资料。像腾讯,一年在这种服务器上的花费就在上亿元。由此,互联网巨头们正在创建新架构,希望以越来越低的成本来保存这些“冷数据”,同时还能保证这些海量数据的访问速度。Robert就是来与互联网巨头探讨一种新架构的。他透露其中最重要的是一种分布式DAS技术。现在,中国互联网巨头和美国同行一样,都走在超大规模数据中心领域的最前沿。

数据中心的技术漩涡

2009年,Robert接到了公司的一项任务——负责执行LSI首个“大规模数据中心”合作计划。从那时开始,Robert经历了互联网巨头建立超大规模数据中心的风潮,并进入了这个风潮的中心漩涡。Robert看到,自动化技术、可靠性上的新方法以及大数据将对未来超大规模数据中心的演进有着深远的影响。

一位微软的架构师曾对Robert说:“要是我们按正常企业方式聘用数据中心管理员,那可能雇下全球所有IT管理员甚至还不够。”现在,超大规模数据中心动辄数十万台服务器,如果不开发自动化、自我管理甚至自我部署的数据中心设施设备,是没有办法构建和运维的。“现在,这种认识正在不断蔓延,渗透到整个IT产业。”Robert说。现在,越来越多的互联网巨头采用开源软件来开发数据中心的自动化技术。开源软件OpenStack的蹿升就是一个很好的例子。OpenStack是由美国国家航空航天局和Rackspace合作研发的软件,它能实现大规模数据中心所需的自动化控制、高效和成本结构。

除了自动化技术,Robert还观察到,超大规模数据中心和传统数据中心在可靠性的理解上有根本不同,这甚至改变了IT产业的格局。此前,传统企业和传统的数据中心看重每台硬件设备的可靠性。CIO们在采购设备前,很关注这些硬件设备上有关可靠性的参数,例如单台服务器要达到99.999%的高可靠性。现在,超大规模数据中心里的设备成千上万,如果还按照原来的观念,“可靠性”就意味着天文数字的投资。于是,业界产生了更加务实的理念——单个设备的成本和复杂性降低了,可靠性也大幅下降,但要通过解决方案,实现整个大规模数据中心的可靠性。曾经有一个数字,也许在两万台X86服务器中,每天大约就有110台机器会出现宕机这样的恶劣情况,不过软件解决方案和容错机制仍能确保整个系统的可靠性。

在这种情况下,过去对硬件设备可靠性的依赖已经转向软件技术。“谷歌和Facebook这些互联网巨头之所以能够快速腾飞,很大原因在于它们通过软件能力来支撑整个业务。”不久前,华为IT云计算产品线总裁任志鹏曾分析说,“谷歌和Facebook把所有能力大都聚焦在软件平台上。”这也是华为这家传统设备企业目前加重软件研发投入和力量的原因。在这一潮流下,过去可靠性很高但售价昂贵的小型机和存储设备在市场上的影响力越来越弱,相应的,这个市场上的代表厂商受到了冲击,而低成本的标准架构硬件+开源软件成为潮流。

不过,这种“允许某个设备和组件出现故障,同时又要确保整体可靠性”的方法也存在效率问题。Robert他们目前的重点工作之一就是与超大规模数据中心和OEM厂商一起来研究如何提高这种架构下的效率。

此外,大数据无疑是现在最热的风潮。“大数据这个词现在有点被滥用,你很难相信这个词几年前几乎还不存在。”Robert说。不过,Robert看到,大数据分析开源技术Hadoop正推动世界快速变革。Hadoop及其相关衍生产品已经无处不在,在搜索、广告、油气、制药和基因组学研究等领域发挥作用,而且它还让研究领域发生了突破性变革,它能通过数据分析得出关系和模式,而不是通过理论去推导。“整体说来,我认为Hadoop是最重要的技术。” Robert说,“也由于大数据,使得存储成为数据中心的最重要力量。我们的存储技术在这一发展演进过程中发挥着核心作用。” Robert预测,下一步业界将大范围推广图形分析功能。

“下一代数据中心,无论在软硬件还是在机械工程设计上,都有着大量的变革,并对业界产生深远影响。” Robert说。当然,影响现在也开始向传统产业渗透。

传统企业与互联网技术

“我们打动中国企业的办法就是帮助它们降低成本。”LSI首席执行官Abhi Talwalkar说。

2013年“双十一”,北京邮政这家传统企业尝到了互联网技术带来的锋芒。电商的繁荣让快递业爆发增长,北京邮政正在新建一套快递系统——把分布在全国各地的数据汇总到总部,放入一个大数据库中。这套系统要让各地用户能实时查询包裹情况,也能给领导的决策提供数据支持。

过去,北京邮政采用的是传统的小型机架构,但在数据量变得巨大之后,各地数据汇总放入数据库的过程往往要耗费几个小时;用户要想查询某个包裹的位置,通常要等待将近一分钟,这是很难想象的。

“要改变这种现状,要么购买更多的小型机,要么使用新时代的方案。”LSI亚太区渠道事业部总经理李东胜说。要是采用传统小型机,采购成本至少几百万元,折旧周期可能要五六年,用户在这五六年中基本被这个臃肿的机器拖着走。如果采用Facebook等互联网企业已经验证的新架构方案——“X86服务器+闪存卡”模式,折旧周期只需要两年,系统建设和维护也很简单。而且,如果北京邮政的业务快速发展,系统还可以快速迭代上去,这种迭代能力远远超过传统架构。

北京邮政最终选择走互联网企业实践过的新路。系统改造后,用户体验大大提升。例如,现在用户查询包裹的等候时间只有1毫秒,几乎感觉不到。

李东胜他们也刚刚和一家中国本地的虚拟桌面企业——云巅(上海)网络科技有限公司结成战略合作伙伴关系,将这种新架构集成到云端的虚拟桌面解决方案中,从而参与到中国企业的虚拟化浪潮中。

利用这个来自互联网企业的新架构,李东胜团队还帮助一家中国企业实现了Hadoop大数据分析系统。客户原本需要1000台服务器,现在只需要640台。采购、运维、机架空间和功耗,让这家企业在未来3年中节省了5000万元。

“中国企业在未来5到7年中在大数据方面将会超越美国,因为中国企业有巨大的规模,像阿里巴巴一年的交易额就有1700多亿美元,超越了eBay+亚马逊的总和。”LSI首席执行官Abhi Talwalkar说,“不过,现在中国很多企业还处于大数据时代的早期,很多企业还不知道怎么收集数据,怎么让数据产生价值,未来LSI和业界伙伴要做的工作还很多。”

2013年12 17日,路透社刊登《亮丽数据及并购带动美股收高》文章。文章提及就在前一天,美国半导体厂商Avago将以66亿美元的现金收购LSI,这成为推动美股上扬的重要事件之一。两家公司发布的新闻称,合并后,公司将能进一步促进数据中心创新。Avago是苹果手机等移动互联设备的供应商。有分析认为,两家公司的合并将构筑从数据采集、传输、存储、保护、分析等一整套完整的数据价值链;也有分析认为,两家公司的业务规模相当,如何整合是一道门槛。

“Avago+LSI”能成为大数据新时代的英特尔吗?这还要请人们拭目以待。

猜你喜欢
巨头开源厂商
海里的巨头蝌蚪
猪价再降下去 巨头也挺不住了?
玩具厂商及合作机构新年进步
五毛钱能买多少头牛
厂商对北京卡车市场不抱希望
石化巨头35年成长记
考虑产能约束的耐用品厂商易耗部件兼容策略
大家说:开源、人工智能及创新
开源中国开源世界高峰论坛圆桌会议纵论开源与互联网+创新2.0
又一个百货巨头倒下了!