陈翔
作为我工作的一部分,我努力想找到一种将益处和挑战充分联系起来的技术和商业模式,并不断尝试用新的方法来寻找其中更有效的一种。
此前我访问一个客户,他们的存储架构师介绍了他们业务数据、存储的增长与Doeswijk数据模型。他说,现在有三个方面的数据增长,必须同时得到关注。首先,主要造成数据增长应用的人员在竭尽所能地创造数据;其次,存储管理员还需要为快速增长的文件副本等重复数据担心;第三,需要保留的数据所构成的静态数据存档。主要数据需要对许多应用提供副本,如备份、开发测试、数据挖掘等。在一段时间内,大多数主要数据开始变得陈旧和无用,但依然需要保留存档备份,至少需要保留一个副本以供数据恢复使用。在不同的情况下,数据可以放在不同的成本和性能等级的存储介质中。
思考数据的这些状况很重要,因为它有助于我们理解为什么我们总是缺少足够的存储空间。许多应用程序用户只是在计划生产阶段的数据,对保存、分析和共享他们的数据会带来多少份数据副本毫无概念。他们大多不关心数据生产过程结束后会发生什么,因为他们将迎来一个新的应用,而其他人才会为保留或删除这些数据而操心。在这些数据上进行修改将会带来一个乘数效应的总数据量。例如:如果表示数据总量的立方体尺寸是2 × 2×2 ,其体积将是8 ;如果我们将一个边的长度改成3,则3 × 2×2得出的数据总量是12 。
数据保留在存储空间内,存储空间的容量可以看作一个能容纳固定数量数据的立方体。这个立方体的体积所能提供的存储容量与各个方面的数据量相关。在某些情况下,它还和分层存储的方式以及其中涉及到相应的数据层面有关。通常的存储容量体积大于数据量,但随着新技术如重复数据删除、压缩等的发展,存储容量可能小于数据量。
通过这一模型,我们可以看出,一般情况下,存储容量只是刚刚满足数据量的要求。然而,数据量在三个方向上都可能发生改变从而带来乘数效应的增长,这就会使数据量立方体的体积超出原有的存储容量立方体,造成存储容量的不足。
Maartin Doeswijk是一位年轻的荷兰存储架构师,他首先提出了这一模式。 我建议将该模型命名为Doeswijk数据模型。同时,我将把该模型应用在我的工作中。
解读Doeswijk数据模型
日立数据存储公司CTOHu Yoshida
CTO博客
超前于其他专业IT企业,最早以卖书著称的电子商务网站——亚马逊居然是最早提出云计算概念的厂商,也是最早提供成熟云计算服务的供应商。对于为何亚马逊会比专业的IT企业在云计算方面还要超前的问题,亚马逊云计算部门负责人Jeff Barr(杰夫)认为,这非常容易理解。
亚马逊的生意经
作为一家超大型零售企业,亚马逊在设计和规划自身电子商务系统IT架构的时候,不得不为了应对销售峰值去购买更多的IT设备。但是,这些设备平时却处于空闲状态,这在零售企业看来相当不划算。于是亚马逊发现,假如可以运用自身在网站优化上的技术和经验优势,亚马逊就可以将这些设备、技术和经验作为一种打包产品去为其他企业提供服务,那么闲置的IT设备就会创造价值。这就是亚马逊推出云计算服务的初衷。
为了解决这些租用服务中的可靠性、灵活性、安全性等问题,亚马逊不断优化其技术。从2004年开始,亚马逊陆续推出了简单队列服务、Mechanical Turk等云计算服务雏形。Jeff Barr表示,云计算服务成熟的标志是亚马逊在2006年推出的简单存储服务(S3)和弹性计算云(EC2)。之后,企业数据和服务都已被放在亚马逊的“云端”了。那么“云端”到底在哪里呢?其实就是亚马逊分布在全球的服务器——这些服务器可以在瞬间共同完成租用企业的一个任务。
纷繁复杂的云计算
亚马逊在云计算方面走在其他IT专业企业之前既是偶然,也是必然。看似有些“无心插柳”,但任何技术都源于需求——亚马逊自身就是云计算的最早用户。如今,云计算的概念已经在业界成为热门话题,云存储、云安全等名词也开始出现,IBM、微软、Google等不同领域的企业都已经纷纷投入到这一新型计算技术的大潮之中。那么亚马逊的优势还存在吗?
Jeff Barr认为,这里涉及一个核心概念——云计算是分层分类的,每一类公司提供的云计算的服务都不一样,而亚马逊是IT基础架构云计算服务提供商。在网络互联的需求之上,直接就是亚马逊的最底层的IT基础架构AWS(Amazon Web Services),这包括计算、存储、内容分发等等。在这层IT基础架构之上,用户才可以构建自己的应用层。应用层又包括构建数据库、应用服务器,最上一层才是应用软件。他表示,目前看来,市场上很多云计算服务提供商所提供的服务,仅仅是不同层面的一部分解决方案。
此外,亚马逊的角色非常特殊——它不是操作系统开发商,也不是服务器或存储设备制造商,也就是说它是应用者而非IT系统制定者。因此亚马逊的平台是开放的。但是专业IT企业提供的云计算多多少少会限制在自己提供的系统之上,限制了灵活性。此外,正因为亚马逊自己是应用者,因此它卖给企业用户的不仅是云计算技术,还有自身的经验教训,这些都能够帮助企业用户更好地应用云计算服务去创造更大的价值。
云计算如卖书
正是因为这些独特的优势,亚马逊云计算服务增长显著。虽然Jeff Barr没有透露投入和收入,但是目前亚马逊云计算的注册开发人员数量在去年已经超过49万。它目前推出的最主要的云计算服务产品,不仅服务分类灵活、收费方式多样,而且定价方式还体现了零售企业一贯的做法。
据悉,弹性云EC2服务能够同时调用亚马逊全球的从一个到几千个服务器,这些服务还可细分为CPU处理系统、随机存储容量、硬盘空间等,根据用户的需求或者规格可以支持所有的操作系统,并安装各种各样的开放源代码或商业软件。用户甚至可以直观地看到支持某种操作时调用的全球服务器的物理地址。而EC2的报价也因此呈现多样化,租用费用从每小时0.1美元到0.8美元不等。
简单存储服务S3可以提供一个字节到数GB字节的支持,整个系统里大概有520亿对象进行数据交换。S3的存储备份服务则是按照每个月的使用字节来收费,根据每天检测流量,每GB大约0.15美元/月。亚马逊最近还推出了内容分发网络服务(CloudFront),可以把一个内容迅速地复制到全球至少40个服务器上,以便快速地登录和获取。为了体现地域的特色,亚马逊针对欧洲用户的售价会比美国高出10%左右。
更有意思的是,亚马逊还尝试了云计算的价格促销。Jeff Barr表示,亚马逊云计算价格体系的设置是自下而上的,也就是说亚马逊并不是通过关注市场上的竞争产品或用户承受程度来确定产品价格,而是根据自身的成本核算加上合理的利润空间后将价格尽量定到最低,因此定价也富有竞争力。“这也源于亚马逊的经营理念。作为零售企业,亚马逊有一个天天低价的承诺,我们每天想的是怎么样能够把价格降下来。在云计算方面,我们也采用这种价格体系策略。”
此外,目前云计算的服务对象多是中小企业,亚马逊也在尝试将其应用到政府、科研等研究领域和大型企业的关键应用当中——亚马逊推出了针对大型数据库的简单数据库服务,该服务在安全性、登录管理、账户管理方面都有独特的设置方式。尤其在账户管理方面,不仅有整体的账户,还会有分账户的复杂管理。该服务将按照字节单独计费。值得一提的是,美国某些地方的个税系统已经开始应用云计算架构,也许让云架构涉及核心应用已经为时不远。
云计算——这一代表未来计算发展方向的技术,居然是由电子商务企业亚马逊首先推出的。为何亚马逊会比专业的IT企业还要超前?这家企业在云计算方面又出了什么新招?亚马逊云计算部门负责人Jeff Barr近日透露了亚马逊的秘诀。