贾生宁
数据分级存储是指将数据存放在不同级别的存储设备(磁盘阵列、磁带库、光盘库)中,并通过分级存储管理软件实现数据在存储设备之间的自动迁移。用户可以根据数据的访问频率、保留时间、容量、性能要求等因素确定最佳存储策略。
数据分级存储的工作原理是基于信息生命周期管理(ILM),通过将不经常访问的数据自动迁移到存储层次中较低的层次,从而释放高成本、高能耗的存储空间给更频繁访问的数据,这样可以获得更好的性价比。
另外,通过将访问频率较低的数据备份到离线的存储介质(如磁带)中,可以更有效地利用有限的资源,显著降低维护这些数据带来的开销,同时又可以满足相关法规的规定。
通常情况下,多级存储系统可分为三个层次,即在线存储、近线存储和离线存储。
提高资源使用率
将使用率低的数据迁移到功耗低的设备上,尤其是将数据迁移到大容量的离线设备上,可以释放这部分数据占用的系统资源,提高资源使用率,减少相关存储设备的数量,从而有效减少存储设备的电力需求,保证重要在线业务的能源需要,同时减少降噪、冷却带来的额外能源开销。
采用不同存储设备
在线存储、近线存储和离线存储对系统的性能要求各不相同。
在线存储对性能要求较高,可以采用高速的磁盘设备。但采用高速磁盘作为在线存储设备时,其能耗要高于低速的磁盘设备(如SATA磁盘等)。比如,FC磁盘正常工作时的功耗为27.73W,但大容量的SATA磁盘正常工作时的功耗仅为12.8W。如果保存100TB的数据,需要的FC磁盘与SATA磁盘的数量分别为334个(以每个FC磁盘容量300GB计算)和100个(以每个SATA磁盘容量1TB计算)。为保证这些磁盘的运行,FC磁盘与SATA磁盘的电力需求分别为9262W和1280W(不包括RAID等额外的磁盘开销)。从这一点可以看出,在近线存储设备中,采用高容量的低速磁盘来存储不经常访问的数据,可以大幅降低能源的消耗,达到节能的目标。
与磁带设备相比,近线存储采用磁盘设备,可以大幅提高系统的备份与恢复速度。以华为赛门铁克公司的VTL3605虚拟磁带库为例,其备份速度可以达到1.5TB/h,但离线存储的备份速度只有288GB/h。仅从这一点来衡量,虚拟磁带库的备份速度远远高于磁带设备。
在实际应用中,用户可以综合考虑性能与业务的需求,将对实时性要求较高的关键业务放到高速、高能耗的在线设备上,而将对实时性要求较低的数据迁移到低能耗的近线设备上,从而有效降低能源的开销。
固态硬盘(SSD)兼顾了性能与环保的要求,可用于在线存储,以降低系统能耗,并提高系统的性能。但由于SSD的成本较高,目前还没有得到普及。
减少设备占用空间
为了满足日益增长的数据存储需求,用户不得不购买更多的物理磁盘。高速的SAS磁盘最多只能提供300GB的存储空间,而低速的SATA磁盘则可以提供高达1TB的存储空间。用户可以将访问频率较低的数据从在线的高速磁盘迁移到大容量的存储设备上,释放宝贵的在线资源给关键业务。此外,近线系统可以采用大容量的低速存储设备以及空间利用率较高的RAID 5算法,并对数据进行及时归档,从而减少磁盘使用量,减少机房的设备占用空间,避免扩容的风险。
随时释放存储资源
分级存储是根据信息生命周期管理策略对数据进行管理的。将那些过期无用的数据及时从设备中删除,也可以达到节约资源的目的。华为赛门铁克综合考虑数据的属性,在条件允许的情况下尽量采用数据分级存储的方式保存数据,从而达到节能的目标。