社交网站Facebook沉睡的数据文件超过数千TB,对于这些数据,绝大多数用户都不会再去触及它们,但是Facebook公司仍然需要保留它们。目前,该公司正寻找一个适当的解决方案,希望能够解决这些数据的存储问题。存储容量并不是什么问题,但数据的长期储存却是一件不容易的事情。实际上,这对于所有的社交网络站点来说都是一个难题,用户的数据不断地积累,而无论是用户还是服务供应商,都希望能够长期地保存这些数据。因此,Facebook在2013年的闪存峰会上呼吁存储设备制造商“做你们所能想象的最简单的闪存但要大和便宜”,理论上讲,如果用于数据的长期保存,闪存比其他形式的存储介质更有优势。不幸的是,这一理论并不适用于现有的固态硬盘、闪存盘等闪存存储设备。
目前,社交网站已经开始使用蓝光光盘给用户上传的图片文件存档。2014年2月,Facebook公司公布了长期存档的方案:将使用由10 368个蓝光光盘(XL)组成的机架进行存档,每个XL蓝光光盘可以保存100GB的数据,每一个机架的存储容量将达到1PB,它们将通过16个蓝光刻录机并行地读写。
对于家庭用户来说,刻录机也同样有价值,暂时仍未到抛弃它们的时候,因为光盘仍然是长期存档的好介质,反倒是个人用户普遍使用的硬盘等磁盘介质虽然相对稳定,但却并不可以依赖。而对于大量的数据,传统的备份介质磁带仍然是一个不错的选择,目前相关的技术仍然在不断地发展中,这为我们提供了更多的选择。
千年不变的石头
现在很多电脑已经不再配备刻录机,超薄笔记本电脑、平板电脑上不可能配备刻录机,就连台式电脑配备刻录机的也越来越少。对于需要将数据长期存档的用户来说这是一个问题,因为现有的磁性或闪存存储设备仅能够将数据保存几年,只有使用DVD和蓝光光盘进行备份,数据才能够保存数十年。当然,这里所谓的数十年,必须采用合适的材料和将光盘存储在一个最佳的位置,普通的空白光盘是不可能达到这一保存年限的。
普通的刻录盘有一个透明的盘体,通过有机染料层来记录数据,并利用金属反射层进行读取。两个层中的任何一个暴露在阳光、空气或水分中,都可能分解而导致数据无法被读出。试验证明,如果采用金作为金属反射层的材料,那么坚持100年是没有问题的,保存30年更是不在话下。然而,非常严峻的问题是,许多普通光盘只能够保存短短的几年。
其他材料制成的特殊盘片可以保存得很久,近几年,Millenniata已经在销售一种通过类似石头的无机层保存数据的DVD光盘M-DISC。无机化合物数据层具有反射和记录双功能,并且M-DISC光盘和普通的数据光盘不同,它不容易受到环境的影响。由于Millenniata和LG等驱动器制造商的紧密合作,因而有一些普通的刻录机也可以刻录M-DISC盘,而配套的DVD M-DISC盘片折合人民币一片只需约20元。另外,Millenniata最近已经开始在自己的商店销售蓝光M-DISC盘片,并预计从2015年起开始销售BDXL盘片。根据制造商的介绍,这些M-DISC盘片保存年限可以长达千年。这个结论显然是模拟的测试结果,是将M-DISC盘片暴露于强热和高湿度环境下模拟老化的过程而得出的结果。
由德国Syylex公司生产的GlassMasterDisc显然比M-DISC盘更好,这种盘可以在90℃的温度和85%湿度的环境下保存完好,包括M-DISC盘在内的其他竞争者都不得不甘拜下风。然而,用户无法自己将数据写入GlassMasterDisc,需要将数据发送到Syylex,通过蚀刻方式将数据写入GlassMasterDisc。
不过,GlassMasterDisc仍然是可以超越的,特温特和弗赖堡大学的科学家进行一些研究,希望找出更多可以长期保存数字数据的方案。他们开发了由钨制成并涂有氮化硅的盘片。这种盘片即使在600℃的温度下也仍然完好无损,因而科学家们得出的结论是,压力测试表现如此出色的盘片寿命完全可以长达一百万年。而在这么长的时间里,由于沙漠风沙的侵蚀,相信金字塔也早已不复存在了。
新一代蓝光存档光盘将在2015年亮相,然而暂时还不知道它是否会被提供给个人用户。索尼和松下目前正就存档光盘做准备,据介绍,第一代的盘片数据将被刻录成6层,容量将达到300GB,而随后的版本预期容量将高达1TB。存档光盘的保存寿命将长达50年,将会是用于备份的理想介质,Facebook已经准备好要使用它长期保存数据。
磁带的冲击
磁存储介质能以比较经济的成本保存大量的数据,目前个人用户使用磁存储介质需要考虑的问题不多,但是未来几年4K分辨率的视频将逐渐普及,此时个人用户将面临一个选择:选择磁带还是磁盘?对于大部分个人用户来说都会选择磁盘,特别是当4TB硬盘的价格也非常便宜的时候。然而,对于长期需要保存的数据来说,这或许是一个错误的选择,因为机械硬盘这种特殊类型的存储设备故障率非常高。
云服务供应商Backblaze进行了多年的研究和分析,希望找出机械硬盘的故障原因。研究发现,第一年,大约有5%的硬盘出现故障,主要原因是硬盘的制造缺陷。而从第三年起,许多硬盘开始陆续出现故障,主要原因是机械磨损等硬盘的缺陷。因此,该研究分析表明,个人用户并不适合依靠磁盘来保存数据,因为如果幸运的话,磁盘或许可以使用超过10年,但磁盘也可能仅仅1年就出现故障。
旧存储设备的未来
磁带是20世纪的存储介质,很长一段时间生产厂商各自为政,各自采用自己的系统,直到惠普、IBM和希捷建立线性磁带开放(Linear Tape Open,LTO)作为磁带的开放标准,这一切才有所改变。LTO磁带作为一种开放标准的存储介质有自己的开发时间表,每一代都加入了新的技术和提供更高的存储容量。目前的第六代LTO磁带,有自己的文件系统和加密系统。而它的WORM功能对于长期存储数据更为重要,所谓的WORM,是指“一次写入、多次读取”,磁带只写入一次数据,此后将被作为写保护数据访问。经过专门研究磁带驱动器的公司的测试,如果存储在适当的位置,磁带的保存寿命可以比硬盘更长,可以长达30年。唯一需要注意的是,高热和高湿度的环境将会缩短磁带的寿命。
LTO磁带最近的一次更新将会改变磁带的磁记录材料,这将能够进一步延长LTO磁带的寿命,有可能可以保存50年之久。一直以来磁带都采用金属颗粒(铁、钴)作为磁记录材料来存储数据,但是这种材料已经达到了它所能支持的最高存储密度:必须有足够的磁化粒子,才能够确保驱动器获得明确的磁信号。如果使用金属颗粒,那么每一盘磁带的最大存储容量是6.25TB,而从2015年开始,采用新一代磁记录材料的LTO 7磁带预计存储容量将可以达到16TB。LTO 7磁带采用钡铁氧体作为磁记录材料,这种新的材料磁化的效果实际上并不完美,但是它的粒子较小,可以支持更高的存储密度。此外,它不容易受到腐蚀,这意味着,钡铁氧体的磁带预期将会有较长的使用寿命。
寿命更长的闪存
电子存储技术可以解决许多影响存档文件长期保存的问题,热量是唯一可以破坏电子存储器的因素。闪存单元通过浮栅存储电荷,通过一个较低的电压就可以读出所存储的数据,但是如果要进行删除操作,则需要较高的电压来除去电荷。每个删除操作,都会使一些电子萦绕在绝缘层,在进行一定数量的写操作后,太多的电子停留在绝缘层中,这将会阻碍删除操作而导致闪存单元无法使用。这种情况发生速度的快慢取决于闪存单元所存储的不同电荷电平的数目,不同的电荷电平可以被用于存储不同的数值。
以往的闪存单元(SLC)通常只存储1个电荷电平,也就是1个闪存单元存储1bit的数据。现如今的趋势是每一个闪存单元(TLC)存储3bit的数据,因此,必须保存8个电荷电平。这可以提高存储密度,但是降低了闪存单元的寿命:TLC闪存可经受约1 000次的写入操作,而SLC闪存可承受100 000次。不过,从以上的介绍不难发现,如果闪存采用WORM的使用方法,也就是一次写入后作为只读介质使用,那么以上的问题就都可以得到解决。测试表明,采用WORM方式使用闪存,在室温环境下闪存可以保存数据约1 300年,但是需要注意TLC闪存应该无法支持这么长的保存年限,因为较小的电荷电平的改变即可影响数据。
不幸的是,除了德国当局用于保存证据之外,WORM的闪存介质需求非常低。SanDisk的记忆库(Memory Vault)是一个例外,但它采用USB 2.0接口。我们必须考虑到一个问题,那就是接口可能会被废弃,闪存的发展非常快,未来谁也无法预料。今天随处可见的SATA固态硬盘,再过10年或者20年,谁也无法保证还可以找到使用它的设备。SATA接口对于固态硬盘来说已经成为了瓶颈,很快将被PCI-E、NVM Express和M.2所取代。
除此之外,闪存也并不是最佳的电子存储设备,目前发展中的技术将会提供更强大的电子存储器,支持更多的删除周期。目前最有前途的电子存储器是相变存储器(Phase Change Memory,简称PCM)和忆阻器,它们被认为是长期存档的理想介质。长期以来PCM都是被看好的,但是它在存储电荷时涉及一个临时加热的方法,这导致PCM单元难被小型化。而采用忆阻器技术RRAM存储单元则不会有这样的问题。目前,美国已经开发出了存储密度能够与最新闪存单元比肩的电阻式存储器。与闪存比较,RRAM存储单元的结构非常简单:非晶硅层位于两个电极之间,当施加电压时,通道将始终保持导电性。压力测试表明,在85℃的温度下,RRAM存储单元的寿命将比闪存单元更长,这意味着采用该技术的数据载体可以更长时间地保存存档数据,然而开发相关的技术可能还需要较长的时间。