Mirror
现在人类每天制造2.5×1016字节的庞大数据,绝大多数转瞬即逝,但也有不少信息,我们希望能一直保存下去,留给后代。
从远古的壁画、传统的纸张书籍,到近代的磁带、胶卷,再到现代的光盘、硬盘、U盘。信息的载体变得越来越轻巧,容量越来越大,而且能存储的数据也更多样化。但在时间面前它们安全吗?
把一个图书馆的信息,装进一个硬盘中。这首先归功于二进制的信息编码方式,无论是文字、图像还是声音,都可以用0和1的无限组合来编码。
磁化信息原理示意图
电子设备通过电流变化来识别信息。电场的变化会产生磁场,反之亦然,并且方向可控。利用电磁感应,我们就可以改变磁性载体组成单元(磁畴)的磁极方向,相应地定义为0和1。
磁带和机械硬盘就是利用无数个微小的“磁铁”来编码信息的。磁化和去磁化的过程是可逆的,因此这类磁存储载体可以反复读写。
机械硬盘(左)与固态硬盘内部结构(右)
读取更快的固态硬盘和U盘,是通过载体的每个单元是否存在电子来定义0和1的。
CD(左)和DVD(右)的微观结构,后者的信息密度更
光盘则是利用载体的光学特性来记录信息的——反射光的区域定义为1,不反射则定义为0。刻录光盘时,激光烧掉刻录光盘部分单元格上的反光材料,露出底下的吸光材料,这些不反射光的区域就是“0”。
知道了信息存储原理,你就会发现缩小信息载体大小的关键在于如何缩小编码0或1,即1字节的基本单元。
1951年的磁带机比洗衣机还笨重,其中的金属磁带每厘米只能存储50字节信息,存一首MP3歌曲需要1吨重的机身。现在一张SD卡能存储上百GB的信息。
1951年的磁带机(左)和SD卡(右)
但科学家并不会止步于此,实验室中的信息存储单元大小几乎已经逼近极限——单原子水平。2016年,荷兰科学家以单个氯原子为基本单元编码数据(有氯原子的位置是“1”,没有是“0”),成功存储了1KB数据。理论上,这样可在一枚邮票大小的面积上存储60TB数据。
纳米尺度的硬盘上用氯原子编码了物理学家理查德·费曼的一段话
2018年,科学家通过改变单个钴原子的磁性(改变绕核电子的运动方式),来编码数据。这将使硬盘的体积缩小到现在的千分之一。可惜这需要使用扫描隧道显微镜在超真空和超低温环境下工作,门槛高得不切实际。
把信息存储载体变小,我们已经做到接近极致了,但在另一方面——信息保存期限上,这些高科技设备甚至还不如传统信息存储载体。普通机械硬盘寿命3到5年,光盘10到25年,闪存设备包括U盘和固态硬盘则会随着读写次数的增加,慢慢患上“失忆症”。而看似被时代抛弃的磁带在理想条件下却能保存30到50年,因此像谷歌这样引领科技前沿的巨头依然会使用磁带备份重要数据。书籍更是可以保存数个世纪。
在扫描隧道显微镜下用探针处理单个原子的模拟图
为了兼顾载体的信息存储容量和信息保存期限,近年来科学家们已经取得了一些进展,只不过还不完善,下面这两种方式或許能成为保存人类文明的希望。
刻录下书籍的5D光盘需要显微镜阅读
5D光盘的多维信息处理
2018年,5D光盘被用于人类数据备份计划(Arch Mission Foundation)
2013年,英国南安普顿大学的科学家用飞秒激光在玻璃盘的三维空间结构中打出一系列极小的点,将300KB的信息存储在其中。如今他们已经把这种玻璃盘的信息存储能力提升到了300TB!
既然5D光盘和普通光盘一样,都是用激光来刻录数据,那它又有什么特别之处?普通光盘记录信息只是“流于表面”,即只有二维水平,而这个“5D光盘”听起来虽然和“5D电影”一样有噱头之嫌,但至少它的确能在立体空间维度(3D)记录信息。剩下两个维度,一个指的是观察的角度,另一个是显微镜的放大率。在5D光盘中,从纳米级别的微观水平到直观肉眼可见的宏观水平都记录了信息,觀察者通过不同角度和不同放大倍数,可以从中读取出不同信息。
5D光盘最可贵之处在于它的耐久性,石英玻璃材质和表面的聚合物保护层使它对化学和物理伤害都具有很强的防御力。研究者基于实验结果认为,它在室温下的保存时间几乎是无限的,即使是在189℃的高温环境中,也能活到宇宙现在的年龄(138亿年)!
目前,微软、日立还在致力于发展这项技术。
其实论存储信息的本领,任何载体都不及构成我们的细胞,更准确地说是DNA。生物体内的DNA可是通过复制和重组,从远古一代又一代传下来的。
DNA的信息存储能力也毫不逊色——在肉眼完全看不到的细胞核中,带有A(腺嘌呤)、T(胸腺嘧啶)、C(胞嘧啶)、G(鸟嘌呤)四种不同碱基的脱氧核苷酸,以不同的顺序排成DNA长链,编码了生物体的一生。
以人体基因组为例,其中含有超过30亿个碱基对,这一切都保存在直径仅几微米的细胞核中。要将这些A、T、C、G以正常字体大小写在A4纸上,需要40层楼高的A4纸!
用二进制编码碱基
大自然早已为我们准备好了最佳信息存储载体。科学家们尝试主动在DNA中编写信息。他们将A、T、C、G碱基以二进制编码,然后将数字化的文字信息翻译成碱基序列,再合成DNA序列,就实现了数字信息与生物信息之间的转化。只要测个序,就能解读出其中的信息。
但裸露的DNA相当脆弱,于是研究者给它们穿上了二氧化硅外壳,制成人造化石,以达到长期保存的目的。他们让这个人造化石在70℃的高温中保存了一周,再读取信息,结果依然完好无损。
不仅是文字,科学家已经成功地将电影编码进人工合成的DNA,而且理论上能够将人类有史以来拍摄的所有电影全都塞进一个小小的DNA人造化石中。
然而,这样保存DNA并没有完全体现出它的优势——可遗传性。
虽然我们能通过PCR技术人工复制数以万计的DNA,但手动备份肯定不如主动备份及时省事,而且细菌等微生物的繁殖速度惊人,即使出现DNA突变,科学家也能用算法矫正信息。
原始画面和从细菌DNA中解析出的画面
哈佛大学在2017年已成功利用CRISPR-cas9基因编辑技术将一部短片编码到了大肠杆菌的基因组中,制造出了“细菌硬盘”,而且还能将信息遗传给下一代。
即使有一天地球变得不再适宜人类生存,这些承载了人类文明的微生物还能以休眠状态熬过极端环境,甚至进入太空,告诉这个宇宙——人类曾无比璀璨地存在过。
(本文经授权转载自“把科学带回家”微信公众号,有删节)