冯智
信息的储存对人类文明的传承来说至关重要,数千年来,人类保存信息的方式由岩洞壁画、甲骨文、竹木简、牛皮纸,一直发展到近百年来的磁带、胶卷、光盘,以及如今的精密半导体存储芯片。介质越来越小巧,可存储的信息量却越来越庞大。在可预见的未来,会不会出现更具革命性的储存手段呢?比如细菌。
事实上,科学家从未停止过对更新存储介质的探索,毕竟在信息爆炸的未来,找到更便宜、容量更大的存储介质,能给人们的生活和工作带来更多便利。于是有人提出,能不能利用DNA储存信息?毕竟DNA的存储量之巨是显而易见的,它能轻易装下人体内所有的秘密。
当然,DNA存储并非一个崭新的概念,早在半个多世纪以前,就有人提出过,然而受制于当时有限的生物学发展进度,很多想法也仅仅止步于概念。但如今,得益于近十年来分子生物学的突飞猛进,人们开始重新重视DNA存储技术。
话说回来,DNA是如何记住每个人体内独有的海量遗传信息呢?据分子生物学家介绍,DNA可将腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种碱基以不同的方式排列组合,辅以细胞特有的读取方式,高效储存生物体丰富的遗传信息。因此科学家认为,既然遗传信息都能够被留存下来,那么其他信息为何不可?
这种推想完全可行。举个例子,单位质量的DNA可存储455EB的信息,这是全球一年信息总量的四分之一;而单位体积的DNA可存储的信息为整个互联网的33倍。显然,DNA可以作为一种稳定且密集的数据存储介质,潜在优势是密度大、能耗低,且寿命长。
对此,生物学家进行了尝试。
首先是确定信息转换的规则。生物学家为DNA内的腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)四种碱基,賦予了数字概念,把它们当做数字信息,即把数字化的信息转变为用碱基来表示。用二进制来举个例子,如果把A和G当做0,C和T当做1,就可以排列组合成任何信息,简单又直观。
后来科学家开始采用四进制模式,即把A、T、C、G看作0、1、2、3,这种方式可以大大缩小数据量,但同时也导致碱基重复出现,序列稳定性随之变差,对数据的精确重现造成了破坏。
于是科学家决定采用三进制手段,让前一位碱基成为后一位碱基的决定条件。假如前一位碱基为A,则下一位就把A排除,用C、G、T来代表0、1、2,以此类推。解决了碱基问题后,分子生物学家开始尝试把各类信息数据导入DNA里,比如有一位哈佛大学的研究者就成功把一本书的电子数据编辑成了DNA形式。
如今这项技术虽然比50年前有了飞跃式的进步,但还远未实现在活体细胞基因组中存储信息这一目标,因而距离真正的应用、普及还尚有距离。然而,DNA巨大的储存潜力和大数据信息爆炸的时代紧迫性,无时无刻不在激励着分子生物学家们开展更多的探究。想象一下,未来你抽屉里的移动硬盘,可能会被一只小小的细菌所替代,所以当下的一切尝试都是值得的!
●梁衍军 荐稿