具有划时代意义的DNA存储技术

2018-08-16 06:51李忠东
青少年科技博览(中学版) 2018年6期
关键词:存储介质微软公司存储技术

李忠东/编 译

保存100部经典文学作品和其他多种数据

不久前,微软公司宣布,它和美国华盛顿大学研究人员合作,利用人工合成DNA作为数据存储介质的技术,保存了大约200兆数据,其中有包括《战争与和平》在内的100部经典文学作品、被译成100多种语言的《世界人权宣言》、数字图书馆“古腾堡工程” 排名前100位的电子书以及全球作物多样性信托基金的种子数据库等。

尽管已经有研究证明数据可以被保存在DNA中,然而一次性向DNA写入如此多数据还是第一次。微软公司和美国华盛顿大学的研究团队成功地将4个图片文件的数据编码为人工合成DNA片段的核苷酸序列。更重要的是,他们能实现逆过程——从更大的DNA池中取回正确的核苷酸序列,重建图像,而且没有丢失1个字节的信息。

DNA的4种碱基(A,G,C,T)可被用来作数据编码

DNA存储技术着眼于未来、具有划时代意义,它利用人工合成的脱氧核糖核酸(DNA)作为存储介质,具有高效、存储量大、存储时间长、易获取且免维护的优点。利用DNA存储数据的关键是DNA碱基,DNA这种双螺旋结构上有4种化学基团,即碱基,它们按照特定顺序排列,组成遗传信息,指导生物体生长发育。DNA数字存储系统同样利用这4种碱基“字母”开发定制代码。当复制一份计算机文件时,DNA数字存储系统首先把硬盘信息中的二进制数翻译成定制代码,然后借助标准DNA合成机器制造出相应的碱基序列。这一序列是多个重复片段,即便某些片段遭损毁,数据也不会丢失。分子生物学实验室用读取生物体DNA的标准设备读取信息,能即时呈现在电脑屏幕上。

DNA存储技术的显著优点之一是容量大。1克DNA能够存储相当于300万张CD的容量。用DNA存储数据保存时间可能长达数千年。与硬盘、磁带等存储介质不同的是,DNA不需要经常维护。

1 毫克DNA分子存储美国国会图书馆藏书绰绰有余

试管底部粉红色物质即DNA,少量DNA即可存储大量数据

在信息存储上,硬盘完全不能和DNA相提并论。在人类的基因序列中,1毫克DNA分子的信息存储空间能在储存美国国会图书馆全部书籍之后还有剩余。美国国会图书馆建于1800年,是美国的4个官方国家图书馆之一,也是全球最重要的图书馆之一。目前藏品总数1.3亿件,包括很多稀有图书、特色收藏、电影胶片和电视片等。

微软公司希望在未来把DNA存储介质技术和现有硅技术硬盘结合起来,创造出更安全快速的大容量硬盘。到那时,一鞋盒DNA就足以保存100个大型数据中心的数据。

国际数据资讯公司预计,全球范围内保存的数据到明年将达到16万亿千兆,其中大部分位于大型数据中心。当前的电子存储设备发展速度赶不上数据量的增长,无法在期望的成本内保存所有信息。由于大数据应用的爆发性增长,提高存储密度已刻不容缓。DNA作为一种极具吸引力的潜在数据存储介质,具有广阔的应用前景和商业价值,是生物芯片的核心元素。

研究团队将4个图片文件的数据编码为人工合成DNA片段的核苷酸序列

生物芯片又称蛋白芯片或基因芯片,起源于DNA杂交探针技术与半导体工业技术相结合的结晶。它在生命科学研究及实践、医学科研及临床、药物设计、环境保护、农业、军事等各个领域用途广泛,将产生巨大的社会和经济效益。

研究人员认为,微软公司的成功令人关注,但制作订制DNA分子的成本高昂,是DNA存储技术大规模使用的主要障碍。如果希望人们接受这一技术,那么其成本至少要低于磁带成本。

耐久性极好的DNA

磁带是目前用于长期存储的标准介质,随着生物技术的进步和DNA读写工具的成本下降,DNA有望最终取而代之。DNA的耐久性极好,在干燥寒冷的情况下表现尤为突出。2016年3月,有研究人员部分重建了古人类基因,这些古人类的骨骼保存在西班牙一处洞穴里已超过40万年。作为对比,磁带保存数据只有几十年时间,随后就会老化。

(资料来源:英国《每日邮报》)

猜你喜欢
存储介质微软公司存储技术
Task 3
关于计算机网络存储技术分析
档案馆移动存储介质管理方法探讨
一种使用存储介质驱动的方式
基于FAT文件系统的数据存储技术的研究
数据存储技术的应用
基于FPGA的并行测试高速存储技术
美法院要求微软提交海外数据
疯狂QA
医院环境下移动存储介质的信息安全管理