基于DNA 折纸模板的铁原子阵列构建及其信息加密应用*

2021-03-26 08:43凡洪剑李江王丽华樊春海柳华杰
物理学报 2021年6期
关键词:订书预置折纸

凡洪剑 李江 王丽华 樊春海 柳华杰†

1) (同济大学化学科学与工程学院, 上海自主智能无人系统科学中心, 先进土木工程材料教育部重点实验室, 上海 200092)

2) (中国科学院上海高等研究院, 张江实验室, 上海光源科学中心, 上海 201800)

3) (上海交通大学化学化工学院, 上海 200240)

1 引 言

自20 世纪50 年代以来, 硅基集成电路技术的进步推动了电子计算机的蓬勃发展.然而, 随着“自上而下”的光刻等手段不断走向尺寸极限, 电路越来越集成化、电子设备越来越小型化的要求正面临新的巨大挑战, 后摩尔时代的来临已迫在眉睫.突破原有技术极限, 进行原子尺度的精准构筑, 是当前的重大科学问题, 也是解决下一代信息技术发展的关键.不同于“自上而下”的光刻、操纵等手段,“自下而上”的自组装是构成生命体系的基本原理,也充分展示出生命体从原子直到宏观的跨尺度、跨维度的精准度, 更在此基础上使生命体展现出了超乎无机材料的智能性.受此启发, 从原子尺度进行物质的人工自组装, 通过调控基本构筑单元的物理排布与功能集成, 进而实现器件制造, 是未来的一项前沿发展方向.

DNA 是一类具有原子级精准度的生物大分子.基于精确的A-T, G-C 碱基配对原理, DNA 单链之间可以形成具有碱基序列特异性的双链结构—即著名的DNA 双螺旋结构, 此外DNA 也能够形成三链[1]、四链[2]等结构.特定序列的DNA单链可通过人工化学合成获得, 而通过设计并合成DNA 序列, 就能够实现可编程性自组装构建人工DNA 纳米结构.这些DNA 纳米结构可看作由若干DNA 链在空间上进行排布, 进而形成的人工框架结构, 由于框架上的每个碱基位置都是可定位的, 因此也为功能基元在框架上的定点修饰提供了可能[3,4].DNA 框架结构中最为著名的是DNA 折纸(DNA origami)结构[5], 组装原理是由约200 多条20—60 碱基的订书钉链(staple)引导一条7000多碱基的骨架链(scaffold)以类似光栅填充的形式折叠而成, 具有良好的结构稳定性和可编程设计性, 能够设计构建任意二维和三维结构[6].DNA 折纸在结构上可看作一种具有精确寻址功能的模板,经常被用作有机染料分子[7]、核酸[8]、蛋白质[9-11]、无机纳米颗粒[12-15]、碳纳米管[16,17]等的阵列构建,在光电器件[18]、生物医药[19-21]、信息处理[7,22,23]等领域取得了一系列重要应用.

本文首次基于DNA 折纸结构的精准寻址性,进行原子阵列的自组装构筑.由于原子的化学稳定性问题, 实验选取二茂铁分子为研究对象, 通过两个茂基使铁原子处于稳定的化学状态, 再通过化学共价修饰将二茂铁准确定位在DNA 折纸的指定位置上, 构成受茂基保护的铁原子阵列图案.为了展示此材料的应用潜力, 结合前期发展的DNA 折纸加密技术(DNA origami cryptography, DOC)[24],发展了基于原子阵列的加密技术(A-DOC).通过对DNA 序列及自组装过程的编码, 将明文加密成密文隐藏于铁原子阵列中, 并借助单分子成像手段进行密文的读取, 最后使用正确密钥进行解密.该策略在原子层面上整合了加密术和隐写术, 理论上适用于文本、数字、图片等各类信息的加密, 为信息安全的发展提供了一种具有巨大潜力的生物分子解决方案.

2 “信息预置”思路制备铁原子阵列图案

图1 铁原子阵列的构建 (a), (b) 信息链预置于骨架链上的策略形成DNA 折纸并组装铁原子阵列, 通过生物素和链霉亲和素的强结合力将位置显影; (c)—(e) 3 个位点单个铁原子图案组装原子力表征图(比例尺: 100 nm)Fig.1.Fabrications of iron atoms arrays.(a), (b) The M-strand strategy forms DNA origami and assembles the iron atoms arrays.The position is visualized by the strong binding force of biotin and streptavidin.(c)—(e) The atomic force characterization diagram of the assembly of a single iron atom at three sites (scale bar: 100 nm).

本文提出的铁原子阵列图案构建思路如图1所示, 与通常的DNA 折纸组装方法不同, 本文采用了一种具有“信息预置”特点的思路(图1(a)).首先, 根据最终阵列图案的要求, 将用于固定二茂铁基团的订书钉链先与长骨架链杂交结合.这个过程等同于将铁原子阵列信息“预置”于骨架链上, 因此, 这些订书钉链被称为“信息链”(M-strand, M 链)(补充材料的图S1 (online)).第二步, 携带信息链的骨架链经过纯化后与一套通用订书钉链集合(universal staples)进行退火, 形成折纸结构, 此时的折纸在预定放置铁原子阵列的位点上具有相同的一段捕获序列.为了将二茂铁基团在折纸结构上进行固定, 即形成铁原子阵列, 实验中采用了修饰有二茂铁的DNA 序列, 通过分子识别与折纸上的捕获序列杂交结合(图1(b)).在修饰二茂铁的序列另一端修饰了生物素分子(biotin)使铁原子阵列能够以成像的方式被观测到.这是因为生物素分子能够特异性地与链霉亲和素(streptavidin, SA)结合, 而后者能够被原子力显微镜(atomic force microscope, AFM)清晰成像, 从而可通过观测SA阵列来验证设计的铁原子阵列形状.因此, 修饰有二茂铁与生物素的序列可被称为“显影链”(N-strand,N 链), 而SA 就是“显影剂”.M 链与骨架链结合部分的长度为40 个碱基(补充材料的图S2 (online)),M 链延伸端与N 链序列互补.

需要指出的是, 本思路的实现基于对DNA 杂交反应热力学和动力学过程的严格调控.在预置有M 链的骨架链与通用订书钉链集合共同退火时,M 链的长度以及退火温度决定了能否避免未期望的解离以及设计图案的生成.一方面, M 链的长度可以通过模拟计算确定, 需特别注意的是要避免M 链在骨架链上形成来回折叠, 以及由于M 链的独特设计对于周围其他订书钉链的影响.结果显示, M 链与骨架链杂交长度设计为40 碱基时, 与普通订书钉链比较, 在能量上具有较大优势(补充材料的图S3 (online)).另一方面, 退火温度的选择可以进一步避免预置M 链的脱落, 根据模拟结果,在起始温度设置为57 ℃、M 链与骨架链结合长度为40 个碱基时, 未配对比例仅为3.5%; 而对于普通订书钉链, 与骨架链的未配对比例, 相比M 链高了至少2 倍以上.

与通常制备DNA 折纸结构的思路不同, 将信息链预置于骨架链上极大降低了实验工作量.设单个折纸的订书钉链数量是s, 阵列中的铁原子数量是m, 按常规做法需要将m 条信息链去替代对应的普通订书钉链, 即需要将m 条信息链与s-m 条剩余普通订书钉链逐条混合, 然后再和1 条骨架链混合, 总计需要s + 1 个混链步骤.需要指出的是,如果制备另一个不同的铁原子阵列, 前述混合的样品将完全不能使用, 而是再重新经过s + 1 个步骤获得新的样品.以图1 所示的十字形折纸为例, 共有201 条普通订书钉链, 如果用于制备图1(c)—(e)中的3 个不同图案, 需要606 个混链步骤.但是,使用“信息预置”的方法, 只需混合1 个包含201 条普通订书钉链的通用库, 然后根据图案的不同单独将信息链与骨架链混合即可, 总计需要207 个混链步骤.如果一次制备的通用订书钉链集合的量非常巨大, 不再考虑构建此集合的步骤, 此方法将进一步节省工作量, 仅需6 步就能完成.

为了验证此方法的有效性, 对铁原子在十字形折纸的3 个不同位置上的组装效率进行了测试, 如图1(c)—(e)所示, 分别是棱角上、棱中点和折纸面上.由于二茂铁和生物素是同步修饰在N 链两端,AFM 下观测到SA 的正确组装即说明生物素和二茂铁都固定在正确的位置上.结果显示, 这3 个不同位置的组装效率均在90%以上, 分别为96.3%,97.3%, 90.3%.最终图案的高效组装决定于三方面的高效率: 一是M 链在骨架链上的高效结合, 二是显影剂N 链高效地与M 链延伸段杂交, 三是SA与生物素的结合效率.SA 与生物素的结合被公认为亲和能力很强, 以上结果验证了本方案在M 链和N 链的结合上也具有高效率, 因此实现折纸上铁原子阵列构建的有效性.

3 “一锅法”同时制备不同铁原子阵列图案

采用“信息预置”的另一个更为重要的优势, 是能够实现以“一锅法”同时批量制备多种不同的阵列图案.如图2(a)所示, 将携带不同M 链的3 条DNA 骨架链进行混合, 然后与通用订书钉链集合进行退火, 可以在一锅内制备出三种铁原子点阵图案.其实现原理是, 信息链M 从能量上保护了杂交位置的骨架链, 使普通订书钉链难以与骨架链杂交, 即替换下M 链; 携带不同M 链的骨架链之间同样也不会发生串扰.从结果看, 该方法成功获得了所设计的三种点阵图案, 且观察到的图案比例分布与各骨架链的比例一致, 这证实了订书钉链对M 链与骨架链的结合几乎没有影响.此外, 也没有观察到两个图案点出现在同一个折纸上的情况发生, 说明没有发生不期望的解离并结合到别的骨架链的情况(图2(b)).

这种一锅法技术, 在实验工作量上也实现了很大的简化.仍然设M 链数量和普通订书钉链数量分别为m 和s, 需要m 步来构建M 链集合, s 步构建通用订书钉链集合.对于常规做法, 由于改变阵列图案即需要重新混合全部订书钉链, 因此对于每个样品都需要s + 1 个步骤; 而对于一锅法, 由于不需要重建预混合的通用订书钉链集合, 对每个样品仅需m + 1 步即可完成.理论计算可知, 对于最多具有m 个修改位点的图案, 存在个可能的组合变化, 以及个常规策略的模式变化.由于s 通常比m 大1 个数量级, 因此在快速制作各种图案方面, M 链预置策略比常规策略具有显著优势.

图2 M 链策略“一锅法”制备多种DNA 折纸纳米图案(a) 多种携带不同M 链的骨架链混合, 一同退火, 在单个离心管中快速制备多种DNA 折纸纳米图案; (b) 原子力表征图及产率统计图(比例尺: 200 nm)Fig.2.M-strand strategy to prepare a variety of DNA origami nanopatterns by “one-pot” method: (a) A variety of scaffolds carrying different M-strands are mixed and annealed together to quickly prepare a variety of DNA origami nanopatterns in a single centrifuge tube; (b) AFM diagram and yield statistics (scale bar: 200 nm).

4 基于铁原子阵列图案的信息加密

从本文铁原子阵列的制备和表征过程可以看出, 信息链预置于骨架链的思路不仅是对骨架链的预保护, 实际上也等同于将信息链隐藏于骨架链上;此外, 信息的写入(杂交)和读取(成像)在物理上是分开的, 并且由两个不同的实体进行.因此, 基于以上技术, 使开发基于铁原子阵列的信息加密技术成为可能.

在前期开发的DNA 折纸加密(DOC)技术基础上, 本文利用铁原子阵列提出了原子阵列DNA折纸加密(A-DOC)技术.如图3(a)所示, 发送方和接收方(分别命名为Alice 和Bob)利用A-DOC技术进行了文本信息的秘密传递, 其原理是对折纸上不同的铁原子位置编码, 通过密钥进行加密, 并结合隐写术加强保密程度.首先, 使用密钥对二进制文本进行加密, 转换成折纸上的原子点阵图案.在第二步, 将对应该点阵的信息链与骨架链进行杂交, 得到的样品即包含了秘密传递的信息.Alice 将预置M 链的骨架链交付给Bob, Bob 再将通用订书钉链库与骨架链进行退火组装, 获得折纸结构.值得注意的是, Bob 获得的折纸虽然已隐藏了秘密信息, 但需要在结合二茂铁修饰序列, 形成铁原子阵列后, 才能通过成像手段将隐写图案进行读取.最后, Bob 通过密钥将读取的原子点阵图案进行解密, 获得明文.

在单个十字折纸上, 13 个可区分的识别位点被选择作为铁原子点阵的可选位点, 独特之处在于, 这13 个位点被分为三种功能: 1)文本信息(红色位点), 以8 位的二进制ASCLL 码编码单个字符; 2)位置信息(黑色位点), 表示此折纸上的字符信息在整个字符串中的位置, 如设置4 位二进制数, 则字符串长度为24= 8; 3)定位标记(绿色位点), 以1 个标记位点打破十字折纸的外在对称性,使表示文本与位置的位点读取顺序得到明确.在读取形式上, 通过表征SA 的图案即可说明铁原子在对应位置是否存在, 从而读取位点上的信息为0 或者是1, 有铁原子的位点为1, 反之为0.

图3(b)给出了用A-DOC 技术对明文消息“DNA-1954”进行的加密结果.Bob 通过AFM 成像获得类似盲文的铁原子点阵图案后, 查询密码表将图案信息转换为二进制信息, 再通过分别对位置信息和文本信息进行解码, 最终可以获得明文.以位置信息为例, 当读取到表示“0000”的折纸时, 由于该4 位二进制数表示字符串的第一位字符, 因此再将表示文本信息的8 位二进制数“010000100”解码, 得知第一位字符为“D”.以此原理, 密钥大小由(1)式决定:

图3 DNA 折纸加密及编码原理示意图 (a) DNA 折纸斑点编码原理; (b) 发送者(Alice)和接收者(Bob)通信流程; (c) 文本“DNA-1954”的编码演示(比例尺: 25 nm)Fig.3.Schematic illustration of DNA origami encryption and coding principle: (a) Coding principle of DNA origami spot; (b) the communication procedure between the sender (Alice) and the receiver (Bob); (c) coding demonstration of the text “DNA-1954”(scale bar: 25 nm).

在以上工作基础上, 进一步提出了多折纸编码单字符的设计, 对字符串长度和可编码字符容量进行了提升, 并以加密唐诗《登鹳雀楼》为例进行演示(图4).根据汉字代码标准GB2312 的规定, 汉字按94 个“区”和94 个“位”分区索引, 可以看作一个横竖各有94 个格子的正方形棋盘, 每个格子对应一个汉字或者符号.其中1—9 区为符号区,16—87 区为汉字编码区, 其他为用户自定义编码区.如图4(a)所示, 本文使用两个不同标记的十字折纸, 对于第一个折纸, 12 个可识别位点中5 个黑色点位代表在字符串中的位置信息, 容量为25;7 个蓝色的位点①—⑦编码汉字的区, 称为区码(section code), 信息容量可达128 位(27), 超过了国标规定94 位的需求.同样另一个折纸以相同的五个黑色点位代表位置信息, 对应第一个折纸, 红色的7 个点位①—⑦代表在该区所处的位, 称为位码(postion code).通过两个折纸位置信息匹配读取信息就可得到汉字信息和这个汉字在文本中所处的位置.在图4(b)中演示了该编码规则的实例,对于汉字“流”, 根据区码表得到它的区码为33、位码为87, 代表它在区码表中处于33 行87 列的位置.然后将区码和位码分别转换为二进制数据, 区码二进制为“0100001”, 位码二进制为“1011101”,根据红色和蓝色序号的循序依次写入.同时根据它在诗中的位置定义了它的位置码为15, 即“01110”.

图4 将汉字在DNA 折纸上的加密方案 (a) 区位码在折纸上的编码原理; (b)汉字“流”的编码演示; (c) 28 个汉字唐诗文本AFM 实验图(比例尺: 40 nm); (d)唐诗随扫描次数收集完成度和错误率图, 正确收集标记为红色, 单个链霉亲和素图案未收集超过20 个的标记为白色Fig.4.Scheme of encoding Chinese characters on DNA origami: (a) Encoding principle of section and position code on origami; (b) demonstration of Chinese encoding Chinese character “流” on DNA origami (scale bar: 100 nm); (c) AFM experimental graph of 28 Chinese characters Tang poetry text (scale bar: 40 nm); (d) collection completion and error rate graphs of Tang poetry with the number of scans completed and error rate graphs.The correct collection is marked as red, and the single streptavidin pattern which is not collected for more than 20 will be marked as white.

如图4(c)所示, 用该方法对唐诗《登鹳雀楼》进行了加密, 首先将这首唐诗的每一个字符按照区位码编码(补充材料的图S4 (online)), 这首唐诗总共28 个字符, 包含24 个汉字和4 个标点符号.为避免在传递信息时, 由于十字折纸中间凹陷不清晰引起的辨识困难, 我们将携带区码和位码的折纸分别表征(补充材料的图S5 (online)).此外,为避免由于折纸图案较大的多样性带来的数据可能缺失问题, 可以通过增加读取次数, 即增加AFM成像数量来消除错误, 随着扫描次数的增多, 同一位置出现图案最多的信息会被积累并使得初始的错误得到校正.如图4(d)所示, 在获得30 次扫描结果后, 排除无法识别(聚集或未良好形成)的折纸, 错误率由两次扫描时的14.3%下降到30 次扫描时的0%, 证明了随着图案基数的增加, 正确的图案累积, 在后期更难以出现新的错误以替代正确的统计结果.

5 结 论

本文利用DNA 折纸结构的精准定位能力, 通过“信息预置”的思路构建了铁原子阵列图案, 并将此应用于对信息的加密.AFM 成像结果显示, 铁原子在折纸不同位置的正确定位效率高达90%以上, 验证了构建原子阵列的可行性.同时, 通过对位置信息的预置, 还极大降低了工作量, 使同时批量制备不同阵列图案成为可能.在此基础上, 建立了密钥长度在700 位以上的原子阵列加密技术, 结合隐写术将信息隐藏在类似盲文的点阵图案中, 以唐诗《登鹳雀楼》为例进行了演示.在未来的工作中, 我们将一方面进一步探索对铁原子阵列的更高分辨率与更直接表征, 另一方面也将在加密原理方面进行优化, 提升可加密字符串长度与字符容量.希望本文的研究能够推动DNA 自组装技术在原子制造领域的更多应用, 在利用DNA 原子级精准性方面发挥更多作用, 为发展原子精准性材料与器件提供生物分子解决方案.

猜你喜欢
订书预置折纸
基于排队论的水下预置反舰导弹部署优化
可预置工作点脉动直流工况电感测量仪研制
折纸鹦鹉
折纸
折纸图形
多级网络物资预置—前送模型及改进布谷鸟搜索算法研究
折纸
省力60%的订书器
预置缝线减张缝合法预防低位直肠癌术后吻合口瘘效果观察
“随意订”订书器