采用“乐高”拼接法模拟“T4噬菌体”型DNA拓扑结构

2023-08-10 03:29谈浚杰李明坤孟子汶毕美营韦佳勋汪朝阳应明

山东化工 2023年11期

谈浚杰,李明坤,2,孟子汶,2,毕美营,2,韦佳勋,2,汪朝阳,2,应明,2*

(1.天津理工大学化学化工学院生物制药工程系,天津 300384;2.天津理工大学化学化工学院天津市有机太阳能电池与光化学转换重点实验室,天津 300384)

DNA是一种众所周知的携带遗传信息的天然分子。在过去的三十年中,DNA由于其可预测和可编程的构象、A-T和C-G的Watson-Crick碱基配对原理以及存在丰富的酶等特点,使得用工具来操纵DNA,已被普遍用作核酸纳米结构的分子构建模块。DNA结构在分子水平上的可预测性优于构建纳米结构的任何其他生物分子。此外,DNA纳米结构还具有良好的生物相容性、柔韧性、机械稳定性、高负载能力、高组织渗透性和足够的生物流体稳定性,这有利于其在体内外的应用。所有这些特征使得纳米核酸结构适用于仿生系统[1]、诊断[2]和人类健康治疗[3]。例如,选择核酸纳米结构作为强病毒载体材料。Anderson等人开发了具有清晰尺寸的自组装DNA四面体纳米颗粒,以将siRNA引入细胞并沉默肿瘤中的靶基因[4]。免疫系统还影响DNA纳米结构的体内应用[5]。使用模拟自身物质的“伪装”DNA纳米结构可以帮助它们逃离免疫系统[6-7]。它在疫苗研发和核酸医用生物材料方面发挥着重要作用。

在先前研究中,SdhC双链DNA用于折叠,通过核酸自组装成功设计并获得预期边长19.05 nm的正四面体核酸纳米锥[8]。构建了一种新的方法,即普通基因的双链DNA可以取代单链M13mp18核酸作为DNA折纸的核酸材料。在此基础上,自主设计了核酸纳米盒的组装[9]。通过选择citZ基因并用特定基因位点修饰,通过计算和自组装获得边长为47.29 nm的核酸纳米盒,并通过限制酶控制核酸纳米盒的开关。打开的核酸纳米盒与在限制位点修饰的质粒混合,并在转移到原生质体之前与T4连接酶连接。实验表明,100%的包裹质粒被转移到革兰氏阳性细菌中,这表明核酸纳米盒有望成为一种新的药物载体。

上述研究表明,模块拼接核酸纳米材料的构建方法比DNA折纸更为人工,可以使用普通的双链DNA序列作为纳米结构的核酸材料,甚至可以定制纳米结构并且所构建的纳米结构更完整。因此,使用“乐高”区块拼接将T4噬菌体分为四部分进行区块拼接和组装。首先,选择人类基因组基因PPIAP5的基因序列作为头部15个模块的材料,选择HSBP1P2的基因序列为衣领中的9个模块和底板中的6个模块的素材,选择NDUFB3P3的基因序列用作鞘中的10个模块的材料。其次,使用DEADALUS算法,为了使设计的结构满足T4噬菌体的大小、构建目标结构的所有顶点的空间坐标、顶点之间的连接性以及顶点应提供的表面(图1A、B)。除了提供上述空间信息外,边长不能小于31 bp,并且是10.5 bp的倍数。因此,T4噬菌体的最小边长被设计为31 bp。最后,使用改进的DEADALUS修改相应模块的原材料,在特定位点添加限制性位点,并拼接每个位点,从而最终形成预期的T4噬菌体结构。

图1 DEADALUS算法图解

1 靶模型:T4噬菌体

在这项研究中,目标是用复杂的对称外壳模拟T4噬菌体病毒,大多数是病毒外壳或二十面体对称或螺旋对称,但痘病毒和大型噬菌体病毒不属于其中任何一种。痘病毒是最大的动物病毒(约400 nm×240 nm×200 nm),外观呈椭圆形或砖状,内部结构非常复杂,但大型噬菌体病毒比痘病毒更复杂。对大肠杆菌T4噬菌体病毒进行了仔细研究。它们的头部类似于二十面体结构,尾部由套环、中空尾管、围绕尾管的尾鞘和复杂的底板组成,颈部将头部和尾部连接在一起。具有二十面体对称头部和螺旋对称鞘,T4噬菌体病毒(头部直径约为85 nm,鞘直径约为10 nm,长度约为95 nm)具有二元对称结构。

2 设计和预测算法

生成树程序将输入单链折叠到目标结构的框架中,并生成折叠所需的订书钉股线。为了使单个支架链能够形成完整的目标结构,必须满足两个条件。第一个条件是必须有一个欧拉回路,因为支架的两端将形成彼此相邻的支架间隙,并且该间隙必须由多余的缝钉填充。为了确保欧拉电路的存在,当每个顶点的阶数为偶数时,结构中的每条边可以实现偶数个双工。第二个条件是,即使欧拉电路存在,也不能保证所有的欧拉电路都能形成有效的支架结构。为了形成有效的支架结构,在设计曲面属性元素时,从某个顶点输入某个顶点。边的脚手架链可以从同一顶点或另一顶点离开。因此,解决支架路径的问题可以概括为:将边缘划分为一个具有零支架交叉或一个支架交叉的边缘。具有零支架交叉的边必须连接到每个顶点,并且没有循环,这满足生成树的定义,因此使用生成树来解决支架布线(图1C),并且prim算法用于找到最小权重并重新生成树(顶点集是V,边集是e,X是集合V中的任何顶点。算法从顶点X开始,每次选择一个最接近当前顶点集的顶点,并将两个顶点之间的边添加到树t并重复)。

添加伪节点和支架布线对于零支架交叉的边,添加一对伪节点以将边分成两半,每一半对应于支架交叉的一侧(图1D)。对于图形中的每个顶点,将添加一组伪节点来替换顶点节点,对于每个面,将放置一个伪节点,以连接两个边界边并将其与其他边断开。添加伪节点后,定义了脚手架将通过的欧拉电路(图1E和F),它有两种电路:顺时针布线和逆时针布线。为了最小化骨架的静电排斥,选择了逆时针运行支架的路线。生成树和伪节点仅与结构相关,与大小无关。然后,将边缘的长度引入算法(图1插图),并将支架切口位置放置在没有支架交叉的边缘上,远离缝钉切口和交叉点的复合结构。使用prim算法,根据边缘的长度和布线方案对每个支架底座进行编号,并跟踪其在边缘上的相对位置。对于每条边缘,一个核苷酸从5'和3'端突出,算法确定任何给定边缘上支架片段的长度。

预测原子级3D结构对于具有支架交叉的边缘,将两个31～32 nt缝钉放置在支架交叉处,以充分加强结合。对于边缘的其余部分,如有必要,用42 nt缝钉、22 nt或21 nt短缝钉填充(图1G)。每个缝钉由数字向量表示,与支架核苷酸配对,然后使用输入或生成的支架序列与相应的支架编号匹配。采用通用算法确定边缘端点的位置。Dx瓦片可以被视为两个组合宽度为4 nm(2 nm螺旋间距和2 nm双工直径)的平行圆柱体,其可以进一步简化为具有4 nm宽度的矩形。在理想情况下,这些矩形的角度相交,矩形的宽度相加形成一个N边正多边形。多边形的内径是从边的中心到边的垂直距离(s是顶点和DX平铺边的起点之间的距离,r是由DX平铺的宽度形成的多边形的半径,θtot是顶点的所有面角之和)。

然而,并不是所有的顶点都有相同的角度,会有骨干延伸或核苷酸重叠的情况,所以定义s=r为角的延伸,并创建一个半径为r的球体来定义边缘边界(是最大的面角度,是DX-tile的宽度)。这种方法适用于所有的规则结构。

3 设计限制性酶位点

如果设计完整的结构,T4噬菌体结构的设计需要大于20 000 bp 的支架序列。在实际的实验组装过程中,出错的概率太大,因此使用“乐高”块拼接将T4噬菌体分为四个部分(头部、颈部、尾部和底板)。它们各自产生的结构通过限制酶切割和连接,以实现复杂结构的模块组装。因此,算法的改进可以在脚手架序列上添加限制点,因为算法具有脚手架上的基础序列号,由txt文件生成以检查基础是否安排在每种情况和基础序列的位置,通过查找需要替换的基础序列的位置,替换相应的酶限制位点序列(这里是改进的程序)。

scaf_seq=(″);

replaced_seq=(″);

enzyme_sequence=(″);

len_enzyme=length(replaced_seq);

site_of_enzyme=strfind(scaf_seq,num2str

(replaced_seq))

[m,n]=size(site_of_enzyme);

for i=1:m;

for j=1:n;

if site_of_enzyme(i,j)==1;

scaf_seq(site_of_enzyme(i,j):1:

(len_enzyme+site_of_enzyme(i,j)-1))=enz

yme_sequence

end

4 结果与讨论

通过DEADALUS算法的应用,成功地设计了T4噬菌体四个模块的纳米结构。根据算法流程,首先选择目标结构的几何模型。因为将噬菌体组装成模块,所以完整的噬菌体被分为四个几何模型。以头部几何模型为例,制作了头部的Schlegel图,计算了生成树和支架路径,添加了伪节点和缝钉,将A链折叠成噬菌体头部结构,如图2所示。在此基础上,使用“乐高”积木拼接法,将折叠成头部结构的长股分成15根梁。每个梁构成头部结构的一个模块。15个模块与算法生成的引脚组合,以模块组装的方式生成噬菌体头部结构。其他三种结构类似。轴环由九个模块组成,护套由十个模块构成,底板由六个模块组成。由于组装的四个模块需要通过相应的黏性端拼接,因此分析了包括四个模块的梁的限制位置。因为每个模块之间的连接位置和连接顺序是固定的,所以必须将头部连接到上套环,下套环必须连接到上护套,下护套必须连接到基板。因此,头部和轴环顶部、轴环下端和护套顶部、护套下端和基板的限制位置应相同,三个连接位置的限制位置不应相同,以确保每个模块之间的正确连接。此外,上述三个核酸序列中必须不存在作为每个模块束的合格限制位点,以防止限制酶切割在每个模块连接期间不应断裂的束,导致模块解体。因此,需要三个不同的限制位点,这些位点在三个射束中不存在,使用Snapgene软件分析限制位点,发现了三个限制位点,AbsI(CC^TCGAGG)、BbvCI(CC^TCAGC)和XbaI(T^CTAGA)(图s1显示了限制位点的位置)。因此,使用改进的DEADALUS算法在四个模块上添加这些限制点。

(a)噬菌体头部的算法图流程:选择噬菌体头部模型,投影头部的施莱格尔图,计算施莱格尔图表上的最小生成树,将平面生成树转换为3D生成树,并在非生成树路由上添加缺口,以定义欧拉电路,根据边缘长度和是否有刻痕,在顶点和边缘添加特定的订书钉链;(b)噬菌体颈部算法流程图;(c)尾部算法流程图;(d)底板算法流程图图2 模块算法图

4.1 核酸材料

对于不同的噬菌体模块,选择不同的核酸材料以适应由梁组成的模块的长度。对于噬菌体的头部,选择PPIAP5,PPIAP5是肽基丙酰异构酶A假基因5。PPIAP5的基因ID为122 842,全长574 bp,位于智人14号染色体GRCh38的59 181 571～59 182 144位置,选择了HSBP1P1,HSBP1P2是热休克因子结合蛋白1的假基因2。HSBP1P基因的ID号为326 296,全长538 bp,位于智人4号染色体GRCh38的110 251 617～110 252 126位置,位于智人14号染色体GRCh38的53 011 929～53 012 401位置。这些核酸材料均为假基因,选择了这三个基因以避免干扰正常转录。

4.2 头部

T4噬菌体的头部需要长度为8 190 bp的碱基序列,并选择15个基于PPIAP5的射束。修改了五束,第一束的长度为154 bp。15个分散的射束被大量的针组合以形成噬菌体的头部模块。分析后,AbxI限制位点位于头部E(V14-V19),E(V13-V18),E(V12-V17),E(V16-V21),E(V15-V20)的五个侧面,以连接到颈部。由头部组成的15个模块如图3所示。

图3 由头部组成的15个模块

4.3 颈部

颈部需要长度为4 752 bp的基础序列。选择了基于HSBP1P1的九个波束。修改了六个波束,第一个波束的长度为448 bp。AbxI限制位点位于轴环E(V20-V29),E(V19-V28),E(V18-V27),E(V17-V26),E(V21-V30)的五侧,以连接至头部,BbvCI限制位点位于颈部E(V25-V4),E(V24-V3),E(V23-V2),E(V22-V1)的四侧,以与尾部连接。由颈部组成的15个模块如图4所示。

图4 由颈部组成的15个模块

4.4 尾部

尾部需要458 4 bp长度的碱基序列。选择了基于NDUFB3P3的十个波束。修改了七个波束,修改后的第一个波束为327 bp。BbvCI限制位点位于snath E(V6-V26),E(V9-V27),E(V12-V28),E(V3-V25)和E(V3-V25)的四个侧面,以连接到颈部,XbaI限制位点位于E(V1-V21),E(V4-V22),E(V7-V23),E(V10-V24)的四侧,以连接到底板。

4.5 底板

底板需要长度为3 168 bp的碱基序列。选择了基于HSBP1P1的六个波束。修改了三个波束,第一波束的长度为478 bp。XbaI限制部位位于底板E(V15-V19),E(V14-V18),E(V13-V17),E(V16-V20)的四个侧面,以连接到尾部。由底板组成的六个模块如图5所示。

图5 由底板组成的六个模块

4.6 靶结构组装

噬菌体的四个结构设计完成并添加限制位点后,应将四个单独设计的结构拼接成完整的噬菌体结构。“乐高”区块拼接用于用限制性内切酶切割靶结构的限制性位点。由于头部和颈部、尾部、底板对应于粘性末端,因此可以与DNA连接酶连接。一对一连接后,可以形成完整的噬菌体结构。

5 结论

开发了一种使用“乐高”块拼接和DNA纳米结构的计算机辅助设计来模拟T4噬菌体病毒衣壳的自组装方法,并可以通过这种方法模拟各种形状的病毒衣壳。基于自主开发系统的病毒模拟研究可以产生两种效果:首先,它在DNA设计理念上取得了突破,并开发了适合光谱基因的“乐高”块拼接,这种构建方法将为会计纳米技术提供新的学术思路;第二,DNA模拟病毒衣壳颗粒的实验组装如果成功,将改变创伤疫苗的生产方式,为开发更多的核酸奠定了基础。