吴 涛,郭冰洁,董亚非,
(1.陕西师范大学 计算机科学学院,陕西 西安 710119;2.陕西师范大学 生命科学学院,陕西 西安 710119)
电子计算机作为20世纪最重要的科技发明之一,经过几十年的迅猛发展,逐渐成为人类社会不可或缺的一部分。然而,随着人们对于计算机的速度以及信息存储能力的要求越来越高,电子元器件的发展逐渐接近其物理极限。研究者们亟待找到新型材料来替代传统的硅基材料。
经过进一步研究,DNA的高度并行性、易操作、高存储的特性进入了大家的视野。因为DNA具有精确的分子识别能力和极强的信息存储能力,所以以核酸分子生物学特性为基础来构建分子级别的布尔逻辑门[1]并实现相关逻辑运算,成为近年来分子计算机科学和分子生物学交叉产生的新兴科研领域,并在生物医学以及计算机科学领域起到了一定的指导意义,引起了研究者的广泛关注[2]。
与传统的计算机材料相比,生物分子整体具有很强大的并行反应计算性;生物分子之间的相互杂交使得它运算时能够保持很高的稳定性;更为重要的是,作为组成DNA分子的含氮碱基:腺嘌呤(adenine,A),胸腺嘧啶(thymine,T),胞嘧啶(cytosine,C)和鸟嘌呤(guanine,G)之间具有严格的配对形式—A-T,G-C。因此核酸材料凭借这些优势使得研究新型逻辑结构、电路甚至计算机体系成为可能。
1961年,Richard Feynman[3]从理论上描述了在分子水平上构造亚微观计算机的可能性。1994年,美国科学家Adleman[4]通过DNA序列的方法来解决著名的NP完全问题——Hamilton Graph,由此开创了DNA计算[5]的先河。
以DNA和相关生物酶为基本材料的DNA计算是利用某些生化反应模拟某些问题的求解运算过程的新型分子生物计算方法。其核心就是将编码的DNA链作为输入信息,在特殊的生物平台上经过一定时间的可控生化反应后,通过分析反应产物进而得出问题的最优解[6]。因此DNA计算有望解决目前电子计算机无法解决的问题,诸如一些NP-完全问题、破译密码问题等等。
目前,国内外在DNA计算领域内的研究成果颇多,大大促进了数学、化学、物理学以及计算机科学和生物科学的相互融合。DNA自组装[7]作为DNA计算的理论基础之一,因此研究人员基于其特性来解决最大团问题[8]、N皇后问题[9]、多维背包问题[10]、二部图完美匹配问题[11]、最大匹配问题[12]等等。另外,研究者们还利用DNA计算进行图像加密[13],Xp模型检测[14]、可满足性问题[15]以及逻辑门的构建[16-18]。随之产生了一系列相关技术被运用到这个新的领域中,例如DNA杂交、DNA链置换技术、荧光标记技术等等。其中DNA链置换技术[19-20]最为瞩目,原因在于它的自发性,特异性识别,高度的灵敏性以及准确性使之成为DNA计算的基础之一。而作为检测分子计算是否进行的荧光标记技术也得到了长足的发展。
文中拟通过荧光标记技术以形成茎环结构[21]构建与非逻辑门,在该逻辑系统中,将365 nm波长光照以及Hg2+作为输入信号,可通过碱基互补配对形成茎环结构的线性单链DNA分子作为输出信号,结合荧光标记技术实现对输入信号的精确检测。接下来,利用形成的茎环结构进一步构建逻辑半加器。在此逻辑系统中,设计的线性单链DNA分子作为输入信号,茎环结构的环区域具有DNA识别区域,使得特设的线性单链DNA可以将茎环通过链置换反应而打开,再结合荧光标记技术实现对输出的精确检测。
DNA链置换技术是DNA分子计算的基础之一,凭借着自身的能级引发性、特性识别性、准确与灵敏来实现DNA链的释放与结合。目前此技术已经在生物计算领域中得到了广泛的应用。
DNA链置换反应开始于立足点区域的识别与杂交,通过分支迁移的过程将目标链输出,最终形成更为稳定的多链结构[22-23]。DNA链置换一般有可逆的链置换反应与不可逆的链置换反应两种表现形式[24]。不同形式的DNA链置换原理如图1所示[25]。
图1 DNA链置换原理
荧光标记技术指利用一些能发射荧光的物质共价结合或物理吸附在所要研究分子的某个基团上,利用它的荧光特性来提供被研究对象的信息。生物分子计算领域通过检测标记在基团上荧光分子的荧光强度相对变化量来做出某种判断。荧光猝灭是荧光基团与猝灭基团之间产生荧光能量共振转移[26]作用,主要表现是:
(1)当荧光基团与猝灭基团相互接近时,两基团之间的相互作用增强,荧光信号削弱乃至消失;
(2)当荧光基团与猝灭基团相互远离时,两基团之间的相互作用减弱,荧光信号得以重新恢复。
相对应的荧光标记原理如图2所示。
图2 荧光标记技术原理
与非门[27]是数字电路的一种基本逻辑电路。它可以看作是由“与”门和“非”门组合而成,具有两个输入信号和一个输出信号。总而言之,在数字电路中若输入均为高电平(1),则输出为低电平(0);若输入中至少有一个为低电平(0),则输出为高电平(1)。其操作见图3(c)。
6-羧基荧光素(6-carboxyfluorescein,FAM)是一种常用于标记DNA链的荧光染料,苯甲酸(Carboxybenzene,Dabcyl)则是作为猝灭基团标记DNA链。胸腺嘧啶T可以被6-硝基胡椒基甲醛(6-nitro piperonyl oxymethylene,NPOM)所包裹,被包裹的T在受到波长为365 nm的光照射后便会释放出来[28]。Hg2+能够绑定T-T碱基对,使其错配形成稳定的T-Hg2+-T结构[29]。
如图3(a)所示,在分子与非门的设计中,其初始状态是由可形成茎环结构的线性单链DNA构建。该单链DNA包含a、b、c、d、a15个部分。其中a区域与a1区域个别碱基互补,并且a区域的T碱基被NPOM包裹。在a区域也即单链的5’端用Dabcyl荧光猝灭基团进行修饰,a1区域也即单链的3’端用FAM荧光基团进行修饰。起初,荧光基团与猝灭基团相互远离,故而荧光强度不变;当荧光基团与荧光猝灭基团结合之后,体系中荧光的强度会相应减弱。在该系统中,输入信号是365 nm波长光照以及金属Hg2+离子,通过对荧光信号的检测判断输出结果。反应结束后,若能检测到荧光信号,表明输出结果为逻辑值1,否则输出结果为逻辑值0。
图3 逻辑与非门操作机制
在上述分子逻辑操作中,只有当两个输入信号都存在时,没有荧光信号出现,与非门的操作有4种方式:
(1)当体系中只有单链DNA存在时,即输入(0,0)。也就是没有任何信号输入时,荧光信号存在,逻辑输出值为1。
(2)当只有365 nm波长的光照照射时,即输入(0,1)。a区域中被NPOM包裹的T碱基暴露出来,但是由于a区域与a1区域并不能完全互补配对,所以猝灭基团与荧光基团并未结合,荧光信号依然存在,逻辑输出结果为1。
(3)当只有金属Hg2+离子加入体系当中,即输入(1,0)。由于a区域的T碱基被包裹,无法与a1区域的T碱基错配成T-Hg2+-T的结构,所以a区域与a1区域仍旧不能实现完全配对,荧光信号依然存在,逻辑输出结果为1。
(4)当365 nm波长光照与金属Hg2+同时存在时,即输入(1,1)。暴露出来的T碱基错配成T-Hg2+-T结构,a区域与a1区域实现完全配对,单链DNA形成茎环结构,荧光基团与猝灭基团结合,荧光信号减弱甚至消失,逻辑结果输出为0。
半加器电路是指对两个输入数据位相加,输出一个结果位和进位,没有进位输入的加法器电路,是实现两个一位二进制数的加法运算电路。它的运算可以看作是逻辑“异或”门与逻辑“与”门组合进行并行计算的过程。其中,“异或”门的输出结果为和位,“与”门的输出结果当进位。半加器的计算过程见图4(C)。
G-四链体是由富含鸟嘌呤碱基G的DNA或RNA序列形成的一种特殊的核酸二级结构[30]。G-四链体DNA酶则是由G-四链体与氯化血红素(Hemin)结合后形成的具有辣根过氧化物酶活性的DNA酶[31]。这种DNA酶可催化双氧水(H2O2)氧化3,3',5,5'-四甲基联苯胺(TMB)产生肉眼可见的可溶性蓝色产物[32]。
如图4(a)所示,在半加器的设计中,其初始状态为与非门产生茎环结构。茎环结构中的b和c区域都有识别区域,可以分别与设计的Ha-In1与Ha-In2两条DNA单链的c*区域与b*区域互补。链Ha-In1与链Ha-In2互补,并且链Ha-In1的5’端与链Ha-In2的3’端富含G碱基,可以相互反应生成G-四链体结构。在该系统中,输入信号是单链DNA,通过检测荧光信号来判断输出结果,反应结束时,如果能检测到荧光信号,则判断输出结果为逻辑值1,否则逻辑值为0。
在上述分子逻辑操作中,如果没有输入信号,逻辑值为0;如果有输入信号,逻辑值为1。半加器的操作有4种方式:
(1)当体系中没有任何输入时,即输入为(0,0)。茎环结构(M)中荧光基团与猝灭基团结合,没有荧光信号发出,逻辑输出结果为(0,0)。
(2)当输入链Ha-In1时,即输入为(0,1)。链Ha-In1与茎环结构(M)结合形成双链,通过链置换反应将茎环结构打开,荧光基团与猝灭基团分离,从而产生荧光基团FAM产生荧光。逻辑输出结果为(0,1)。
(3)当输入链Ha-In2时,即输入为(1,0)。链Ha-In2与茎环结构(M)结合形成双链,通过链置换反应将茎环结构打开,荧光基团与猝灭基团分离,从而产生荧光基团FAM产生荧光。逻辑输出结果为(0,1)。
(4)当输入链Ha-In1与链Ha-In2时,即输入为(1,1)。链Ha-In1与链Ha-In2之间相互反应配对,富含G碱基的一端形成G-四链体结构,该结构与Hemin结合从而促进H2O2氧化TMB为蓝色的TMB+。茎环结构未被打开,荧光基团与猝灭基团相互作用,没有荧光信号发出,逻辑输出结果为(1,0)。
文中涉及到的DNA链是利用NUPACK仿真软件[33]设计得出,如表1所示。在序列设计的过程中,以碱基互补配对为原则,并结合模型的需要,进行些许调整。
图4 半加器操作机制
DNA链序列编码(5’-3’)a b c d a1Dabcyl-GAT*CGT* GCAC CAGCTG CACT TCGTTC-FAMHa-In1(gfa1*d*c*e)GGGT ATTAATG GAACGA CGTA CAGCTG GTAHa-In2(e*c b*a*f*h)TAC CAGCTG GTCG ACGTTC CATTAAT TGGGCGGGAAGGG
基于DNA链置换技术,以单链DNA作为基本计算材料,结合重金属离子与DNA之间的特殊反应,通过荧光标记技术构建组成复杂逻辑电路的组成单元—逻辑门。在简单逻辑门的基础上寻求构建更加稳定的DNA分子计算逻辑模型,以实现可组装的功能化的DNA分子逻辑组件。随着技术的进步,DNA计算理论还将继续蓬勃发展,DNA计算模型也可能终将走出试管,走向标准化的DNA计算芯片。DNA计算中的“图灵机”或许就诞生于不久的将来,生物计算时代的明天会更加美好。