纳米孔道单分子电化学信号在线识别与分析研究

2018-11-01 06:07王慧锋黄飞顾震胡正利应佚伦颜秉勇龙亿涛
分析化学 2018年6期

王慧锋 黄飞 顾震 胡正利 应佚伦 颜秉勇 龙亿涛

摘 要 为实现纳米孔道单分子检测中对微弱电流信号的快速精准处理,考察了纳米孔道实验数据的信号特征,提出了基于双缓冲数据结构和有限冲击响应滤波的实时自适应阈值法,并基于这一算法设计了纳米孔道信号在线识别与分析系统,实现了实验数据实时采集存储和信号在线分析处理的同步进行。为验证所建立的纳米孔道信号在线识别和分析系统性能,采用噪音为20~100 pA和带宽区间为3~100 kHz的仿真信号进行信号识别分析。结果表明,本系统能够满足强噪声、低带宽、高采样率(250 kHz)环境下对实验数据处理的要求。将此系统应用于单个poly(dA)4分子的Aerolysin纳米孔道分析实验中,实验结果表明,本系统能够对大数据量的纳米孔道实验数据进行实时、快速、精准的分析处理。

关键词 纳米孔道; 实时采集存储; 在线分析处理; 双缓冲区; 自适应阈值法

1 引 言

纳米孔道检测技术是一种快速灵敏、无需标记、低成本的单分子分析技术,具有巨大的应用潜力[1~3]。目前,纳米孔道已经被成功应用于DNA[4~6]、RNA[7]、蛋白质[8,9]、多肽[10,11]以及金属离子[12]等物质的研究中。纳米孔道检测平台主要包括纳米孔检测池、数据采集装置及信号处理软件3个部分。检测过程中,在外加电场的驱动下,待测物质穿越纳米孔道时会改变孔道阻抗,使得流经纳米孔道的离子电流发生变化,形成阻断事件(图1),这些事件的阻断幅值、阻断时间、频率及形状等信息是研究被测物质组成、结构的重要依据[13]。因此,通过对待测分析物穿越纳米孔道时产生的微弱(pA级别)电流数据进行基线分析和事件识别,并完成阻断事件的提取分析和统计处理(图1B),能够实现在单分子水平上对待测分析物个体行为信息的解读[14]。

为了精确地还原和分析待测物质的组成和结构等信息,一方面需要采用高精度、低噪声的电流放大器[15]结合高速数据采集仪器完成实验数据的测量和采集;另一方面需要從复杂多变的测量数据中提取有用的分析信号。现有的纳米孔道数据分析软件包括OpenNanopore[16]、Transalyzer[17]、MOSAIC[18]及本课题组研发的Nanopore Analysis[19~21]。这些软件需要在数据采集完成后才能对数据进行阻断事件检测、提取和修正等处理[16,17,20]。实验中,由于高速(采样频率>100 kHz)连续采集获取的数据量巨大(GB级别),上述处理步骤会消耗大量处理时间,降低了纳米孔道数据的分析效率。因此,研究和开发纳米孔道信号在线识别与分析系统对于纳米孔道单分子检测技术的发展和应用具有重要意义。

本研究建立了能够实时采集、识别、分析以及存储纳米孔道测量数据的在线识别与分析系统。此系统实现了纳米孔道电流阻断事件的在线识别和分析,能够在获取和存储实验数据的同时完成实验数据的处理,使得研究人员在实验过程中即可获取待测物穿过纳米孔道的统计信息。为验证此系统的实时性和准确度,采用仿真信号以及实际实验对系统进行了测试。

2 实验部分

2.1 实验设计

2.1.1 试剂 纳米孔道蛋白(Aerolysin,实验室自制);正癸烷(≥99%,美国Sigma-Aldrich公司);1,2-Diphytanoly-sn-glycero-3-phosphocholine(氯仿,≥99%,美国Avanti Polar Lipids 公司)。检测池中的缓冲液由1 mol/L KCl、10 mmol/L Tris-HCl, 1 mmol/L EDTA配制而成,pH 8.0。所有试剂均为分析纯。待测分子poly(dA)4由上海生科公司合成并通过高效液相色谱提纯。

2.1.2 仿真信号实验 采用任意波形函数发生器(AFG3052C,Tektronix公司)模拟生成仿真实验所需的带宽为3~100 kHz、噪声为20~100 pA、阻断时间为150~350 μs的仿真实验信号,并将信号输入到本研究组自主研发的纳米孔道单分子电化学工作站(Cube-D1)[22],进行实验信号的采集、调理和发送。采用自主研发的纳米孔道信号在线识别与分析系统(SmartNanopore V1.04)通过USB接口完成数据的接收与转换,对仿真信号进行在线识别、分析和存储。仿真实验的时间均设置为30 s,Cube-D1的数据采样频率为250 kHz,事件检测阈值设置为基线噪声标准差的5倍。

2.1.3 纳米孔道实验 首先,将1,2-Diphytanoly-sn-glycero-3-phosphocholine溶解于30 mg/mL正癸烷中,并涂抹在直径为150 μm的装有缓冲液的液池孔(美国Warner Instruments公司)上,形成磷脂双分子层。如图1A所示,检测池的两端分别为cis室和trans室。在cis端注射入Aerolysin蛋白单体。Aerolysin蛋白单体将在磷脂双分子层上自组装形成纳米尺寸的蛋白孔道结构。随后,在液池两端分别置入Ag/AgCl电极,在实验过程中施加100 mV的偏置电压。待测分子从cis端注入。使用Cube-D1进行电流信号采集。两个电极分别连接到的探头正负端,由Cube-D1进行电流数据的检测和传输。获取的电流数据通过USB接口连接到SmartNanopore上进行分析研究。

2.2 系统总体设计

纳米孔道信号在线识别与分析系统采用面向对象和模块化设计思想,结合Open Graphics Library(OpenGL)图形接口技术和Immediate mode graphical user interface (IMGUI)实现模式,运用C/C++混合语言编写实现。整个系统包含了USB通信模块、参数设置模块、曲线显示模块、信息记录模块以及数据分析模块等部分。

其中,USB通信模块用于数据采集装置与信号在线识别分析系统之间的指令发送以及数据传输。参数设置模块用于纳米孔道实验参数(包括采样频率、滤波频率、命令电压以及偏移校准等)的设置。曲线显示模块包含坐标设置、电流曲线以及电压曲线3个子模块,用于监测实验过程中纳米孔道阻塞情况、纳米孔道数量及物质穿孔状态等信息。信息记录模块用于记录原始实验数据、阻断事件信息及阻断电流数据,用户可以根据需求选择需要保存的内容。数据分析模块采用基于双缓冲结构的实时自适应阈值法(详细分析见2.3节数据分析模块)完成对阻断事件的检测,从而获取局部电流基线、起始位置、终止位置、阻断幅值、阻断时间等阻断事件基本信息[16~18,20,23]。

2.3 数据分析模块

纳米孔道测量数据的采集实验呈现频率快、数量多、噪音大等特点,给数据分析模块的设计和实现带来了挑战。为了实时精确地完成阻断事件的识别和分析,数据分析模块在设计时考虑了实时性、稳定性、快速性等原则,其具体的模块功能结构如图2所示。首先,本模块设计了双缓冲结构来解决高速采样数据的实时缓存问题。双缓冲结构借鉴了乒乓缓存(Ping-pong buffers)技术[24]的工作原理,缓冲区1与缓冲区2交替接收来自USB通信模块的实验数据,同时另一缓冲区的数据用于进行阻断事件的识别和分析。通过缓冲区1与缓冲区2之间的配合和切换,提高实验数据的缓存和处理速度,实现数据的无缝传输和处理。此结构的使用简化了阻断事件识别分析算法的设计流程,节约了缓存数据的内存空间,从而降低了分析模块对硬件资源的消耗,确保数据的实时快速处理。

对于双缓冲结构中缓存的纳米孔道电流数据,需要根据数据特征设计适当的分析算法来实时完成对阻断事件的识别、提取和分析。在纳米孔道离线分析软件中,通常采用阈值法[16,17,20]进行阻断事件识别。然而,传统阈值法需要预知电流基线等先验信息,并且计算复杂度高、耗时长,无法满足在线识别的要求。为此,本研究根据在线处理要求对传统阈值法进行了改进,引入了有限冲击响应滤波(FIR filter)方法[25]对电流基线进行降噪分析,并据此设计了用于阻断事件在线识别分析的实时自适应阈值法。

实时自适应阈值法针对测量数据的基线、噪声以及形态特征进行了定制化改进。文献[16,17,20]中指出,纳米孔道的测量数据满足公式(1):

所提出的自适应阈值法在进行阻断事件分析时,首先根据采集的电流基线数据计算出基线的平均值,作为FIR法追踪电流基线变化的初始值Ibaseline(t-1)。此后,所述阈值法根据式(4)自适应跟踪电流基线变化。当检测到低于设定阈值的阻断事件时,所述阈值法会从FIR法分析电流基线过程切换到阻断事件信息分析过程。在进行阻断事件信息分析时,阻断事件的局部电流基线保持事件发生前的数值不变,以此来保证电流基线数据分析的准确性。此外,所述阈值法引入了本研究组近期提出的二阶差分校正法(DBC)和电流积分法[20]以实现对不同持续时间的阻断事件进行分析。

基于双缓冲结构和FIR法的自适应阈值法能够实时扫描缓冲区中的实验电流数据并跟随基线的波动,当出现低于设定阈值的阻断事件时,能立即从原始实验数据中定位、识别、回溯和追踪得到完整的阻断事件数据,并同步进行阻断事件基本信息的分析和记录。

3 结果与讨论

3.1 仿真信号的产生

首先采用仿真信号进行性能测试。生物纳米孔道实验获取的阻断事件的阻断幅值(ΔI)通常为101~102 pA,阻断时间(Δt)在102 μs级别。因此,在仿真实验时,本研究采用ΔI=100 pA, Δt分别为150、200、250、300及350 μs的仿真信号进行测试。为了更真实地模拟实际实验信号,在生成仿真信号时考虑了噪声以及带宽对信号形态的影响。噪声的影响会造成阻断事件电流幅值上的变化,图3A为5种不同电流噪音峰-峰值(Ip-p)的仿真信号(Δt=300 μs),其附加的噪声均为高斯白噪音。5种噪音的谱密度曲线如图3B所示,由于未进行低通滤波,在大于1 kHz的高频区域噪音具有较高能量,且噪音越大,在频域的能量越高,相比实际实验系统有更高的噪音[15,26]。带宽(fC)的影响会导致阻断事件波形上升沿和下降沿的变化(图3C所示,Ip-p=40 pA, Δt=300 us), 系统带宽越低,事件波形的畸变程度越大。

3.2 噪声对系统性能的影响

纳米孔道采集的实验信号为pA级微弱电流,易受检测装置及其周围环境的影响而引入噪声。噪声的增加会给阻断事件的识别与分析带来困难。为检验所述系统在噪声干扰下的准确度,采用函数发生器分别生成图3A所示的不同噪音(20~100 pA)下的阻断事件(fC=10 kHz, Δt为150~350 μs)各3000个进行实验。采用本系统进行数据采集和信號分析,分析结果以文件的形式实时存储在计算机中。对系统识别的阻断事件信息进行统计分析,得出噪声影响下阻断事件检出数、电流基线以及阻断幅值的误差率结果,如图4所示,其误差率均采用公式(5)计算得出:

Error rate=|ValueR-ValueI|ValueI×100%(5)

其中,ValueR表示由数据分析模块得出的阻断事件信息的实际值, ValueI表示阻断事件信息的理想值。

由图4A可见,当Ip-p≤60 pA时,事件检出数误差率<0.2%。随着噪声增加到100 pA,阻断事件检出数误差率会由于误检测事件数的增加而上升,但始终维持在1%以下。仿真实验的电流基线Ibaseline理想值为100 pA。实验时,为了滤除噪声对基线的影响,电流基线是通过对FIR法分析出的阻断事件局部电流基线进行高斯拟合得出的。噪声对电流基线的影响如图4B所示,信号中噪声强度的增加会使基线检测误差增大。比较图4B中Δt为150~350 μs的仿真信号实验结果可知,Δt=350 μs的阻断事件受噪声影响程度最小,在Ip-p=100 pA时其误差率仅为0.4%;Δt=150 μs的事件受噪声影响程度最大,但在Ip-p=100 pA时其误差率也仅为1.1%。通过对不同噪声环境下阻断幅值的实际值和理想值进行分析,进一步得出了阻断幅值检测的误差结果,如图4C所示,系统对阻断幅值的检测会受到噪声的影响,噪声越大,检测误差越大,其最大误差≤3%。综合图4的研究结果可知,在实际实验条件下(Ip-p≤40 pA),本系统能够将误差控制在1.5%以内。

3.3 带宽对系统性能的影响

在纳米孔道检测实验中,为了滤除检测数据中高频噪声的干扰,通常会在数据采集装置中加入不同截止频率的低通滤波器,其滤波频率一般设置为3、5、10及100 kHz等。低通滤波会导致阻断事件的上升时间Tr发生变化[20,23],这一变化导致的波形畸变会对阻断事件的分析产生影响。为了研究本系统在不同带宽下的性能,对图3C所示的5种带宽下的仿真信号进行了采集和处理实验,结果如图5所示。

由圖5A可见,带宽会对阻断事件检出数产生影响。带宽越低,事件受带宽影响产生的畸变越大,阻断事件检出数误差率越高。当带宽>10 kHz时,阻断事件检出数误差率≤0.1%。为了评估不同带宽对阻断时间的影响,本研究计算了阻断时间平均相对误差率(Mean relative error rate,MRER):

其中,N为一次实验中相同阻断时间的阻断事件检出数,ΔtR为系统分析得出的阻断时间,ΔtI为阻断时间的理想值。不同带宽对阻断时间检测的影响如图5B所示,带宽越低,系统检测阻断时间的误差越大,带宽为3 kHz时,MRER的最大值约为6%。随着带宽的增大,MRER会逐渐降低。这一结果说明带宽降低导致的阻断事件上升时间Tr的增加会对系统的检测性能产生影响。同时,对比图5B中阻断时间不同的事件的分析结果可知,时间越短的事件受带宽影响产生的误差越大,反之时间越长的事件受带宽影响越小。图5表明,在实际实验带宽下(3~10 kHz),系统检测性能受带宽影响程度较大,但其误差均在6%以内。综合图4和图5的分析结果可知,本系统能够满足实验环境下对纳米孔道测量数据的实时分析要求。

3.4 Aerolysin纳米孔道信号在线识别与分析

为了测试纳米孔道信号在线识别与分析系统在采集和分析实际实验数据时的性能,本研究采用Aerolysin纳米孔进行了poly(dA)4分子的纳米孔道分析实验。 Cube-D1的截止频率设置为10 kHz,采样频率设置为250 kHz,系统检测阈值设置为基线噪音标准差的5倍。实验中采集的原始电流数据、系统数据分析模块识别的阻断事件数据以及分析得出的阻断事件信息均保存在计算机的硬盘中。

图6A是poly(dA)4分子的Aerolysin纳米孔道分析实验中采集到的一段时间为4 s的原始电流数据,其基线数据的噪音谱密度曲线如图6B所示,对比图3B可知,实验信号的噪音在高频区域的能量低于仿真信号,因此本研究所述算法能够满足实验噪声下的分析要求。在采集原始电流数据的同时,系统的数据分析模块实时对原始数据的基线进行分析,

得出平稳的局部电流基线(图6A中白色曲线所示)。根据局部基线和设定的阈值,本系统能够在采集存储数据时同步进行阻断事件识别分析。在图6A所示的这段原始数据中, 共检测到30个阻断事件(红色标记)。图6C中蓝色曲线示出了图6A中检测到的第10个阻断事件(典型阻断事件),系统分析模块得出其局部电流基线值为45.71 pA,阻断幅值为23.81 pA,阻断时间为5.764 ms。对比原始电流数据(蓝色)和算法分析结果(红色)可知,系统能够准确分析出这类事件的阻断基本信息。图6D是系统检测到的阻断时间较短的阻断事件(蓝色),由于实验仪器的低通滤波影响,这些短事件波形会发生畸变[20]。系统的数据分析模块实时采用二阶差分校正法和电流积分法分别对其阻断时间和阻断幅值进行了校正,校正后得到的分析结果如图6D中红色曲线所示。最后,根据系统在10 min内采集和分析得到的阻断事件基本信息进行了统计处理,得出阻断时间-阻断电流散点图(图6E),处理结果与文献\[3\]中采用MOSAIC软件分析出的实验结果基本一致。

图6表明,本研究所提出的在线识别与分析系统能够在实验数据采集记录的同时,实时分析得出阻断事件及其相关信息,显著提高了纳米孔道电流信号的处理效率。

4 结 论

设计了一种基于实时自适应阈值法的纳米孔道信号在线识别与分析系统。相比于传统的纳米孔道数据离线分析软件,本系统能够在采集纳米孔道实验数据的同时完成对阻断事件的识别和分析,显著提高了实验数据的分析处理效率。仿真实验和实际实验结果表明,系统性在高噪声和低带宽环境下能够保持稳定,满足实验数据处理的精度要求。本研究为纳米孔道数据分析处理系统的研究提供了新思路,对于纳米孔道单分子检测技术的发展具有促进作用。

References

1 Kasianowicz J J, Brandin E, Branton D, Deamer D W. Proc. Natl. Acad. Sci. USA, 1996, 93(24): 13770-13773

2 Clarke J, Wu H C, Jayasinghe L, Patel A, Reid S, Bayley H. Nat. Nanotechnol., 2009, 4(4): 265-270

3 Cao C, Ying Y L, Hu Z L, Liao D F, Tian H, Long Y T. Nat. Nanotechnol., 2016, 11(8): 713-718

4 Simpson J T, Workman R E, Zuzarte P C, David M, Dursi L J, Timp W. Nat. Methods, 2017, 14(4): 407-410

5 Loose M, Malla S, Stout M. Nat. Methods, 2016, 13(9): 751-754

6 Ying Y L, Long Y T. Sci. China Chem., 2017, 60(9): 1187-1190

7 Ayub M, Hardwick S W, Luisi B F, Bayley H. Nano Lett., 2013, 13(12): 6144-6150

8 Hsu W L, Daiguji H. Anal. Chem., 2016, 88(18): 9251-9258

9 YING Yi-Lun, ZHANG Xing, LIU Yu, XUE Meng-Zhu, LI Hong-Lin, LONG Yi-Tao. Acta Chim. Sin., 2013, 71(1): 44-50

應佚伦, 张 星, 刘 钰, 薛梦竹, 李洪林, 龙亿涛. 化学学报, 2013, 71(1): 44-50

10 Ying Y L, Li D W, Liu Y, Dey S K, Kraatz H B, Long Y T. Chem. Commun., 2012, 48(70): 8784-8786

11 Asandei A, Schiopu I, Chinappi M, Chang H S, Park Y, Luchian T. ACS Appl. Mater. Interfaces, 2016, 8(20): 13166-13179

12 Mayne L J, Christie S D, Platt M. Nanoscale, 2016, 8(45): 19139-19147

13 Ying Y L, Cao C, Long Y T. Analyst, 2014, 139(16): 3826-3835

14 CAO Chan, LIAO Dong-Fang, YING Yi-Lun, LONG Yi-Tao. Acta Chim. Sin., 2016, 74(9): 734-737

曹 婵, 廖冬芳, 应佚伦, 龙亿涛. 化学学报, 2016, 74(9): 734-737

15 YAN Bing-Yong, GU Zhen, GAO Rui, CAO Chan, YING Yi-Lun, MA Wei, LONG Yi-Tao. Chinese J. Anal. Chem., 2015, 43(7): 971-976

颜秉勇, 顾 震, 高 瑞, 曹 婵, 应佚伦, 马 巍, 龙亿涛. 分析化学, 2015, 43(7): 971-976

16 Raillon C, Granjon P, Graf M, Steinbock L J, Radenovic A. Nanoscale, 2012, 4(16): 4916-4924

17 Plesa C, Dekker C. Nanotechnology, 2015, 26(8): 1-7

18 Forstater J H, Briggs K, Robertson J W F, Ettedgui J, Marie-Rose O, Vaz C, Kasianowicz J J, Tabard-Cossa V, Balijepalli A. Anal. Chem., 2016, 88(23): 11900-11907

19 Zhang N, Hu Y X, Gu Z, Ying Y L, He P G, Long Y T. Chin. Sci. Bull., 2014, 59(35): 4942-4945

20 Gu Z, Ying Y L, Cao C, He P G, Long Y T. Anal. Chem., 2015, 87(2): 907-913

21 Gu Z, Ying Y L, Cao C, He P G, Long Y T. Anal. Chem., 2015, 87(20): 10653-10656

22 Gu Z, Wang H F, Ying Y L, Long Y T. Sci. Bull., 2017, 62(18): 1245-1250

23 Pedone D, Firnkes M, Rant U. Anal. Chem., 2009, 81(23): 9689-9694

24 Swaminathan K, Lakshminarayanan G, Ko S B. IEEE ISED, 2012: 72-76

25 Morales L J, Shmaliy Y. IEEE Lat. Am. T., 2010, 8(1): 9-16

26 Gao R, Ying Y L, Yan B Y, Long Y T. Chin. Sci. Bull., 2014, 59(35): 4968-4973

Abstract To achieve fast and accurate analysis of weak current signal of nanopore-based single molecule detection, we designed a real-time adaptive threshold data processing algorithm with data buffering technique and finite impulse response filtering. The system, which is designed based on the data processing algorithm, could realize real-time recognition and analysis of nanopore events during the data recording process. In order to verify the performance of the system, the ideal signals with different noise level (20-100 pA) and recording bandwidth (3-100 kHz) was generated. The results showed that the system was stable to analyze the generated signals even at high noise. In addition, the system was also suitable for the data recording conditions of low bandwidth and high sampling rate (250 kHz). The proposed nanopore data processing system was further applied in the Aerolysin nanopore experiment for the detection of poly(dA)4 molecules. The results showed that the data processing system could be applied in real nanopore recording system with high accuracy and speed.

Keywords Nanopore; Data acquisition and storage; Real-time data analysis and processing; Data buffering; Adaptive threshold algorithm

(Received 4 December 2017; accepted 27 December 2017)