第二代基因测序仪的硬件设计

2017-04-12 09:18韩九强吴思佳刘瑞玲吕红强钟德星
生命科学仪器 2017年1期
关键词:碱基试剂基因组

韩九强,吴思佳*,刘瑞玲,吕红强,钟德星

(西安交通大学电子与信息工程学院,西安,710049)

第二代基因测序仪的硬件设计

韩九强,吴思佳*,刘瑞玲,吕红强,钟德星

(西安交通大学电子与信息工程学院,西安,710049)

随着基因序列分析研究的深入,中短基因片段的快速准确测序已经成为生物信息研究的瓶颈。本文针对第二代基因测序仪的硬件设计问题,在深入研究第二代基因测序原理和流程的基础上完成了硬件总体方案设计。此方案采用自上而下逐步分解的方法,设计了流动槽、PCR、边合成边测序、控制与数据传输等硬件模块,继续分解设计了温度控制、试剂控制、激光触发、光学采集、扫描控制等硬件子模块,并根据各个子模块的功能和厂商的产品说明书完成了部分关键器件的选型。为后续基因测序仪的机械结构设计和硬件组装奠定了基础。

生物信息学;基因测序仪;边合成边测序;硬件设计

引言

随着科学技术的进步,在大批量测序任务处理中,第一代测序法易受成本高、速度慢、通量低等因素的限制,越来越无法满足科学研究和生产应用的需要。于是,以Roche公司的454技术[1,2]、Illumina公司的Solexa技术[3]和ABI公司的SOLiD[4]为标志的第二代基因测序技术应运而生。与第一代基因测序技术相比,第二代基因测序技术在实现高通量测序的同时,不仅保持了较高的准确度,而且大大降低了测序成本并极大地提高了测序速率[5]。第二代基因组技术对于揭示基因组的结构和功能有重要的推动作用,在功能基因组、系统生物学、药物基因组等的研究中有广泛的应用[6-8]。

1 测序流程

第二代基因测序技术有多种实现平台,但它们的测序流程在概念上是相似的,均包括文库制备、乳液或桥式PCR扩增和合成或连接测序等过程。我们以Solexa测序技术为例研究第二代基因测序流程,如图1所示。测试流程主要包括测序试剂的准备、边合成边测序(包含合成反应和光学图像采集处理流程)、序列拼接组装三个阶段。具体内容将在如下介绍。

1.1 测序试剂的准备

测序试剂的准备主要包含DNA提取、DNA碎片化、DNA片段处理和PCR扩增4个阶段。DNA提取:通过研磨敲碎、超声波、冷融、碱或酶等方法裂解细胞,加入去污剂、蛋白酶、醋酸盐等试剂去除掉膜脂和蛋白质等杂质,最后利用吸附材料结合法、浓盐法、有机溶剂抽提法或密度梯度离心法等获得DNA溶液[9]。DNA碎片化:使用超声仪器等设备将DNA随机打断成片段。DNA片段处理:DNA片段经过末端修饰等操作后固定到流动槽的接头上。PCR扩增[10]:在流动槽上,通过对温度、试剂等参数的控制,使得流动槽上之前通过接头固定的每一个DNA片段都完成了上万倍的复制形成了簇,完成DNA扩增。

图1 第二代基因测序流程Fig. 1 process of next-generation sequencing

1.2 边合成边测序

边合成边测序是第二代基因测序能够大规模并行的关键。边合成边测序主要包括合成反应碱基延伸、荧光激发及信号收集、剪切3个步骤。合成反应碱基延伸:利用ddNTP(ddATP, ddCTP, ddGTP, ddTTP)完成合成反应,ddNTP具有终止DNA链延伸的作用,待测片段在每一个反应中会生成不同长度的终止于该反应中包含的ddNTP的碱基片段。荧光激发及信号收集:四种碱基参与合成反应,由于结合不同的ddNTP在激光照射下会发出不同频率的荧光信号,光学采集系统扫描记录下这些荧光,经过一定的去噪等处理,通过计算机软件等将光信号转化为测序峰值信号,获得一定长度的碱基读取Read。剪切:采集信号完成后,关闭激光,用剪切剂去除测序序列延伸产物上的碱基所标记的荧光基团,为下一轮测序做准备。这三个步骤依次循环直至达到人为指定的最高循环次数,即每个测序片段的读长。

1.3 序列拼接组装

获得的碱基读取Read的长度较短,需要通过贪婪算法[11]、基于De Bruijn图的算法[12]等方法并结合已有的信息完成序列的拼接工作,以得到更长的Contig甚至完整的待测基因序列,或者将Read比对到已有的基因组或者相近物种基因组上。这一部分是计算机软件部分的工作内容,其具体过程在本文中不做详细介绍。

图2 基因测序仪硬件总体方案Fig.2 Hardware design of next-generation sequencing instrument

表1 硬件需求表Tab.1 hardware requirements

表2 硬件选型表Tab.2 hardware selection

2 硬件设计

依据基因测序流程,可以将基因测序仪的硬件结构按照所完成的功能划分到不同的模块中。基因测序仪的硬件总体结构方案如图2所示。

2.1 流动槽模块

流动槽也叫做基因芯片[13,14],是基因测序流程中PCR扩增和边合成边测序的场所。在流动槽的横向分布着两条长方形的通道Lane。每条Lane上等间隔地分布着数十个布置有接头的方形块Tile,当待测DNA试剂流过Tile上方的时候,DNA片段被以共价键的形式随机地固定在Tile的接头上。流动槽被固定在流动槽固定台上。

2.2 PCR模块

PCR模块控制DNA片段完成PCR扩增,包括温度控制和试剂控制两个子模块。在温度控制子模块中,4个温度传感器均匀地分布在流动槽上,实时获得扩增过程的温度,并根据PCR扩增中高温变性、低温退火和适温延伸三个阶段所需的温度不同[15,16],接收控制与数据传输模块命令,控制电热片和制冷片2个执行器的工作。在试剂控制子模块中,2个流量传感器实时获得扩增过程中原料供给情况,并根据PCR扩增中不同阶段所需试剂和PH值不同,接收控制与数据传输模块命令,控制试剂泵的开启及向2条Lane泵入原料试剂的流量,使得PCR扩增获得所需的原料和合适的PH环境。

2.3 边合成边测序模块

边合成边测序模块完成合成反应和光学图像采集处理两个工作。类似PCR模块,合成反应不同阶段所需温度和试剂也不同,需要温度控制子模块和试剂控制子模块控制电热片、制冷片和试剂泵为合成反应提供合适温度和所需的原料。光学图像采集处理则需要激光触发子模块、光学采集子模块和扫描控制子模块的协同工作。在激光触发子模块中,红激光光源对应A, C碱基,绿激光光源对应G, T碱基。在光学采集子模块中,四组滤光片分别对应四种碱基反射的荧光,四个光学CCD相机分别采集记录相应的荧光信号,并传输给控制与传输子模块中转化为峰值信号继而获得对应的序列碱基。在扫描控制子模块中,两个位移传感器获得流动槽固定台在X和Y轴中的位置,接收控制与传输子模块的命令,控制步进电机,移动流动槽固定台,以获得流动槽上所有Tile定期循环结果。

2.4 控制与传输模块

控制与传输模块是基因测序仪的逻辑控制中心和图像数据处理中心。向下,控制与数据传输模块接收来自上位机的控制信息,依据上位机的指令,通过仪器控制子模块命令具体的执行器执行一些特定的动作;向上,控制与数据传输模块接收光学采集子模块获得的荧光信号,通过图像处理子模块转化为碱基数据,并通过数据上传子模块将这些碱基数据和基因测序仪器的状态信息传给上位机。

3 硬件选型

将基因测序仪的硬件划分为各个子模块后,了解各个子模块中传感器、执行器需求和参数,如表1所示。通过查询各个厂商产品的说明书,选择各个传感器和执行器,如表2所示。控制与输出模块选择一块带有网卡和多个其他接口的控制板并且安装运行Linux 2.6内核操作系统,这样驱动程序的书写简化为Linux内核模块的编写,控制和数据传输程序也简化为在Linux平台上开发网络数据传输程序,同时,由于Linux系统对硬件的要求不高,可以降低基因测序仪的硬件成本。

4 结论与展望

本文研究了基因测序技术的原理和流程,详细地了解了基因测序仪的各个硬件部分及其需要完成的功能,对基因测序仪的硬件结构进行了模块化的划分,且完成了一些关键硬件器件的研究和选型。随后需要对基因测序仪的硬件部分进行下一步的机械结构设计等,并在这些结构设计完成后,采购需要的硬件来组装成完整的基因测序仪以验证硬件设计的正确性。

致谢

本论文的完成离不开西安交通大学各位老师和同学的帮助,特别感谢谢盼、朱异灵等对本论文提出的意见和建议。

[1] Rothberg J M, Leamon J H. The development and impact of 454 sequencing [J]. Nature Biotechnology, 2008, 26(10): 1117-1124.

[2] Margulies M, Egholm M, Altman W E,et al. Genome sequencing in open microfabricated high-density picoliter reactors [J]. Nature, 2005, 437(7057): 376--380.

[3] Bentley D R, Balasubramanian S, Swerdlow H P,et al. Accurate whole human genome sequencing using reversible terminator chemistry [J]. Nature, 2008, 456(7218): 53-59.

[4] Valouev A, Ichikawa J, Tonthat T,et al. A high-resolution, nucleosome position map of C. elegans reveals a lack of universal sequence-dictated positioning [J]. Genome Research, 2008, 18(7): 1051-1063.

[5] Shendure J, Ji H. Next-generation DNA sequencing [J]. Nature Biotechnology, 2008, 26(10): 1135-1145.

[6] Ouyang Z, Zhou Q, Wong W H. ChIP-Seq of transcription factors predicts absolute and differential gene expression in embryonic stem cells [J]. Proceedings of the National Academy of Sciences, 2009, 106(51): 21521-21526.

[7] Taylor K H, Kramer R S, Davis J W,et al. Ultradeep bisulfite sequencing analysis of DNA methylation patterns in multiple gene promoters by 454 sequencing [J]. Cancer Research, 2007, 67(18): 8511-8518.

Hardware Design of Next-generation Sequencing Instrument

Han Jiuqiang, Wu Sijia*, Liu Ruiling, Lv Hongqiang, Zhong Dexing
(School of Electronic and Information Engineering, Xi’an Jiaotong University, Xi’an 710049)

With the development of genomics, fast and accurate short DNA fragments sequencing has become the bottleneck of bioinformatics research. In this paper, theory and method of high throughput sequencing is deeply studied. Based on top-down policy, four modules and eight sub-modules have been designed, which are flow cell, PCR, sequencing-by-synthesis and control modules with temperature control, reagent control, laser control, optical collection, scanning control, device control, image processing and data transmission sub-modules. In the end, the main hardware parts have also been selected according to the functions of submodules and product specification. This work will be the basis of further mechanism design and hardware assembling of sequencing instrument.

bioinformatics; DNA sequencing instrument; Sequencing-by-Synthesis; Hardware design

TP183

A

10. 11967/ 2017150110

TP183

A DOI:10. 11967/ 2017150110

高等学校博士学科点专项科研基金(20110201110010)。

韩九强,男,教授,主要研究方向:机器视觉,生物信息学。

吴思佳,女,博士研究生,主要研究方向:生物信息学,Email: wsj_xjtu_1332@163.com.

猜你喜欢
碱基试剂基因组
牛参考基因组中发现被忽视基因
国产新型冠状病毒检测试剂注册数据分析
应用思维进阶构建模型 例谈培养学生创造性思维
血清HBV前基因组RNA的研究进展
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
紫花白及基因组DNA提取方法的比较
环境监测实验中有害试剂的使用与处理
非配套脂蛋白试剂的使用性能验证