摘要:该文主要讲述随着下一代测序技术(next-generation sequencing)的快速发展,生物信息数据产生了大量的小片段序列。像re-sequencing 还有transcriptome sequencing测序产生的数据中,都会产生定位在参考基因组上的短序列片段。如何有效地对测序数据进行针对性的短序列片段映射及比对处理,是个值得关注的问题。SAM和BAM格式是用于存储对参考序列的片段比对的一个通用比对格式,BAM含有和SAM相同的信息,而BAM较高的压缩率也为存储数据带来便利,同时它也具有快速访问和检索的功能。能够能直接或间接支持 SAM/BAM数据格式的基因浏览器可以实现快速浏览,为后续可视化及注释的处理带来极大的便利。基于SAM/BAM的灵活性和可扩展性,该文提出一种可以将SAM/BAM格式的数据作为基因浏览器数据层的实现方法,这将极大地提高了基因浏览器对下一代测序数据的展示效果,也同时推进了测序数据可视化的发展。
关键词:测序数据处理;序列比对格式;SAMtools
中图分类号:TP393文献标识码:A文章编号:1009-3044(2011)36-pppp-0c