在二代测序数据分析中,非常重要的一步是将测得的短序列“对应”到基因组上。所使用的工具被称为“短序列比对工具(short sequence aligners)”。以下是一些常用工具的介绍。
简介:Bowtie2是现在广泛使用的序列比对工具。
运行方式:所有平台
特点:
快速运行:
# 建立一系列FASTA文件目录
$ bowtie2-build /filePath/genomeFastaFile indexName
# 从已经index文件中提取原始基因组
$ bowtie2-inspect indexName > genomeFastaFile
# unpaired序列比对
$ bowtie2 -p 4 -x indexName -U readFiles -S samFileName
# paired序列比对
$ bowtie2 -p 4 -x indexName -1 readFiles1 -2 readFiles2 -S eg2.sam
-p
:多线程
-x
:之后跟index名称
-U
:测序文件(比如Fasta,Fastq文件)
-1
/-2
:标识paired文件
-S
:SAM格式输出文件