bowtie 使い方 マッピングとオプション
バイオインフォ道場、くまぞうです。
bowtie は、代表的なマッピングソフトです。高速にマッピング処理を行うことが出来ます。ただし、ギャップは考慮しません。
目次
Bowtie – 使い方
- まずは、インデックスファイルを作る
マッピングのリファレンスとなるFastaファイルからインデックスファイルを作成します。インデックスファイルの作成には時間がかかります。bowtieのサイトに予め作成されたインデックスファイルが準備されているので、ダウンロードして使うことができます。Pre-built indexes
bowtie-build -f ref_sequence index_name
- マッピングを行う
bowtie-buildで作成したインデックスと、リードファイルを指定してマッピングを行います。
bowtie -S -p 4 index_name single-read.fastq mapped.sam
bowtie -S -p 4 index_name -1 paired-read1.fastq -2 paired-read2.fastq mapped.sam
Bowtie – よく用いられるオプション
アライメント
- -v int
リード全体で許容される最大ミスマッチ数。-v 0は、完全一致のみ。 - -n int
-lで指定された長さについて許容されるミスマッチ数 - -l int
シード配列の長さ
レポート
- -k int
リード当たりのレポートするヒット数の最大数。 - -a
全てのヒットをレポートする。 - -m int
指定数以上にヒットが得られる場合はレポートしない。-m 1ならば、マッピングがユニークなリードのみ。 - –best
n モードでは、backtrackを125->800に増やす。
v モードでは、良いアライメントから順にレポートする。 - –strata
アライメント候補グループ(stratum)が複数存在する場合、より良いグループ(stratum)をレポートする。–best も一緒に指定する。
その他
- -p int
スレッド数 - -S
SAM出力
よく使われるパラメータ
- デフォルト
“-n 2 -l 28 -e 70” - 最も少ないミスマッチでマップされるリードのみ出力
“-a –best –strata”