STAR RNA-seq aligner 使い方 インストール・index・マッピング
バイオインフォ道場、くまぞうです。
STARは、RNA-Seq用のマッピングソフトです。非常に高速なマッピングが可能です。
目次
STARとは?
STAR インストール
ダウンロードした圧縮ファイルにプリコンパイル版が含まれているので、パスを通すなどして使用可能です。
# cd /usr/local # wget https://github.com/alexdobin/STAR/archive/2.5.3a.tar.gz # tar xzvf 2.5.3a.tar.gz # ln -s /usr/local/STAR-2.5.3a/bin/Linux_x86_64_static/STAR /usr/local/bin/ # ln -s /usr/local/STAR-2.5.3a/bin/Linux_x86_64_static/STARlong /usr/local/bin/
STAR マニュアル
マニュアルはこちらから入手可能です。
https://github.com/alexdobin/STAR/blob/master/doc/STARmanual.pdf
STARの使い方
STAR index準備
リファレンスとなるゲノムファイルを準備します。他のマッピングソフト同様、マッピングに先立ってインデックスファイルを生成します。
$ mkdir genome-starIndex/ $ cp genome.fa genome-starIndex/ $ cd genome-starIndex/ $ STAR --runMode genomeGenerate --runThreadN 24 --genomeDir ./ --genomeFastaFiles genome.fa
STAR マッピング
マッピング結果は、SAM形式で出力されます。マッピング率などの情報は、*Log.final.outに記録されます。
同じ環境で、tophat2と比較してみると、10〜20倍程度早く処理が完了しました。
# paired-end $ STAR --genomeDir genome-starIndex/ --runThreadN 24 --readFilesIn read_1.fastq read_2.fastq --outFileNamePrefix Output1Star