fastp インストール・簡単な使い方・よく使うオプション

fastp とは?

Fastqファイル用の高速前処理ツールです。クオリティの評価(トリミング前後)やトリミング処理を行います。

fastp : https://github.com/OpenGene/fastp

fastp 使い方

簡単な使い方

  • シングルエンド

入力データは、-iでfastqを指定します。トリム後の結果は、-oで指定します。

$ fastp -i in.fq -o out.fq
  • ペアエンド

入力データは、リード1のfastqを-i・リード2のfastqを-Iで指定します。トリム後の結果も、リード1を-o・リード2を-Oで指定します。

$ fastp -i in.R1.fq.gz -I in.R2.fq.gz -o out.R1.fq.gz -O out.R2.fq.gz

レポート

HTML形式(-hオプション:デフォルト)とJSON形式(-jオプション)でレポート出力可能です。

fastp install

Linux環境なら、バイナリーでインストールするのが簡単です。必要に応じて、パスを通すと便利に使えます。

$ cd
$ wget http://opengene.org/fastp/fastp
$ chmod a+x ./fastp

fastp よく使うオプション

  • -3 :3’側のトリミングを許可
  • -q :指定QVを下回ったらカット
  • -n :Nを指定数だけ許容
  • -l :長さが指定長さ以上なら許容
  • -t :read1末尾を指定した数だけ削る
  • -T :read2末尾を指定した数だけ削る
  • -w :スレッド数
  • –detect_adapter_for_pe :ペアエンドの際のadapterトリミング

まとめ

  • fastpは、Fastqファイル用の高速前処理ツール。
  • クオリティの評価(トリミング前後)やトリミング処理を一度に行えて便利。
  • HTML形式(-hオプション:デフォルト)で結果を確認できる。



カテゴリー

ピックアップ記事

  1. R plot 重ねる方法3パターン サンプルでわかるRの使い方

    Rでグラフ (plot) を重ねる方法は、「単純な追加」「図に重ねて描画」「濃淡で重なり表現」の3…
  2. R 使い方 グラフの色 自作のカラーパレットとデフォルトのカラーパレット

    グラフを描画する際、色の組み合わせを1つ1つ考えるのは面倒ですよね。Rには、あらかじめ色の組み合わ…
  3. awk split サンプルでわかる列の分割とセパレータ(文字・正規表現)の指定方法

    awkのsplit関数は、セパレータを指定して文字列を分割することができます。セパレータには文字や…

人気記事

  1. R言語

    R subset関数 データフレームやmatrixからの条件指定による行・列の抽出
    R の subset関数は、データフレームやマトリックスか…
  2. IGV, 解析ツール

    IGV 使い方 インストール〜便利な使い方まで | リファレンス・マッピングデータ・アノテーションを読み込んで表示しよう
    IGV(Integrative Genomics View…
  3. Excel, 統計

    z-score 計算方法 エクセル(Excel) 編
    統計処理で、大きく変化しているなどの判断基準にも使われる値…

おすすめ記事

  1. シェルスクリプト

    シェル スクリプト ファイル存在チェック・空のファイルチェック
    bashでスクリプトを作成するときに、よく使うのがファイル…
  2. awk, シェルスクリプト

    bash 部分文字列・置換・長さ・連結・分割の文字列処理
    bashのよく使う文字列処理、部分文字列・置換・連結・長さ…
  3. R言語, グラフ

    R 使い方 軸・ラベルの調整(向き・サイズ・色など) グラフの描き方
    Rによるplot(グラフ)の描画は、手軽で大変便利です。た…