blast 使い方 makeblastdb

バイオインフォ道場、くまぞうです。

blastを実行するには、事前にデータベースを構築する必要があります。データベースの対象となるfastaファイルを準備し、makeblastdbコマンドを実行してデータベースを作ります。

スポンサーリンク



データベースを作成する

makeblastdb 使い方とオプション

makeblastdb -in fastaファイル -dbtype 種別 -out 出力名

主なオプション

  • -in file
    データベースを作成する対象ファイル。fasta形式など。

  • -dbtype nucl or prot
    塩基配列の場合はnucl、アミノ酸配列の場合はprotを指定。

  • -out name
    データベース名。指定しなかった場合は、-inで指定したファイル名になります。各種blastを実行する際に-dbで指定します。

makeblastdb 実行結果

$ makeblastdb -in ./TAIR10_cds_20101214_updated.fasta -dbtype nucl -out mydb

Building a new DB, current time: ...
New DB name:   /PATH.../mydb
New DB title:  TAIR10_cds_20101214_updated.fasta
Sequence type: Nucleotide
...
$ ls
mydb.nhr mydb.nin mydb.nsq        # makeblastdb で生成されたファイル
TAIR10_cds_20101214_updated.fasta # 指定したファイル
$ blastn -query my.fasta -db mydb  # blastn 実行パラメータとして使う

こんなときはどうする?

blastnなどで-dbに何を指定したらよいか?

各種blastの実行には、データベースとして-dbを指定します。正しいデータベース名が指定されないとエラーになります。そのような場合は、makeblastdbで作ったデータベース名を再確認します。データベース名は、-outで指定した名前か、-inで指定したファイル名になります。.nhr.ninは、データベース名.ninになっているので、そのデータベース名を指定しましょう。例えば、-outを指定しなかった場合、少し戸惑いますが、ファイル名.fastaがデータベース名になります。

-out 指定なしの場合

$ makeblastdb -in TAIR10_cds_20101214_updated.fasta -dbtype nucl

Building a new DB, current time: ...
New DB name:   /PATH.../TAIR10_cds_20101214_updated.fasta  # データベース名
New DB title:  TAIR10_cds_20101214_updated.fasta
Sequence type: Nucleotide
...
$ ls
TAIR10_cds_20101214_updated.fasta
TAIR10_cds_20101214_updated.fasta.nhr
TAIR10_cds_20101214_updated.fasta.nin
TAIR10_cds_20101214_updated.fasta.nsq
$ blastn -query my.fasta -db TAIR10_cds_20101214_updated.fasta  # blastn 実行パラメータとして使う

-out 指定ありの場合(mydb)

$ makeblastdb -in TAIR10_cds_20101214_updated.fasta -dbtype nucl -out mydb

Building a new DB, current time: ...
New DB name:   /PATH.../mydb  # データベース名
New DB title:  TAIR10_cds_20101214_updated.fasta
Sequence type: Nucleotide
...
$ ls
mydb.nhr mydb.nin mydb.nsq        # makeblastdb で生成されたファイル
TAIR10_cds_20101214_updated.fasta # 指定したファイル
$ blastn -query my.fasta -db mydb  # blastn 実行パラメータとして使う

makeblastdbのオプション・パラメータ

指定するオプションやパラメータがわからなくなったら、makeblastdbのヘルプを表示しましょう。ヘルプの表示はmakeblastdb -helpです。併せてバージョンも確認しておきましょう。今回は、version 2.3.0+を参考にしています。

$ makeblastdb -version
makeblastdb: 2.3.0+
$ makeblastdb -help
USAGE
  makeblastdb [-h] [-help] [-in input_file] [-input_type type]
    -dbtype molecule_type [-title database_title] [-parse_seqids]
    [-hash_index] [-mask_data mask_data_files] [-mask_id mask_algo_ids]
    [-mask_desc mask_algo_descriptions] [-gi_mask]
    [-gi_mask_name gi_based_mask_names] [-out database_name]
    [-max_file_sz number_of_bytes] [-logfile File_Name] [-taxid TaxID]
    [-taxid_map TaxIDMapFile] [-version]

以下 詳細情報 ...
スポンサーリンク