blast 使い方 makeblastdb
バイオインフォ道場、くまぞうです。
blastを実行するには、事前にデータベースを構築する必要があります。データベースの対象となるfastaファイルを準備し、makeblastdb
コマンドを実行してデータベースを作ります。
データベースを作成する
makeblastdb 使い方とオプション
makeblastdb -in fastaファイル -dbtype 種別 -out 出力名
主なオプション
-
-in file
データベースを作成する対象ファイル。fasta形式など。 -
-dbtype nucl or prot
塩基配列の場合はnucl
、アミノ酸配列の場合はprot
を指定。 -
-out name
データベース名。指定しなかった場合は、-inで指定したファイル名になります。各種blastを実行する際に-db
で指定します。
makeblastdb 実行結果
$ makeblastdb -in ./TAIR10_cds_20101214_updated.fasta -dbtype nucl -out mydb Building a new DB, current time: ... New DB name: /PATH.../mydb New DB title: TAIR10_cds_20101214_updated.fasta Sequence type: Nucleotide ... $ ls mydb.nhr mydb.nin mydb.nsq # makeblastdb で生成されたファイル TAIR10_cds_20101214_updated.fasta # 指定したファイル
$ blastn -query my.fasta -db mydb # blastn 実行パラメータとして使う
こんなときはどうする?
blastnなどで-db
に何を指定したらよいか?
各種blastの実行には、データベースとして-db
を指定します。正しいデータベース名が指定されないとエラーになります。そのような場合は、makeblastdbで作ったデータベース名を再確認します。データベース名は、-out
で指定した名前か、-in
で指定したファイル名になります。.nhr
や.nin
は、データベース名.nin
になっているので、そのデータベース名を指定しましょう。例えば、-out
を指定しなかった場合、少し戸惑いますが、ファイル名.fasta
がデータベース名になります。
-out 指定なしの場合
$ makeblastdb -in TAIR10_cds_20101214_updated.fasta -dbtype nucl Building a new DB, current time: ... New DB name: /PATH.../TAIR10_cds_20101214_updated.fasta # データベース名 New DB title: TAIR10_cds_20101214_updated.fasta Sequence type: Nucleotide ... $ ls TAIR10_cds_20101214_updated.fasta TAIR10_cds_20101214_updated.fasta.nhr TAIR10_cds_20101214_updated.fasta.nin TAIR10_cds_20101214_updated.fasta.nsq
$ blastn -query my.fasta -db TAIR10_cds_20101214_updated.fasta # blastn 実行パラメータとして使う
-out 指定ありの場合(mydb)
$ makeblastdb -in TAIR10_cds_20101214_updated.fasta -dbtype nucl -out mydb Building a new DB, current time: ... New DB name: /PATH.../mydb # データベース名 New DB title: TAIR10_cds_20101214_updated.fasta Sequence type: Nucleotide ... $ ls mydb.nhr mydb.nin mydb.nsq # makeblastdb で生成されたファイル TAIR10_cds_20101214_updated.fasta # 指定したファイル
$ blastn -query my.fasta -db mydb # blastn 実行パラメータとして使う
makeblastdbのオプション・パラメータ
指定するオプションやパラメータがわからなくなったら、makeblastdb
のヘルプを表示しましょう。ヘルプの表示はmakeblastdb -help
です。併せてバージョンも確認しておきましょう。今回は、version 2.3.0+
を参考にしています。
$ makeblastdb -version makeblastdb: 2.3.0+
$ makeblastdb -help USAGE makeblastdb [-h] [-help] [-in input_file] [-input_type type] -dbtype molecule_type [-title database_title] [-parse_seqids] [-hash_index] [-mask_data mask_data_files] [-mask_id mask_algo_ids] [-mask_desc mask_algo_descriptions] [-gi_mask] [-gi_mask_name gi_based_mask_names] [-out database_name] [-max_file_sz number_of_bytes] [-logfile File_Name] [-taxid TaxID] [-taxid_map TaxIDMapFile] [-version] 以下 詳細情報 ...