IGV 使い方 遺伝子位置や好きな位置への移動

IGVはリードのマッピング状況を視覚的に確認できるツールです。ゲノムデータ（fastaファイル）とアライメントデータ（bamファイル、及びbaiファイル）を準備すれば簡単に表示できますが、更に遺伝子の位置情報を読み込むともっと使いやすくなります。

IGVでマッピングデータを表示する
IGVを便利に使おう！マッピングと遺伝子位置の表示
1. GFFファイル・GTFファイルとは？
2. GTFファイルの読み込みとGTFファイルのソート
IGVを便利に使おう！ナビゲーション機能を使って移動
IGVを便利に使おう！最新版のチェック
論文・データ解析の支援
関連記事１
関連記事２

IGVでマッピングデータを表示する

IGVは、米Broad Instituteによって作成されたゲノムブラウザです。

Javaの動作環境が必要です（IGVのインストールと起動：Linux編）。

リファレンスのゲノムデータ（fastaファイル）とアライメントデータ（bam・baiファイル）を準備してIGVにロードすれば表示可能です。

あとは、目的の遺伝子などの位置を検索したり、ナビゲーション機能を利用することで移動し、マッピング状況を確認します。（IGVの使い方）

IGVを便利に使おう！マッピングと遺伝子位置の表示

IGVには、目的に応じて様々な形式のファイルを読み込んで表示することができます（推奨ファイルリンク）。GFFファイルやGTFファイルを読み込むと、リードのマッピング情報とあわせて遺伝子などの位置を表示できるので便利です。また、BEDファイルをナビゲーション情報として読み込むことで、目的の遺伝子の位置へすぐに移動できて大変便利です。

GFFファイル・GTFファイルとは？

GFFとGTFは、どちらも、ゲノムや遺伝子の「位置・遺伝子名・エクソン番号など」の情報を１行毎に記述したファイルです。１行には９つの列があり、タブで区切られています。GFFとGTFの１〜８列目は同じ構造です。GFFの９列目には、遺伝子名などのグループ情報を記載します。GTFの９列目には、type/valueで対になった情報（必須：gene_id, transcript_id）を記載します。詳細（UCSC FAQ）

1.seqname   : 例 Chr1, 1 ...
2.source    : 例 hg19（生成プログラム名など）
3.feature   : 例 gene, CDS, exon, ...
4.start     : 例 1, 1000 （開始位置。先頭は１）
5.end       : 例 100,999 （終了位置）
6.score     : 例 '.' （任意のスコア） 
7.strand    : 例 +, -, '.'
8.frame     : 例 0, 1, 2, '.' （翻訳開始塩基位置。０はコドン１番目）
g.attribute : 例 遺伝子名, gene_id="xxx", transcript_id="xxx"

GTFファイルの読み込みとGTFファイルのソート

メニューバーの「File」->「Load From File…」から、アノテーションファイルとしてGTFファイルをロードします。ロードが完了すると、トラックの一番下に遺伝子の位置情報が、マッピング情報と一緒に表示されます。

GTFファイルがソートされていないという警告が表示されたら、メニューバーの「Tools」->「Run igvtools…」を使うのが最も簡単です。igvtoolsでソート済みファイルが作成されるので、再度そのファイルをメニューバーからロードします。また、GTFファイルをsortコマンドでソートする方法も良く使われます。

ソートの警告

igvtoolsによるソート

コマンドを使ったソート

$ cat refGene.gtf  | sort -k1,1 -k4,4 > refGene.gtf.sorted

IGVを便利に使おう！ナビゲーション機能を使って移動

IGVには、目的に応じて様々な形式のファイルを読み込んで表示することができます（推奨ファイルリンク）。BEDファイルをナビゲーション情報として読み込むことで、目的の遺伝子の位置へすぐに移動できて大変便利です。

BEDファイルとは？

BEDは、ゲノムの位置情報を１行毎に記述したファイルです。１行のフォーマットは最低３列（染色体名・開始位置・終了位置）が必要で、最大１２列まで定義されたタブ区切りのデータです。IGVで、ナビゲーション機能の利用としてRegonファイル（BED形式）を使う場合は、４列目に名前を加えた、染色体名・開始位置・終了位置・名前の構造があればＯＫです。詳細（UCSC FAQ）

1.chrom     : 例 Chr1, 1 ...
2.chromStat : 例 0, 1（開始位置。先頭は０）
3.chromEnd  : 例 10, 100
4.name      : 例 遺伝子名

Regionファイルの作成と読込み（GTF形式からBED形式へ変換）

遺伝子の位置表示で使ったGTFファイルをBED形式にして使うと便利です。featureがgeneであるところでBED形式のファイルを作成してみます。

cat refGene.gtf | awk 'BEGIN{FS="\t"; OFS="\t"}; $3 ~ /gene/ {print $1, $4-1, $5, $9}' > my_region.bed

Navigator機能の使い方

メニューバーの「Regions」->「Import Regions」から、作成したBED形式のファイルを読込みます。移動に使う場合は、メニューバーの「Regions」->「Region Navigator」で「Region of Interest」のウィンドウが開くので、移動したいところを選択して「View」ボタンを押します。