スポンサーリンク
blast

blast 使い方 完全一致の連続領域を探索するには?

blastn で完全一致の連続領域を探索する方法 blastn オプション word_size blastnのパラメータ-word_sizeは、完全一致の初期長さを設定します。長さを指定すると、「完全一致が連続する場所」で「指定長さを満たす...
シェルスクリプト

パイプ と xargs 前のコマンド結果を「利用して」次のコマンドを実行する

パイプ と xargs を組み合わせる パイプの使い方 複数のコマンドをつなぎあわせて順番に実行することを「パイプでつなぐ」と言います。コマンド同士をパイプ(|)でつなぎます。 $ ls aaa.txt bbb.txt ccc.txt $ ...
Excel

R と Excel 分散 標準偏差 計算 データの散らばりについて

データ分析の基本である、分散 標準偏差について、Rとエクセルで比較してみましょう。ExcelやRを使って、自分で計算するとより理解が深まると思います。 データの散らばり 分散 標準偏差 スポンサーリンク (adsbygoogle = win...
Excel

R と Excel 度数分布表 ・ ヒストグラム

データ分析の基本である、ヒストグラムと度数分布表について、Rとエクセルで比較してみましょう。 度数分布表 と ヒストグラム スポンサーリンク (adsbygoogle = window.adsbygoogle || []).push({})...
bowtie

bowtie2 使い方 アライメント情報(alignment summary)をファイルに保存する

bowtie2のアライメント情報(alignment summary)をファイル保存する方法について考えます。 とにかく早く問題解決したい人はこちら>>直接、データ解析相談 bowtie2 アライメント情報と標準エラー出力 Linuxのコマ...
R言語

R NA (欠損値) データフレームのNAを探す方法

データフレームに NA は含まれるか? NAは欠損値で、データの観測ができない場合などを表します。データフレームを使った計算にはNAの除去が必要になる場合があります。NAを除去するのは簡単ですが、まずは「どのデータがNAか?」を確認する必要...
R言語

R NAの除去方法(欠損値の除去)

RのNA(欠損値)の除去についてまとめます。 欠損値 NA とは RでNAは欠損値で、データの観測ができない場合などを表します(ベクターやデータフレームにNAが入っていることがあります)。NAを含むデータを使った計算では計算結果もNAになる...
gffread

gffread を使った transcripts fasta 転写物の配列取得

ゲノム配列から転写物の配列を取得 転写物(transcript)の配列を取得したい場合、染色体上の位置(開始位置〜終了位置)をたよりに配列情報を抜き出します。位置情報を管理する方法としてよく使われるのがGFF3やGTF形式のファイルです。領...
sed

sed スペース 空白文字の整理・空白行の削除

sed で、スペース・タブ、空行に関する処理をまとめました。これらは、フィールドやレコードのセパレータとして使われるので、使いこなせるようになるとデータ解析の前処理が楽になります。 スペース・タブ(空白文字)の処理 複数のスペースを1つにす...
awk

awk 置換や部分文字列などの文字列処理 gsub sub match index split 等

awkの文字列関数について、置換や部分文字列処理など、よく使う代表的なものを簡単なサンプルを使って紹介します。 awk 置換 文字列置換 gsub sub gsub・subは、対象となる文字列tについて正規表現rにマッチした部分を置換文字列...
スポンサーリンク