スポンサーリンク
シェルスクリプト

パイプ と xargs 前のコマンド結果を「利用して」次のコマンドを実行する

パイプ と xargs を組み合わせるパイプの使い方複数のコマンドをつなぎあわせて順番に実行することを「パイプでつなぐ」と言います。コマンド同士をパイプ(|)でつなぎます。$ lsaaa.txt bbb.txt ccc.txt$ cat a...
Excel

R と Excel 分散 標準偏差 計算 データの散らばりについて

データ分析の基本である、分散 標準偏差について、Rとエクセルで比較してみましょう。ExcelやRを使って、自分で計算するとより理解が深まると思います。データの散らばり 分散 標準偏差スポンサーリンク(adsbygoogle = window...
Excel

R と Excel 度数分布表 ・ ヒストグラム

データ分析の基本である、ヒストグラムと度数分布表について、Rとエクセルで比較してみましょう。度数分布表 と ヒストグラムスポンサーリンク(adsbygoogle = window.adsbygoogle || []).push({});度数...
bowtie

bowtie2 使い方 アライメント情報(alignment summary)をファイルに保存する

bowtie2のアライメント情報(alignment summary)をファイル保存する方法について考えます。とにかく早く問題解決したい人はこちら>>直接、データ解析相談bowtie2 アライメント情報と標準エラー出力Linuxのコマンド結...
R言語

R NA (欠損値) データフレームのNAを探す方法

データフレームに NA は含まれるか?NAは欠損値で、データの観測ができない場合などを表します。データフレームを使った計算にはNAの除去が必要になる場合があります。NAを除去するのは簡単ですが、まずは「どのデータがNAか?」を確認する必要が...
R言語

R NAの除去方法(欠損値の除去)

RのNA(欠損値)の除去についてまとめます。欠損値 NA とはRでNAは欠損値で、データの観測ができない場合などを表します(ベクターやデータフレームにNAが入っていることがあります)。NAを含むデータを使った計算では計算結果もNAになる場合...
gffread

gffread を使った transcripts fasta 転写物の配列取得

ゲノム配列から転写物の配列を取得転写物(transcript)の配列を取得したい場合、染色体上の位置(開始位置〜終了位置)をたよりに配列情報を抜き出します。位置情報を管理する方法としてよく使われるのがGFF3やGTF形式のファイルです。領域...
sed

sed スペース 空白文字の整理・空白行の削除

sed で、スペース・タブ、空行に関する処理をまとめました。これらは、フィールドやレコードのセパレータとして使われるので、使いこなせるようになるとデータ解析の前処理が楽になります。スペース・タブ(空白文字)の処理複数のスペースを1つにする1...
awk

awk 置換や部分文字列などの文字列処理 gsub sub match index split 等

awkの文字列関数について、置換や部分文字列処理など、よく使う代表的なものを簡単なサンプルを使って紹介します。awk 置換文字列置換 gsub subgsub・subは、対象となる文字列tについて正規表現rにマッチした部分を置換文字列sで置...
awk

awk 複数行の処理

ファイルには様々な形式があります。1行単位で記述されたCSV(カンマ区切り)ファイルやTSV(タブ区切り)ファイルは、awkやsed、その他のbashコマンドなどを使っても比較的処理がしやすい。しかし、複数行でレコードが構成される場合(1行...
スポンサーリンク