R 使い方 データフレーム・ファクター スクリプトの書き方

バイオインフォ道場、くまぞうです。

Rのデータ構造は、他のプログラミング言語でよくみかけるデータ構造とは少し異なるように感じるかもしれません。しかし、基本的な構造を理解すれば、Rはもっと使いやすいツールになるかもしれません。データフレームとファクター編。

関連記事 R script データ構造まとめ スクリプトの書き方

スポンサーリンク



Rのデータ構造

データフレーム

データフレームは、「名前付けされたベクトルの列」を並べたリストです。外部ファイルを読み込んだ場合、データフレーム形式として利用することが多く、統計やバイオインフォマティクス解析処理でもっとも利用されるデータ構造の1つです。

データフレームの生成は、data.frame関数を使います。名前付けされたベクトルとして列毎にデータを列挙し、並べます。データへのアクセスは、行列同様、行と列のインデックスや名前を使ってアクセスできます。また、列毎のデータについては、$を使った名前で参照出来ます。

データフレームの生成

R > my_data <- 
    data.frame(name=I(c("kumazou1", "kumazou2", "kumazou3")),
               age=c(101, 102, 103),
               color=c("red", "green", "yellow"))
R > my_data
      name age  color
1 kumazou1 101    red
2 kumazou2 102  green
3 kumazou3 103 yellow

R > str(my_data)
'data.frame':	3 obs. of  3 variables:
 $ name :Class 'AsIs'  chr [1:3] "kumazou1" "kumazou2" ...
 $ age  : num  101 102 103
 $ color: Factor w/ 3 levels "green","red",..: 2 1 3

データフレームへのアクセス

R > my_data[3, 2]  # インデックス
[1] 103

R > my_data$name   # $name
[1] "kumazou1" "kumazou2" "kumazou3"

R > my_data[["age"]]  # リスト風アクセス
[1] 101 102 103

R > my_data$name[1]   # 名前とインデックス
[1] "kumazou1"

ファクター

ファクターは、データのカテゴリを記述するためのラベルです。factor関数で生成します。

R > my_factor <- factor(c("PTN-A", "PTN-B", "PTN-C"))
R > my_factor
[1] PTN-A PTN-B PTN-C
Levels: PTN-A PTN-B PTN-C
スポンサーリンク





ピックアップ記事

  1. awk if サンプルでわかる条件文の書き方 一致・大小比較・正規表現を簡潔に書く方法

    awkのif条件文は、条件によって処理をわけたいときに使います。条件式では、0の判定・関係演算子・…
  2. awk split サンプルでわかる列の分割とセパレータ(文字・正規表現)の指定方法

    awkのsplit関数は、セパレータを指定して文字列を分割することができます。セパレータには文字や…
  3. awk for 繰り返し処理 簡単なサンプルでわかる インクリメント・デクリメント、変わった繰り返し

    awkのfor文は、カウンタを目印にして処理を繰り返したいときによく使われます。for文では、カウ…

人気記事

  1. IGV, 解析ツール

    IGV 使い方 インストール〜便利な使い方まで | リファレンス・マッピングデータ・アノテーションを読み込んで表示しよう
    IGV(Integrative Genomics View…
  2. R データ型 - 文字列・ベクター・データフレーム・マトリックス など-, R言語, スクリプト

    R subset関数 データフレームやmatrixからの条件指定による行・列の抽出
    R の subset関数は、データフレームやマトリックスか…
  3. Excel, その他, 統計

    z-score 計算方法 エクセル(Excel) 編
    統計処理で、大きく変化しているなどの判断基準にも使われる値…

おすすめ記事

  1. awk, bash 文字列操作, シェルスクリプト

    bash 部分文字列・置換・長さ・連結・分割の文字列処理
    bashのよく使う文字列処理、部分文字列・置換・連結・長さ…
  2. R言語, グラフ

    R 使い方 軸・ラベルの調整(向き・サイズ・色など) グラフの描き方
    Rによるplot(グラフ)の描画は、手軽で大変便利です。た…
  3. bash 応用, シェルスクリプト

    シェル スクリプト ファイル存在チェック・空のファイルチェック
    bashでスクリプトを作成するときに、よく使うのがファイル…