z-score 計算方法 R 編

バイオインフォ道場、くまぞうです。

バイオインフォマティクスでは、統計処理をよく活用します。大きく変化しているなどの判断基準にも使われる値として、Z-scoreがあります。統計ソフトRを使って求めてみます。

スポンサーリンク



関連記事 z-score 計算方法 Excel(エクセル)編

z-scoreとは

データを平均0・標準偏差1になるように、全てのデータに対して変換処理を行ったものです。z-scoreに変換することで、散布度も考慮しつつ平均値からどのくらい離れているかを調べることができます。z-scoreの算出には、平均値と標準偏差を使います。

 z_i = \frac{x_i - \overline{x}}{s}

z-scoreを求める

「統計ソフト R」を使ってZ-scoreを求める

Rで、z-scoreを求めるには、scale関数を使うと便利です。

Z-score.r

R > num <- sample(20)  # サンプルデータを生成
 [1] 11 14 16  6 20 10  4 18  5 12  7 15  3  2  8 19 13  1  9 17

R > scale(num)  # z-scoreを求める
             [,1]
 [1,] -1.43676223
 [2,] -1.26773138
 [3,] -0.92966968
 [4,]  0.59160798
 [5,] -0.76063883
 [6,]  0.92966968
 [7,]  1.09870053
 [8,]  1.26773138
 [9,]  1.43676223
[10,]  0.76063883
[11,]  0.25354628
[12,] -1.09870053
[13,] -0.08451543
[14,] -1.60579308
[15,]  1.60579308
[16,] -0.42257713
[17,]  0.42257713
[18,]  0.08451543
[19,] -0.59160798
[20,] -0.25354628
attr(,"scaled:center")
[1] 10.5
attr(,"scaled:scale")
[1] 5.91608
スポンサーリンク