バイオインフォ道場、くまぞうです。
平均値とは
平均値は、分布の中央の尺度としてよく用いられます。全てのデータからのズレが最小になる値です。
平均値の求め方
全てのデータを足しあわせ、データ数で割ります。
\( \displaystyle \overline{x} = \frac{1}{n} \sum_{i=1}^n x_i \)
計算してみよう
データのランダム抽出例
R> data <- sample(1:30, 10, replace=T) R> data [1] 24 4 22 15 22 18 26 9 5 8
計算1
\( \displaystyle \overline{x} = \frac{1}{10} (24+4+22+15+22+18+26+9+5+8) = 15.3\)
計算2
R> mean(data) [1] 15.3
平均値の特徴
平均値は、データを要約する代表値の1つです。平均値は、全てのデータの大きさを考慮するため、外れ値に敏感に反応するという特徴があります。また、データの分布が非対称で偏りがある場合にも、分布の中央からズレた値になります。一方で、中央値や最頻値は、異常値に左右されにくく頑健と言われます。データを要約する代表値には、それぞれ特徴があります。データの分析などを行う際は、それらを理解して使うことが大切です。
色々なデータと平均値の位置
データの集まりかたによっては、平均値の位置がイメージと異なる場合があります。
![バイオインフォ 道場 [bioinfo-Dojo]](https://bioinfo-dojo.net/wp-content/uploads/2016/03/some_object_luca-bravo-alS7ewQ41M8-unsplash.jpg)




