チャートやグラフは、データの理解を手助けしてくれます。「統計ソフト R」では様々なグラフが手軽に描けるので便利です。単体のチャートやグラフでも役に立ちますが、表現には限界があり、一長一短となるものも少なくありません。異なる種類のチャートやグラフを組み合わせることで、より分り易く表現できるかもしれません。

ボックスプロットとヒストグラムを組み合わせる
ボックスプロット(boxplot)
ボックスプロット(box plot)は、データのばらつきをわかりやすく表現することができる図です。箱ひげ図とも呼ばれます。第1四分位点〜第3四分位点で箱を描き、中央値が箱の中のの太い線で表現されます。簡単な表記では、箱から伸びたヒゲは最小値・最大値を表します。外れ値を示す描き方もあります。
box_iris.r
R > boxplot(Sepal.Length ~ Species, data=iris, ylab="Sepal.Length")

ヒストグラム(histgram)
ヒストグラム(histogram)は、データの分布状況をわかりやすく表現することができる図です。度数分布図とも呼ばれます。横軸に階級、縦軸に度数をとります。注意すべき点は、階級の幅をどのくらいの大きさにするか?という点です。階級の分け方によって、大きく印象が変わるときがあります。階級の分け方については、「スタージェスの公式」が有名です。
hist_iris.r
R > hist(iris$Sepal.Width)

チャート・グラフの組合せ
2つのチャート・グラフを組み合わせるには、layout関数
を使ってグラフ表示エリアを分割し、それぞれにグラフを描画します。大事なのは、表示範囲を揃えることです。range関数
でデータの表示域を取得し、その値を共通で使用しています。また、それぞれのグラフでそれぞれタイトルやラベルを表示すると見た目が良くないので、xlab関数
やmain関数
・axis関数
を使って、表示のON/OFFを明示的に指定します。より良くするために、2つのグラフの上下の余白を、グラフィックスパラメータpar関数
で調整しています。
box_and_hist.r
R> range_x = range(iris$Sepal.Width) R> layout(matrix(1:2, nrow=2)) R> par(mar=par("mar") * c(0.8, 1, 1, 1)) R> boxplot(iris$Sepal.Width, ylim=range_x, horizontal=TRUE, xlab="iris$Sepal.Width") R> hist(iris$Sepal.Width, xlim=range_x, xlab="", main="", axes=FALSE, ylab="") R> axis(1)

実験データの解析や論文用グラフ作成のヒントになりそうな、プログラミング・統計処理の参考になる書籍をまとめて紹介しています。是非、参考にしてみて下さいね。
論文・データ解析の支援
個別に直接相談できるのが良いと、たくさんの方にご利用頂いています。


関連記事1







関連記事2
















