箱ひげ図 (boxplot)
量的データを要約して描くときの代表的な方法として、箱ひげ図があります。
irisというRの付録データ (アヤメ (花) の部位と種名のデータ) を例に使いましょう。
data(iris)
summary(iris)
Sepal Lengthは、がくの長さ、Sepal Widthは、がくの幅、Petal Lengthは花びらの長さ、Petal Lengthは花びらの幅、Speciesは種名です。
attach(iris) #Rにirisを取り付けます。
箱ひげ図
では、箱ひげ図を描いてみましょう。どのデータを使ってもよいですが、ここではSepal.Lengthを例とします。呪文はboxplotです。
boxplot(Sepal.Length)
この図の箱の中にある太い線は中央値、箱の上下が四分位数、ひげの末端が最小値、最大値です。ただし、頻度分布が複数の山の形になっているときなどは、箱ひげ図は不適切です。
boxplot(Petal.Length)
ヒストグラムで見えたように、本当は2つの山があるのに、箱ひげ図では、そのことが分かりません。箱ひげ図はヒストグラムを描いて「箱ひげ図でも大丈夫」だと分かってから描くほうがよいですね。
X軸とY軸の下限値と上限値は、それぞれxlimとylimで指定できます。ただし、箱ひげ図では通常X軸の上限・下限を設定しません。
boxplot(Sepal.Length, xlim=c(0, 3), ylim=c(0, 50))
軸に名称を付ける場合は、xlabやylabを使います。ダブルクォテーションで挟まれた間に名称を入力します。ここは日本語でも大丈夫です。
boxplot(Sepal.Length, xlab="アヤメ", ylab="がくの長さ")
Y軸の数値の向きを縦にしたいときはlas=1と入力します。
boxplot(Sepal.Length, xlab="がくの長さ", ylab="個体数", las=1)
文字、数値の大きさ
さらに文字の大きさを変えたいときは、このように行います。
boxplot(Sepal.Length, xlab="アヤメ", ylab="がくの長さ", cex.lab=1.5)
軸の数値の大きさを変えるならば、cex.axisで指定します。
boxplot(Sepal.Length, xlab="アヤメ", ylab="がくの長さ", cex.axis=1.5)
色の指定
colによって、色を、数字や英語、16進数で指定できます。
boxplot(Sepal.Length, col="darkblue")
boxplot(Sepal.Length, col="green")
これではあまり美しくないと感じる人は、「原色大辞典」というウェブページを利用しましょう。「原色大辞典」には、色見本と英語表記、16進数の表記が掲載されています。この16進数で色を指定することもできます。
boxplot(Sepal.Length, col="#e95464")
boxplot(Sepal.Length, col="#007bbb")
boxplot(Sepal.Length, col="#e6b422")
最後に、attachしたデータを取り外します。
detach(iris)
最終更新日時: 2021年 02月 15日(月曜日) 18:37