Rのサンプルデータセット
Rには、インストールしただけで標準で備えられているデータの例(サンプルデータ)があります。Rのサンプルデータの一覧を示す呪文はdata()です。唱えてみましょう。
data()
なお、これはdatasetsというパッケージに入っているデータセットです。
利用可能なデータを全部表示するならば、
data(package = .packages(all.available = TRUE))
と唱えます。

アヤメ (iris) という花のデータ
Rの使い方を説明するとき、irisというデータセットが、よく用いられます。
どんなデータなのか、見てみましょう。
ある特定のデータを呼び出したいときも、dataという呪文を使います。ただし、半角カッコの中に呼び出したいデータセットの名称を入力します。
ではirisを呼び出して、どんなデータか見てみましょう。
data(iris)
iris
irisとは、どのようなデータなのか知りたいときは、
?iris
と唱えます。irisは3種のアヤメに関する花の形(萼片と花弁の長さと幅)のデータだと分かります。 Sepalとは萼片 (がくへん)、Petalとは花弁 (かべん) です。Speciesは種小名です。

たとえば「iris, sepal」などで画像検索すると、たぶん3種のアヤメの花とsepalやpetalがどの部位かが示された写真を見つけることができるはずです。

このデータは作図や母集団推定、仮説検定などに幅広く利用します。

歯の成長データ
モルモットの歯牙芽細胞 (歯の成長に関与する細胞) の長さのデータです。この歯の成長に対するビタミンCの量 (dose = 0.5、1、2 mg/日) と与え方 (supp = オレンジジュース (OJ) またはアスコルビン酸 (VC))の影響を調べています。
data(ToothGrowth)
ToothGrowth

このデータはt検定や分散分析などの仮説検定の例として利用します。

最後修改: 2021年 02月 16日(週二) 12:33