準備

サンプルデータとしてRに同梱されている「iris」を使います。

# ライブラリの読み込み
library(ggplot2)

# データの確認
head(iris)
##   Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1          5.1         3.5          1.4         0.2  setosa
## 2          4.9         3.0          1.4         0.2  setosa
## 3          4.7         3.2          1.3         0.2  setosa
## 4          4.6         3.1          1.5         0.2  setosa
## 5          5.0         3.6          1.4         0.2  setosa
## 6          5.4         3.9          1.7         0.4  setosa

ヒストグラムを作成する

ヒストグラムを作成するために、geom_histogram()関数を使います。binwidthで区切る区間の幅を指定します。

ggplot(iris,aes(x = Sepal.Length)) +
  geom_histogram(binwidth = 0.1)

ヒストグラムを重ね書きする

特定の変数でグループ分けされたヒストグラムを作成するために、ggplot()関数のaes()の中のfillでグループ分けの基準になる変数を指定すます。また、geom_histogram()の中でposition = “identity”を指定します。この指定がないと各グループの頻度を積み上げた棒グラフが描写されてしまいます。alphaでは、ヒストグラムの透明度を指定しています。

ggplot(iris,aes(x = Sepal.Length, fill = Species)) +
  geom_histogram(position = "identity", binwidth = 0.1, alpha = 0.5)


「データから価値を創造する」一般社団法人データマーケティングラボラトリー

Copyright© DML All Rights Reserved.