Chapter 10 可視化
議論の出発点として、データ内におけるY/X間の関係性を整理・記述することが重要
- 最有力な手法は可視化
tidyverseに含まれるggplot2パッケージ(Wickham et al. 2021)を利用し、可視化
Chapter 10.2 : Yが連続変数、Xがカテゴリー変数のケースについて有効なヒストグラム、密度関数、boxplotを描写
Chapter 10.3 :Xも連続変数のケースについて有効な散布図、ヒートマップを描写
10.1 パッケージ & データ
library(tidyverse) # 可視化
library(AER) # 例データ
data("NMES1988") # データの取り込み
<- NMES1988 # 名前変更 raw
- 変数のタイプに応じて、変数間の関係性を記述するために有効な図は異なる。 ここでは、Y/Xが共に連続(連続-連続)のケース、Xがカテゴリカル(連続-カテゴリ)なケースについて、代表的な図を紹介する
10.2 連続-カテゴリのケース
10.2.1 ヒストグラム
- 医療機関の利用回数
|>
raw ggplot(aes(x = visits)) +
geom_histogram()
- 保険の有無別
|>
raw ggplot(aes(x = visits,
fill = insurance)
+
) geom_histogram(position = "identity",
alpha = 0.5)
References
Wickham, Hadley, Winston Chang, Lionel Henry, Thomas Lin Pedersen, Kohske Takahashi, Claus Wilke, Kara Woo, Hiroaki Yutani, and Dewey Dunnington. 2021. Ggplot2: Create Elegant Data Visualisations Using the Grammar of Graphics. https://CRAN.R-project.org/package=ggplot2.