Rによる比較・予測・因果推論入門 ver0.2
2022-04-18
はじめに
定量的な比較、(反実仮想)因果推定、予測分析をRによって行う方法を紹介
経済学におけるデータ分析の大部分は、複数の変数間での関係性の理解・利用を目的とする。 本ページでは、ある結果変数\(Y\)と独立変数(群)\(X=X_1,...,X_L\)の関係性に焦点を当てる。 また\(Y\)と\(X\)がともに観察でき、関心のある母集団からランダムサンプリングされたデータが入手出来ているとする。
各推定手法は、推定上の目標(識別結果)から導かれる推定すべき母集団の特徴に応じて、整理される。ここで論じる推定上の目標は以下の3つである。
(予測)\(Y\)の予測関数の推定
(比較)異なる\(X\)間での\(Y\)の比較
(因果効果)\(X\)の変化が\(Y\)に与える因果効果の推定
分析環境の主な特徴は、以下のパッケージ群の利用にある
データインポート、整理、可視化を行う関数群を統合的に提供する[tidyverseパッケージ] (Wickham et al. 2019)の利用
Robust standard errorを簡潔に計算するestimatrパッケージ (Blair et al. 2022a)の利用
Stacking法を簡潔に実装するSuperLearnerパッケージ (Van der Laan, Polley, and Hubbard 2007)の利用
R nativeなパイプ演算子 “|>” の利用
Example dataとしては、AERパッケージ (Kleiber and Zeileis 2008)に含まれるPSID1982 (Panel Study on Income Dynamics)を利用
References
Blair, Graeme, Jasper Cooper, Alexander Coppock, Macartan Humphreys, and Luke Sonnet. 2022a. Estimatr: Fast Estimators for Design-Based Inference.
Kleiber, Christian, and Achim Zeileis. 2008. Applied Econometrics with R. New York: Springer-Verlag. https://CRAN.R-project.org/package=AER.
Van der Laan, Mark J, Eric C Polley, and Alan E Hubbard. 2007. “Super Learner.” Statistical Applications in Genetics and Molecular Biology 6 (1).
Wickham, Hadley, Mara Averick, Jennifer Bryan, Winston Chang, Lucy D’Agostino McGowan, Romain François, Garrett Grolemund, et al. 2019. “Welcome to the tidyverse.” Journal of Open Source Software 4 (43): 1686. https://doi.org/10.21105/joss.01686.