7 把握を目的とする要約: 傾向スコア

Balancing weightsを計算する別のアプローチとして、傾向スコア (Propensity score; Rosenbaum and Rubin (1983)) の活用が挙げられます。傾向スコアは、\(X\) 内で \(D=d\) である事例の母集団における割合 \(p_d(X)\) として定義されます。

7.1 Inverse probability weighting

\((X=x)\)へのウェイトとして、\(X\) の母分布をターゲットとするのであれば、Balancing weight \(\omega(X)\) と傾向スコア \(p_d(X)\) の間に以下の関係性が成り立ちます。 \[\omega(X) = \frac{D=dの割合}{p_d(X)}\] よってバランス後の平均値は以下のように書き換えられます。 \[\frac{D=dについて\omega(X)\times Yの総和}{D=dの事例数}\] \[=\frac{D=dについて(D=dの割合/p_d(X))\times Yの総和}{D=dの割合\times 総事例数}\] \[=\frac{D=dについて(1/p_d(X))\times Yの総和}{総事例数}\] \(I(D_i=d)\) は事例\(i\)の\(D\)が\(d\)であれば1、そうでなければ0を取る変数です。よって、傾向スコアが推定できれば、その逆数\((1/p_d(X))\) を掛ることでバランス後の平均値が推定できます。

7.2 傾向スコアの推定方法

傾向スコアの推定方法については、予測を目的とする要約 (Section 3) の手法を応用することができます。例えば以下のモデルを、シンプルにOLSを用いて推定することも可能です。 \[D\sim\beta_0+\beta_1X_1+..\] ただ多くの応用で、LogitやProbitなど、予測値が\([0,1]\) の範囲に収まることが保証される方法を用いることが多くなっています。

近年では、より柔軟な推定手法 (LASSOやRandomForest, Boostingなどの機械学習の手法)を用いることが増えています。既存の機械学習の手法が容易に応用できる点は、傾向スコアを用いることの大きな利点となります。

7.3 問題点

Inverse propensity score weightingを用いたバランス後の平均値推定は、傾向スコアの推定精度に決定的に依存しています。シンプルなモデルをLogitなどで推定した場合、モデル定式化の誤りが深刻となりえます。機械学習等のより柔軟な推定手法を用いれば、モデル定式化の誤りは減少しますが、依然として推定精度は不十分な場合が多いです¹。

以上の問題を克服するために、次節では \(Y\) の予測モデルも併用する推定方法 (Augmented inverse probability weighting) を紹介します。

7.4 例

7.5 他の方法

Balancing weightsを推定する様々な方法が提案されています。 Imai and Ratkovic (2014) は、\(X\) のバランスと\(p_d(X)\)を極力両立するように推定する方法を提案しています。 Iacus, King, and Porro (2012), Huling and Mak (2024) では、\(X\) の分布の距離(Energy distance)を最小化するようにweightを推定します。

7.6 Reference

Huling, Jared D, and Simon Mak. 2024. “Energy Balancing of Covariate Distributions.” Journal of Causal Inference 12 (1): 20220029.

Iacus, Stefano M, Gary King, and Giuseppe Porro. 2012. “Causal Inference Without Balance Checking: Coarsened Exact Matching.” Political Analysis 20 (1): 1–24.

Imai, Kosuke, and Marc Ratkovic. 2014. “Covariate Balancing Propensity Score.” Journal of the Royal Statistical Society Series B: Statistical Methodology 76 (1): 243–63.

Rosenbaum, Paul R, and Donald B Rubin. 1983. “The Central Role of the Propensity Score in Observational Studies for Causal Effects.” Biometrika 70 (1): 41–55.

この問題は収束の遅さとして知られています↩︎