平均価格 | 中心6区 | 取引年 | 事例割合 | ターゲット割合 | Weight |
---|---|---|---|---|---|
37.748 | 0 | 2021 | 0.784 | 0.782 | 0.997 |
60.474 | 1 | 2021 | 0.216 | 0.218 | 1.010 |
39.150 | 0 | 2022 | 0.779 | 0.782 | 1.003 |
64.814 | 1 | 2022 | 0.221 | 0.218 | 0.989 |
3 Balancing Weight
\(D\)間での\(X\)の分布をバランスを達成する実用的な手法は、数多く提案されています (Chattopadhyay, Hase, and Zubizarreta 2020; Bruns-Smith et al. 2023)。 このような手法を整理し、活用していくためには、Balancing weight という概念を導入することが有益です。
Balancing weightは、前章で導入したWeightの一種であり、\(D\)間での\(X\)の分布の乖離を調整するために用いられます。
3.1 Balancing Weightの定義
Balancing weight \(\omega(x,d)\)は、\(D\)間での\(X\)の分布の乖離を調整するために導入され、以下のように定義する。 \[D=1における事例割合\times \omega(x,1)\] \[= D=0における事例割合\times \omega(x,0)\] \[=ターゲットとなる割合\]
定義式を変形すると \[\omega(x,d)=\frac{ターゲットとなる割合}{(D=d)グループにおける割合}\]
- ターゲットに比べて過大な事例割合が過大なグループに対しては小さい、過小なグループに対しては大きなWeightを付与する。
ターゲットは、原理的には研究者が指定する必要があります。 代表的なものは、データ全体における\(X\)の分布です1。
先のデータに適用すると、以下のようなBalancing Weightが計算されます。
2022年と2021年を結合したデータ全体のうち、中心6区に立地する物件割合は\(21.8\%\) 、それ以外が \(78.2\%\) であったので、ターゲットして設定しています。
Balancing weightsを用いると、バランス後の平均値は以下のように計算できます
\[2021年のバランス後の平均値 =2021年の(\omega(X_i,2021)\times Y_i)の平均値\]
\[2022年のバランス後の平均値 =2022年の(\omega(X_i,2022)\times Y_i)の平均値\]
3.2 応用上の課題
\(X\)の組み合わせの種類に比べて、十分な事例数が存在するのであれば、Balancing weightは、データ上での\(X\)の割合を用いて計算できます2。
しかしながら多くの応用研究では、バランスの対象となる \(X\) の数が多く、\(D=1\) または \(D=0\) のどちらかの事例しか存在しない組み合わせが対象に発生します。 このような組み合わせについては、Balancing weightsを計算することができず、Balanced comparisonが不可能となります。 この問題を解決するために、次節以降で紹介する、OLS (Chapter 4) や機械学習 (Chapter 6) などを用いた「近似的なバランス法」の活用が有用です。
因果推論の文脈では、平均効果 (Average Treatment Effect) と呼ばれています。↩︎
この方法はExact MatchingやStratified Estimation (Wager 2024) として知られる方法による推定結果と完全に一致します。 例えばExact Matchingは、MatchIt package (Stuart et al. 2011) などを利用して実装できます。↩︎