3  Balancing Weight

\(D\)間での\(X\)の分布をバランスを達成する実用的な手法は、数多く提案されています (Chattopadhyay, Hase, and Zubizarreta 2020; Bruns-Smith et al. 2023)。 このような手法を整理し、活用していくためには、Balancing weight という概念を導入することが有益です。

Balancing weightは、前章で導入したWeightの一種であり、\(D\)間での\(X\)の分布の乖離を調整するために用いられます。

3.1 Balancing Weightの定義

Balancing Weight
  • Balancing weight \(\omega(x,d)\)は、\(D\)間での\(X\)の分布の乖離を調整するために導入され、以下のように定義する。 \[D=1における事例割合\times \omega(x,1)\] \[= D=0における事例割合\times \omega(x,0)\] \[=ターゲットとなる割合\]

  • 定義式を変形すると \[\omega(x,d)=\frac{ターゲットとなる割合}{(D=d)グループにおける割合}\]

    • ターゲットに比べて過大な事例割合が過大なグループに対しては小さい、過小なグループに対しては大きなWeightを付与する。

ターゲットは、原理的には研究者が指定する必要があります。 代表的なものは、データ全体における\(X\)の分布です1

先のデータに適用すると、以下のようなBalancing Weightが計算されます。

平均価格 中心6区 取引年 事例割合 ターゲット割合 Weight
37.748 0 2021 0.784 0.782 0.997
60.474 1 2021 0.216 0.218 1.010
39.150 0 2022 0.779 0.782 1.003
64.814 1 2022 0.221 0.218 0.989

2022年と2021年を結合したデータ全体のうち、中心6区に立地する物件割合は\(21.8\%\) 、それ以外が \(78.2\%\) であったので、ターゲットして設定しています。

Balancing weightsを用いると、バランス後の平均値は以下のように計算できます

\[2021年のバランス後の平均値 =2021年の(\omega(X_i,2021)\times Y_i)の平均値\]

\[2022年のバランス後の平均値 =2022年の(\omega(X_i,2022)\times Y_i)の平均値\]

3.2 応用上の課題

\(X\)の組み合わせの種類に比べて、十分な事例数が存在するのであれば、Balancing weightは、データ上での\(X\)の割合を用いて計算できます2

しかしながら多くの応用研究では、バランスの対象となる \(X\) の数が多く、\(D=1\) または \(D=0\) のどちらかの事例しか存在しない組み合わせが対象に発生します。 このような組み合わせについては、Balancing weightsを計算することができず、Balanced comparisonが不可能となります。 この問題を解決するために、次節以降で紹介する、OLS (Chapter 4) や機械学習 (Chapter 6) などを用いた「近似的なバランス法」の活用が有用です。


  1. 因果推論の文脈では、平均効果 (Average Treatment Effect) と呼ばれています。↩︎

  2. この方法はExact MatchingやStratified Estimation (Wager 2024) として知られる方法による推定結果と完全に一致します。 例えばExact Matchingは、MatchIt package (Stuart et al. 2011) などを利用して実装できます。↩︎