Chapter 1 概念整理

  • 本稿では条件付き母平均関数の推定とその応用に焦点を絞る

  • 条件付き母平均関数は以下で定義される

\[\mu(w)=E[Y_i|W_i=w]\]

  • 一般にデータから、条件付き母平均関数を”完璧”に推定することは不可能である。このため”妥協を伴う”ゴールを適切に設定する必要がある

1.1 推定のゴール

  • 大きく二つのゴールがある

    • 条件付き母平均関数 \(\mu(w)\) の近似: 平均二乗誤差 \(E[(\mu(w) - f(w))^2]\) を可能な限り削減する様に \(f(w)\) を推定

    • 関心のある変数 \(d\) について、記述モデルを推定: \(\tau(d,d',x)=\mu(d,x)-\mu(d',x)\) の重要な”特徴”を捉える単純化されたモデルを推定する

1.2 応用方法

  • 推定結果は以下のように応用できる

  • \(f(w)\) の応用:

    • \(Y\) の予測:データと同じ母集団から抽出された新たにサンプリ \(i\) について、 \(W_i\) から \(Y_i\) を予測するる。予測精度を平均二乗誤差で測定するのであれば母平均関数 \(\mu(w)\) が最善の予測関数となり、その近似関数 \(f(w)\) が現実的な予測値となる
  • \(\tau(x)\) の応用:

    • \(D\) が異なるグループ間での \(Y\) についての”格差”:変数\(D_i\)の値が異なる集団間において、結果変数\(Y_i\)の分布がどの程度異なっているのか、推定する。またこの際に、直接的な関心ではない変数群\(X_i\)を”一定”としたもとで、比較したいとする。全ての変数 \(W\) を考慮する訳ではないので、 \(\tau(d,d',x)\) を適切に推定する必要がある

    • \(D\)\(Y\) に与える因果効果:ある集団の変数\(D\)を変化させた場合、結果変数\(Y\)の分布がどのように変化するのか、因果効果を推定する。

      • 注意:因果効果を推定する際には、識別を議論する必要がある。 \(\tau(d,d',x)\) は以下の識別の仮定の下で、\(X_i=x\) を満たす集団内での平均因果効果と一致する
      1. \(0<\Pr[D_i=d|X_i]<1\): サブグループにおいても、原因変数の値にバリエーションが存在する。

      2. \(X\)で条件づけた場合、潜在結果関数と原因変数の実現値が独立している\(Y_i(d)\perp D_i|X_i=x\)

      • 十分条件:同じ\(X\)グループ内では、\(D\)の値がランダムに決定されている

      • 上記の仮定は、“selection-on-observable” と呼ばれ、多くの実践で用いられている。 この仮定の下では、\(\tau(d,d',x)\) を適切に推定する必要がある。 E[Y_i|X_i=x]-_{xc}E[Y_i|X_i=x]$$