傾向スコアを利用した効果推定について
概要
- 因果推論を行う際に、セレクションバイアスがあることを解決するアプローチ
- 代表的な手法
- 傾向スコアを用いた逆確率重み付け法
- カテゴリに所属する確率をMLで求めることで、バイアスを解除する方法
- 傾向スコアマッチング
- カテゴリに所属する確率が近い or 特徴が近い者同士を比較し、効果量を測定する
- 傾向スコアを用いた逆確率重み付け法
傾向スコアを用いた逆確率重み付け法(IPW)
定式化
- Z; 介入を受けた場合
1
, 受けなかった場合0
- P; 介入を受ける確率(を推論)
- Y; 結果
- X; 介入を受けることを説明する特徴量
ˉYz=1=∑Ni=1ZiYi^P(Xi)∑Ni=1Zi^P(Xi)
- Y0の影響量を見積もる
ˉYz=0=∑Ni=1(1−Zi)Yi1−^P(Xi)∑Ni=1(1−Zi)1−^P(Xi)
- Y1の影響量を見積もる
推定効果量 ATE=ˆt=ˉYz=1−ˉYz=0
具体的なユースケース
- ビールを販売している会社があり、CMの効果を推定したい
- 路上で、粗品を配り、路上アンケートを求めた
- アンケートの結果で効果量を見積もれるが、
粗品に反応してアンケートを答える
人のバイアスが入ってしまう - このバイアスを解除するために、
粗品に反応してアンケートに答える確率
を計算するモデルを作成し、バイアスを解除する
- アンケートの結果で効果量を見積もれるが、
傾向スコアマッチング
- 似たサンプル同士を紐付けてその平均を取る
- 意外と安定している方法らしい