共分散(共変量)について
概要
- 英語ではcovariance
- 記号\(Cov\)
- 2つのデータ間の対応を確認できる指標
- \(Cov > 0\); 正の相関
- \(Cov = 0\); 相関なし
- \(Cov < 0\); 負の相関
- 因果推論の文脈で傾向スコアに対して大きな意味を持つ
- 多重共線性を解除するために必要
定式化
\[Cov[X,Y] = E[(X-\mu_X)(Y-\mu_Y)]\]これを変形し
\[E[(X-\mu_X)(Y-\mu_Y)] = E[XY] - \mu_Y E[X] - \mu_X E[Y] + \mu_X \mu_Y = E[XY] - \mu_X\mu_Y\]