• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

BIC

date: 2019-07-04 excerpt: ベイズ情報基準量(BIC)について

tag: BICベイズ情報基準量


ベイズ情報基準量(BIC)について

概要

  • 最適なパラメータ数を特定するための基準量
  • 小さいほどよい
  • AICは真の分布との距離をKL距離で定義していたが、BICはベイズファクターと呼ばれるものの比を計算する

エビデンス(周辺尤度)について

  • 事後分布を求める関数を定義したときの分母

事後分布

\[\Pi(\theta\mid y)=\frac{L(y\mid\theta)p(\theta)}{m(y)}\]

m(エビデンス)について変形する

\[m(y)=\int L(y\mid\theta)p(\theta)d\theta\]

m(エビデンス)について対数を取る

\[\log m(y)=\log L(y\mid\theta)+\log p(\theta)-\log\Pi(\theta\mid y)\]

ラプラス近似を計算する

\[2\log m(y)\approx 2\log L(y\mid\hat\theta)+2\log p(\hat\theta)+d\log 2\pi-d\log n-\log det(J(\hat\theta))\]

ベイズファクターの計算

  • 2つのエビデンスの比をベイズファクターと呼ぶ
  • サンプルサイズが大きいとき
    • 分子のほうがデータにフィットしているとき∞
    • 分母のほうがデータにフィットしているとき0

BICの導出

ラプラス近似で定数に収束する部分を除外し、マイナスを乗じると

\[BIC=-2\log L(y\mid\hat\theta)+d\log n\]
  • \(L\); 尤度関数
  • \(d\); 独立変数の数
  • \(n\); 標本の大きさ

参考

  • BICとは何か/Qiita
  • ベイズ情報量規準/Wikipedia


BICベイズ情報基準量 Share Tweet