• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

不偏分散

date: 2017-04-23 excerpt: 不偏分散について

tag: 統計不偏推定量statistics


不偏分散について

概要

  • 不偏分散は標本平均との各要素との差の二乗の和をn-1したものである 
  • 感覚的にはサンプル数のnで割ってもいい気がするがなぜn-1なのか
    • 標本分散の期待値を計算することで求めることができる

具体的な導出

標本分散を計算

\[\begin{equation*} s^2 = \frac{1}{n} \sum_{i=1}^{n} ( x_i - \overline{x} )^2 \end{equation*}\]

サーメーション部分を展開して母平均を含めた表現に変形する

\[\begin{eqnarray*} \sum (x_i - \overline{x})^2 &=& \sum \left( (x_i - \mu) - (\overline{x} - \mu) \right)^2 \\ &=& \sum (x_i - \mu)^2 - 2 \sum (x_i - \mu)(\overline{x} - \mu) + \sum (\overline{x} - \mu)^2 \\ &=& \sum(x_i - \mu)^2 - 2 (\overline{x} - \mu) \sum (x_i - \mu) + n (\overline{x} - \mu)^2 \\ &=& \sum(x_i - \mu)^2 - n (\overline{x} - \mu)^2 \end{eqnarray*}\]

これの期待値を取る

\[\begin{eqnarray*} E(s^2) &=& E \left( \frac{1}{n} \left( \sum(x_i - \mu)^2 - n (\overline{x} - \mu)^2 \right) \right) \\ &=& E \left( \frac{1}{n} \sum(x_i - \mu)^2 \right) - E \left( (\overline{x} - \mu)^2 \right) \end{eqnarray*}\]

1項目の変形

\[\begin{equation*} E \left( \frac{1}{n} \sum(x_i - \mu)^2 \right) = \frac{1}{n} \sum E(x_i - \mu)^2 = \frac{1}{n} \sum \sigma^2 = \sigma^2 \end{equation*}\]

2項目の変形は標本平均の分散の不偏推定量より(ここが少しむずかしい)

\[\begin{equation*} E \left( (\overline{x} - \mu)^2 \right) = \frac{\sigma^2}{n} \end{equation*}\]

1項目と2項目の変形より

\[\begin{equation*} E(s^2) = \sigma^2 - \frac{\sigma^2}{n} = \frac{n-1}{n} \sigma^2 \end{equation*}\]

変形を行う

\[\begin{equation*} E \left( \frac{n}{n-1} s^2 \right) = \sigma^2 \end{equation*}\]

これより不偏推定量を\(u\)として次式で表される

\[\begin{equation*} u^2 = \frac{n}{n-1} s^2 = \frac{1}{n-1} \sum_{i=1}^{n} ( x_i - \overline{x} ) \end{equation*}\]

参考

  • 確率統計 – 不偏分散の導出/TauStation


統計不偏推定量statistics Share Tweet