不偏分散について
概要
- 不偏分散は標本平均との各要素との差の二乗の和を
n-1
したものである - 感覚的にはサンプル数の
n
で割ってもいい気がするがなぜn-1
なのか- 標本分散の期待値を計算することで求めることができる
具体的な導出
標本分散を計算
\[\begin{equation*} s^2 = \frac{1}{n} \sum_{i=1}^{n} ( x_i - \overline{x} )^2 \end{equation*}\]サーメーション部分を展開して母平均を含めた表現に変形する
\[\begin{eqnarray*} \sum (x_i - \overline{x})^2 &=& \sum \left( (x_i - \mu) - (\overline{x} - \mu) \right)^2 \\ &=& \sum (x_i - \mu)^2 - 2 \sum (x_i - \mu)(\overline{x} - \mu) + \sum (\overline{x} - \mu)^2 \\ &=& \sum(x_i - \mu)^2 - 2 (\overline{x} - \mu) \sum (x_i - \mu) + n (\overline{x} - \mu)^2 \\ &=& \sum(x_i - \mu)^2 - n (\overline{x} - \mu)^2 \end{eqnarray*}\]これの期待値を取る
\[\begin{eqnarray*} E(s^2) &=& E \left( \frac{1}{n} \left( \sum(x_i - \mu)^2 - n (\overline{x} - \mu)^2 \right) \right) \\ &=& E \left( \frac{1}{n} \sum(x_i - \mu)^2 \right) - E \left( (\overline{x} - \mu)^2 \right) \end{eqnarray*}\]1項目の変形
\[\begin{equation*} E \left( \frac{1}{n} \sum(x_i - \mu)^2 \right) = \frac{1}{n} \sum E(x_i - \mu)^2 = \frac{1}{n} \sum \sigma^2 = \sigma^2 \end{equation*}\]2項目の変形は標本平均の分散の不偏推定量より(ここが少しむずかしい)
\[\begin{equation*} E \left( (\overline{x} - \mu)^2 \right) = \frac{\sigma^2}{n} \end{equation*}\]1項目と2項目の変形より
\[\begin{equation*} E(s^2) = \sigma^2 - \frac{\sigma^2}{n} = \frac{n-1}{n} \sigma^2 \end{equation*}\]変形を行う
\[\begin{equation*} E \left( \frac{n}{n-1} s^2 \right) = \sigma^2 \end{equation*}\]これより不偏推定量を\(u\)として次式で表される
\[\begin{equation*} u^2 = \frac{n}{n-1} s^2 = \frac{1}{n-1} \sum_{i=1}^{n} ( x_i - \overline{x} ) \end{equation*}\]