• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

区間推定

date: 2017-05-01 excerpt: 区間推定について

tag: 統計区間推定statistics


区間推定について

概要

  • 何の区間を推定したいか、何が既知なのかをうまく応用して推定を行う

母平均の区間推定(母分散が既知)

  • 母分散\(\sigma^2\), 標本数\(n\), 標本平均\(\bar{X}\)が既知で標準正規分布に従うとき
\[u = \frac{\bar{X} - \mu}{ \sqrt{\sigma^2/n}}\]

となるから片側97.5%で両側で0.95は

\[P(-1.95 \leq u \leq 1.95) = 0.95\] \[P(\bar{X} - 1.96 \sqrt{\sigma^2/n} \leq \mu \leq \bar{X} + 1.96 \sqrt{\sigma^2/n}) = 0.95\]

母平均の区間推定(母分散が未知)

  • 不偏分散\(s^2\)、標本平均\(\bar{X}\)とt分布を用いて計算する
\[\begin{align*} \overline{x}_n &= \frac{1}{n}\sum_{i=1}^n x_i \\ s^2_n &= \frac{1}{n - 1}\sum_{i=1}^n \left( x_i - \overline{x} \right) \end{align*}\]

t値が以下のようになる

\[\begin{equation*} t = \frac{\overline{X}_n - \mu}{\sqrt{s^2_n / n}} \end{equation*}\]

これを\(\mu\)について変形すると以下の式が得られる

\[\begin{equation*} \overline{X}_n - t_{n-1}^{\frac{1-\alpha}{2}} \sqrt{\frac{s^2_n}{n}} \le \mu \le \overline{X}_n + t_{n-1}^{\frac{1+\alpha}{2}} \sqrt{\frac{s^2_n}{n}} \end{equation*}\]
  • 参考
    • 母平均の信頼区間~母分散が未知の場合/TauStation

母分散の区間推定

偏差平方和を\(T^2 = \sum(X_i - \bar{X})^2\)とする

\[\chi^2 = \frac{T^2}{\sigma^2}\]

となり自由度n-1のカイ二乗分布に従う

\[P \left( \frac{T^2}{\chi^2_{0.025}(n-1)} \leq \sigma^2 \leq \frac{T^2}{\chi^2_{0.975}(n-1)} \right) = 0.95\]
  • 参考
    • 母分散・標準偏差の信頼区間~カイ二乗分布/TauStation
      • 実際の計算では参考リンクのように計算するとミスが少なさそう

分散の比の区間推定

2つの集団の分散を比較する際の指標

\(V = \frac{1}{n-1} \sum (X_i - \bar{X})^2 \)とすると

\(P\left( \frac{V_1}{V_2} \frac{1}{F_{0.025}(\phi_1,\phi_2)} \leq \frac{\sigma_1^2}{\sigma_2^2} \leq \frac{V_1}{V_2} \frac{1}{F_{0.975}(\phi_1,\phi_2)} \right) = 0.95\)

(母比率の)多項分布の信頼区間

\[u = \frac{\hat{p} - p }{\sqrt{\hat{p}(1-\hat{p})/n}}\]

が漸近的に標準分布に従うとき、

\[P \left( \hat{p_i} - 1.96\sqrt{\hat{p_i}(1-\hat{p_i})/n} \leq p_i \leq \hat{p_i} + 1.96\sqrt{\hat{p_i}(1-\hat{p_i})/n} \right) = 0.95\]
  • 参考
    • 母比率の信頼区間/TauStation


統計区間推定statistics Share Tweet