• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

分散分析

date: 2021-08-24 excerpt: 分散分析について

tag: statistics


分散分析について

  • カテゴリごとの分散 vs 全体の分散をF分布を用いた検定を行うことで差があるかどうかを測定するもの

一元配置分散分析

用語説明

  • あるカテゴリごとにいくつかサンプルがあるデータ
    • e.g. 都道府県ごとの映画館の数
  • 平方和
    • カテゴリごとの平方和を求める
      • カテゴリの平均の誤差の二乗和
    • 全体の平方和を求める
  • 自由度
    • 自由度をカテゴリの数-1、全体のサンプル数-1それぞれ求める
  • 平均平方
    • 自由度を割った数
  • F値
    • 全体の平均平方/カテゴリの平均平方
    • F値はF(自由度n, 自由度m), n: カテゴリ-1, m: 全体-1を参照する
  • 参考

分析プロセス

  1. カテゴリごとの平均を求める
  2. 全体の平均を求める
  3. (カテゴリごとの平均 - 全体の平均)^2*カテゴリの要素数をすべてのカテゴリについて計算する
  4. (要素 - 全体の平均)^2をすべての要素について計算する
  5. 残差を[4] - [3]と定義する
  6. カテゴリの自由度をカテゴリ数-1とする
  7. 全体の自由度を要素数-1とする
  8. 残差の自由度を全体の自由度-カテゴリの自由度とする
  9. カテゴリの平方平均は[3]/[6]となる
  10. 残差の平方平均は[5]/[8]となる
  11. F値は[9]/[10]となる
  12. 自由度[6],[8]、値は[11]のF分布

計算順序表

二元配置分散分析

具体的な評価するデータ構造

分析プロセス

一元配置分散分析と似ているが相互作用を考える点が異なる

計算順序表



statistics Share Tweet