分散分析について
- カテゴリごとの分散 vs 全体の分散をF分布を用いた検定を行うことで差があるかどうかを測定するもの
一元配置分散分析
用語説明
- あるカテゴリごとにいくつかサンプルがあるデータ
- e.g. 都道府県ごとの映画館の数
- 平方和
- カテゴリごとの平方和を求める
- カテゴリの平均の誤差の二乗和
- 全体の平方和を求める
- カテゴリごとの平方和を求める
- 自由度
- 自由度をカテゴリの数-1、全体のサンプル数-1それぞれ求める
- 平均平方
- 自由度を割った数
- F値
- 全体の平均平方/カテゴリの平均平方
- F値は
F(自由度n, 自由度m), n: カテゴリ-1, m: 全体-1を参照する
- 参考
分析プロセス
- カテゴリごとの平均を求める
- 全体の平均を求める
(カテゴリごとの平均 - 全体の平均)^2*カテゴリの要素数をすべてのカテゴリについて計算する(要素 - 全体の平均)^2をすべての要素について計算する- 残差を
[4] - [3]と定義する - カテゴリの自由度を
カテゴリ数-1とする - 全体の自由度を
要素数-1とする - 残差の自由度を
全体の自由度-カテゴリの自由度とする - カテゴリの平方平均は
[3]/[6]となる - 残差の平方平均は
[5]/[8]となる - F値は
[9]/[10]となる - 自由度
[6],[8]、値は[11]のF分布
計算順序表
二元配置分散分析
具体的な評価するデータ構造
分析プロセス
一元配置分散分析と似ているが相互作用を考える点が異なる
計算順序表