分散分析について
- カテゴリごとの分散 vs 全体の分散をF分布を用いた検定を行うことで差があるかどうかを測定するもの
一元配置分散分析
用語説明
- あるカテゴリごとにいくつかサンプルがあるデータ
- e.g. 都道府県ごとの映画館の数
- 平方和
- カテゴリごとの平方和を求める
- カテゴリの平均の誤差の二乗和
- 全体の平方和を求める
- カテゴリごとの平方和を求める
- 自由度
- 自由度をカテゴリの数-1、全体のサンプル数-1それぞれ求める
- 平均平方
- 自由度を割った数
- F値
- 全体の平均平方/カテゴリの平均平方
- F値は
F(自由度n, 自由度m), n: カテゴリ-1, m: 全体-1
を参照する
- 参考
分析プロセス
- カテゴリごとの平均を求める
- 全体の平均を求める
(カテゴリごとの平均 - 全体の平均)^2*カテゴリの要素数
をすべてのカテゴリについて計算する(要素 - 全体の平均)^2
をすべての要素について計算する- 残差を
[4] - [3]
と定義する - カテゴリの自由度を
カテゴリ数-1
とする - 全体の自由度を
要素数-1
とする - 残差の自由度を
全体の自由度-カテゴリの自由度
とする - カテゴリの平方平均は
[3]/[6]
となる - 残差の平方平均は
[5]/[8]
となる - F値は
[9]/[10]
となる - 自由度
[6],[8]
、値は[11]
のF分布
計算順序表
二元配置分散分析
具体的な評価するデータ構造
分析プロセス
一元配置分散分析と似ているが相互作用を考える点が異なる