dendrogramと距離関数について
距離の種類
- 単リンク法(最近隣法); 2つのグループ間の最短距離
- 完全リンク法(最遠隣法); 2つのグループ間の最大距離
- 平均法(群平均法); すべての点の平均
- ウォード法; クラスタ内の差の二乗の合計を最小化した点
ウォード法の特徴
合併することでクラスター内のサンプルのばらつきは増加するが、増加量が最も小さくなるように結合していくという特徴がある
デンドログラムの書き方
- 距離関数を決める
- 距離関数に基づき、最も近い2点を抽出する
- 2点を結ぶ
- 結んだ2点を新たな1点として定義し直す
- 1に戻る