• home
  • about
  • 全ての投稿
  • ソフトウェア・ハードウェアの設定のまとめ
  • 分析関連のまとめ
  • ヘルスケア関連のまとめ
  • 生涯学習関連のまとめ

dendrogram

date: 2019-08-01 excerpt: dendrogramと距離関数について

tag: statisticsdendrogramデンドログラム


dendrogramと距離関数について

距離の種類

  • 単リンク法(最近隣法); 2つのグループ間の最短距離
  • 完全リンク法(最遠隣法); 2つのグループ間の最大距離
  • 平均法(群平均法); すべての点の平均
  • ウォード法; クラスタ内の差の二乗の合計を最小化した点

ウォード法の特徴

合併することでクラスター内のサンプルのばらつきは増加するが、増加量が最も小さくなるように結合していくという特徴がある

デンドログラムの書き方

  1. 距離関数を決める
  2. 距離関数に基づき、最も近い2点を抽出する
  3. 2点を結ぶ
  4. 結んだ2点を新たな1点として定義し直す
  5. 1に戻る

google colab

  • colab

参考

  • Scikit-learnを用いた階層的クラスタリング (Hierarchical clustering)の解説


statisticsdendrogramデンドログラム Share Tweet