デンドログラム

デンドログラム(dendrogram)は、階層的クラスタリングの結果を視覚的に表現する樹形図です。データポイントやクラスタ間の類似性(または距離)に基づいて、どのようにクラスタが形成されるかを示します。以下のような特徴があります:

  • 構造:木のような形状で、葉(個々のデータポイント)から始まり、枝が合流する点(クラスタの結合)を経て、根(すべてのデータを含むクラスタ)に至ります。
  • 用途:クラスタリングのプロセスやデータ間の関係性を理解するために使用されます。たとえば、生物学では系統樹、データ分析では類似性の可視化に役立ちます。
  • 読み方:縦軸(または横軸)はクラスタ間の距離や結合のタイミングを示し、枝の長さはクラスタ間の類似性の度合いを表します。

例:以下のシンプルなデンドログラムでは、データポイントA, B, Cがクラスタリングされる様子を示しています。

       ┬
      / \
     /   \
    ┬     C
   / \
  A   B

AとBが最初に近い距離でクラスタを形成し、その後Cと結合していることがわかります。