クラスター分析には主に 5 つのタイプがあります: 階層クラスタリング (距離ベース) 分割クラスタリング (k-means、k-medoid、ファジー c-means) 密度クラスタリング (DBSCAN、OPTICS) スペクトル クラスタリング (ラプラシアン特性)マップ) その他のクラスタリング アルゴリズム (モデル、ニューラル ネットワークに基づく)
#クラスター分析の種類
クラスター分析はデータポイントを同様の特性を持つカテゴリにグループ化するために使用される教師なし機械学習手法。クラスタリング アルゴリズムは多数あり、それぞれに独自の長所と短所があります。
階層的クラスタリング
- 距離ベース: ユークリッド距離やコサイン類似度などの距離メトリックを使用して、データ ポイント間の類似性を特定します。彼ら。
- 凝集: 各データ ポイントから開始し、必要なクラスター数に達するまで、最も類似したクラスターを徐々にマージします。
- 分割: すべてのデータ ポイントを含むクラスターから開始し、必要なクラスター数に達するまで徐々に分割します。
クラスターの分割
- k-mean:データ ポイントを k 個のクラスターに割り当て、各クラスターの中心が平均になりますクラスター内のすべてのデータポイントの。
- k 中心点: データ ポイントを k 個のクラスターに割り当てます。各クラスターの中心は、クラスター内のすべてのデータ ポイントの重心 (中央値) になります。
- ファジー C 平均法: データ ポイントが複数のクラスターに属することを許可します。そのメンバーシップはファジー値 (0 ~ 1) で表されます。
密度クラスタリング
- DBSCAN: データ ポイントを高密度領域にグループ化し、領域は分離によって分離されます。低密度領域の。
- 光学: 各データ ポイントとその近傍の密度を計算して、データ ポイントを階層に編成します。
スペクトル クラスタリング
- グラフに基づく: データ ポイントをグラフ内のノードとして表し、グラフ理論手法を使用してクラスターを特定します。
- ラプラシアン固有マップ: データ点の類似度行列を使用してラプラシアン行列を構築し、固有分解を実行してクラスターを識別します。
その他のクラスタリング アルゴリズム
- モデルベース: 統計モデル (混合ガウス モデルなど) を使用してデータをクラスタリングします親切。
- ニューラル ネットワーク: ニューラル ネットワーク アーキテクチャを使用して、データ ポイント間の類似性を学習します。
以上がクラスター分析にはどのような種類がありますか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。