ホームページ  >  記事  >  テクノロジー周辺機器  >  K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

王林
王林転載
2024-01-22 20:54:10615ブラウズ

k 最近傍アルゴリズムは、分類と認識のためのインスタンス ベースまたはメモリ ベースの機械学習アルゴリズムです。その原理は、特定のクエリ ポイントの最近傍データを見つけて分類することです。このアルゴリズムは保存されたトレーニング データに大きく依存しているため、ノンパラメトリック学習方法とみなすことができます。

k 最近傍アルゴリズムは、分類または回帰問題の処理に適しています。分類問題の場合は離散値を使用しますが、回帰問題の場合は連続値を使用します。分類する前に距離を定義する必要がありますが、一般的な距離の尺度には多くの選択肢があります。

ユークリッド距離

これは一般的に使用される距離の尺度であり、実数値ベクトルに適しています。この式は、クエリ ポイントと別のポイントの間の直線距離を測定します。

K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

ユークリッド距離の公式

マンハッタン距離

これも、2 点間の絶対値を測定する一般的な距離測定方法です。

K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

マンハッタン距離の公式

ミンコフスキー距離

この距離測定は、ユークリッド距離測定とマンハッタン距離測定の一般化された形式です。

K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

ミンコフスキー距離の式

ハミング距離

この手法は、ベクトルが一致しない点を特定するために、ブール値または文字列ベクトルとともによく使用されます。したがって、オーバーラップ対策とも呼ばれます。

K 最近傍アルゴリズムで一般的に使用される距離測定方法を適用する

ハミング距離の式

k 最近傍アルゴリズム距離の重要性を決定する

どのデータ ポイントが特定のクエリ ポイントに最も近いかを決定するには、次のようにします。クエリ ポイント間の距離と他のデータ ポイント間の距離を計算するために必要です。これらの距離測定は、クエリ ポイントをさまざまな領域に分割する決定境界を形成するのに役立ちます。

以上がK 最近傍アルゴリズムで一般的に使用される距離測定方法を適用するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は163.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。