Rumah  >  Artikel  >  Peranti teknologi  >  Mengenai hubungan antara ukuran persamaan dan ukuran jarak

Mengenai hubungan antara ukuran persamaan dan ukuran jarak

WBOY
WBOYke hadapan
2024-01-22 18:21:141110semak imbas

Mengenai hubungan antara ukuran persamaan dan ukuran jarak

Dalam aplikasi pembelajaran mesin, ukuran persamaan ialah penunjuk yang digunakan untuk menilai persamaan dua objek sampel. Biasanya diwakili menggunakan ukuran jarak, ukuran jarak yang berkesan boleh meningkatkan prestasi model pembelajaran mesin.

Namun, dari segi hubungan berangka, ukuran persamaan dan ukuran jarak adalah sebaliknya.

Ukuran persamaan biasanya dinyatakan sebagai nilai berangka Semakin tinggi nilai, semakin serupa sampel data. Secara amnya, nombor antara 0 dan 1 digunakan untuk penukaran, di mana 0 menunjukkan persamaan rendah, iaitu objek data tidak serupa dan 1 menunjukkan persamaan tinggi, menunjukkan bahawa objek data adalah sangat serupa.

Metrik jarak menunjukkan bahawa persamaan objek data adalah berkadar songsang dengan nilai jarak.

Metrik jarak yang biasa digunakan

Jarak Euclidean

ialah metrik Euclidean, iaitu jarak minimum antara dua titik kebanyakan algoritma pembelajaran mesin menggunakan metrik jarak ini untuk mengukur persamaan.

Jarak Manhattan

Jarak Manhattan ialah jumlah perbezaan antara dua tempat dalam semua dimensi. Kerana hampir mustahil untuk bergerak dalam garis lurus di bandar, bangunan dikumpulkan ke dalam grid yang menghalang laluan lurus. Istilah "jarak Manhattan" sering digunakan untuk merujuk kepada jarak antara dua blok bandar.

Minkowski Distance

ialah bentuk umum jarak Euclidean dan jarak Manhattan, mentakrifkan jarak antara dua cerapan dalam ruang nD.

Jarak Hamming

Jarak Hamming mengukur persamaan dua tali yang sama panjang. Jarak hamming ialah bilangan mata yang mana aksara yang sepadan berbeza antara dua rentetan yang sama panjang.

Cosine Distance (Cosine Similarity)

Metrik ini digunakan secara meluas dalam perlombongan teks, pemprosesan bahasa semula jadi dan sistem perolehan maklumat untuk mengukur persamaan antara dua dokumen yang diberikan.

Jarak Chebyshev

Jarak Chebyshev antara dua cerapan atau vektor nD adalah sama dengan nilai mutlak maksimum perubahan antara koordinat sampel data. Dalam dunia dua dimensi, jarak Chebyshev antara titik data boleh ditentukan sebagai jumlah perbezaan mutlak koordinat dua dimensi mereka.

Mahalanobis Distance

digunakan terutamanya untuk ujian statistik berbilang variasi untuk mengukur jarak antara titik data dan pengedaran.

Chi-square Distance

Chi-square distance sering digunakan dalam penglihatan komputer, bersama-sama dengan analisis tekstur untuk mencari persamaan antara histogram ternormal, yang dipanggil "histogram matching" .

Korelasi Pearson

Pekali korelasi Pearson mengukur kekuatan hubungan monoton linear antara dua atribut dan mengukur sama ada kedua-dua set data berada pada satu baris.

Korelasi Spearman

Pekali korelasi Spearman ialah penunjuk bukan parametrik yang mengukur kebergantungan dua pembolehubah Ia menggunakan persamaan monoton untuk menilai korelasi dua pembolehubah statistik. Pekali korelasi Spearman sering digunakan untuk ujian hipotesis.

Atas ialah kandungan terperinci Mengenai hubungan antara ukuran persamaan dan ukuran jarak. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Artikel ini dikembalikan pada:163.com. Jika ada pelanggaran, sila hubungi admin@php.cn Padam