Rumah > Artikel > Peranti teknologi > Memperkenalkan klasifikasi algoritma pengesanan sasaran dan penunjuk prestasi penilaiannya
Pengesanan objek ialah tugas dalam penglihatan komputer yang digunakan untuk mengenal pasti dan mengesan objek dalam imej atau video. Ia memainkan peranan penting dalam aplikasi seperti pengawasan, pemanduan autonomi dan robotik. Algoritma pengesanan objek boleh dibahagikan secara meluas kepada dua kategori berdasarkan bilangan kali rangkaian menggunakan imej input yang sama.
Pengesanan Objek Tunggal meramalkan kehadiran dan lokasi objek dalam imej dalam laluan tunggal, meningkatkan kecekapan pengiraan.
Walau bagaimanapun, pengesanan objek satu pukulan biasanya tidak setepat kaedah lain, terutamanya apabila ia datang untuk mengesan objek kecil. Namun begitu, algoritma ini boleh mengesan objek dalam masa nyata dalam persekitaran terhad sumber.
Pengesanan objek biasanya menggunakan imej input dua kali untuk meramalkan kehadiran dan lokasi objek. Pengesanan pertama menjana satu set cadangan untuk lokasi objek yang berpotensi, manakala pengesanan kedua memperhalusi dan menapis cadangan ini untuk akhirnya menghasilkan ramalan yang paling tepat. Walaupun kaedah ini lebih tepat daripada pengesanan sasaran tunggal, ia juga meningkatkan kos pengiraan.
Secara amnya, pilihan antara pengesanan objek tunggal dan berganda bergantung pada keperluan khusus dan kekangan aplikasi.
Secara amnya, pengesanan sasaran tunggal lebih sesuai untuk aplikasi masa nyata, manakala pengesanan dua sasaran lebih sesuai untuk aplikasi yang ketepatan adalah lebih penting.
Untuk menentukan dan membandingkan prestasi ramalan model pengesanan objek yang berbeza, kami memerlukan metrik kuantitatif standard.
Dua metrik penilaian yang paling biasa ialah metrik Intersection over Union (IoU) dan Average Precision (AP).
IoU (Persimpangan atas Kesatuan) ialah metrik popular yang digunakan untuk mengukur ketepatan kedudukan dan mengira ralat kedudukan dalam model pengesanan objek.
Untuk mengira IoU antara kotak sempadan yang diramalkan dan kebenaran tanah, kami mula-mula mendapatkan kawasan persilangan antara dua kotak sempadan yang sepadan bagi objek yang sama. Selepas ini, kami mengira jumlah kawasan yang diliputi oleh dua kotak sempadan - juga dipanggil "kesatuan", dan kawasan bertindih di antara mereka dipanggil "persimpangan".
Persimpangan dibahagikan dengan Kesatuan memberikan nisbah pertindihan kepada jumlah luas, yang boleh menjadi anggaran yang baik tentang jarak dekat kotak sempadan yang diramalkan dengan kotak sempadan asal.
Ketepatan Purata (AP) dikira sebagai kawasan di bawah keluk ketepatan lawan ingat untuk satu set ramalan.
Panggilan semula dikira sebagai nisbah jumlah ramalan yang dibuat oleh model di bawah kategori tertentu kepada jumlah bilangan label sedia ada untuk kategori tersebut. Ketepatan ialah nisbah positif benar kepada jumlah ramalan yang dibuat oleh model.
Imbas kembali dan ketepatan memberikan pertukaran, diwakili secara grafik sebagai lengkung dengan mengubah ambang pengelasan. Kawasan di bawah keluk ketepatan lawan ingat kembali memberi kita ketepatan purata model untuk setiap kelas. Purata nilai ini merentas semua kategori dipanggil ketepatan min (mAP).
Atas ialah kandungan terperinci Memperkenalkan klasifikasi algoritma pengesanan sasaran dan penunjuk prestasi penilaiannya. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!