Rumah >Peranti teknologi >AI >Sejarah pembangunan dan set data pengecaman muka yang biasa digunakan
Kaedah awal tertumpu terutamanya pada bekerja dengan pakar penglihatan komputer untuk mengekstrak ciri buatan tangan dan menggunakan algoritma pembelajaran mesin tradisional untuk melatih pengelas yang berkesan untuk pengesanan. Walau bagaimanapun, batasan kaedah ini ialah pakar diperlukan untuk menghasilkan ciri yang berkesan, dan setiap komponen perlu dioptimumkan secara individu, menyebabkan keseluruhan saluran pengesanan tidak dioptimumkan. Untuk menyelesaikan masalah ini, ciri-ciri yang lebih kompleks seperti HOG, SIFT, SURF dan ACF telah dicadangkan. Untuk meningkatkan keteguhan pengesanan, gabungan berbilang pengesan yang dilatih untuk pandangan atau pose yang berbeza juga telah dibangunkan. Walau bagaimanapun, model ini memerlukan masa latihan dan ujian yang panjang serta mempunyai peningkatan terhad dalam prestasi pengesanan.
Dalam beberapa tahun kebelakangan ini, penyelidikan mengenai pengecaman muka telah mencapai kemajuan yang ketara, terutamanya aplikasi rangkaian neural konvolusi dalam (CNN). Kaedah pembelajaran mendalam telah mencapai kejayaan yang luar biasa dalam tugas penglihatan komputer dan mempunyai banyak kelebihan berbanding kaedah tradisional. Kaedah pembelajaran mendalam mengelakkan saluran paip reka bentuk buatan tangan, yang menjadikan model lebih fleksibel dan boleh disesuaikan dengan set data yang berbeza. Tambahan pula, kaedah pembelajaran mendalam telah menunjukkan prestasi yang baik dalam banyak penilaian penanda aras, seperti Cabaran Pengecaman Visual Skala Besar ImageNet (ILSVRC). Kemajuan ini telah membolehkan pengecaman muka digunakan secara meluas dalam pelbagai bidang, daripada pengawasan keselamatan hingga buka kunci muka.
Baru-baru ini, penyelidik telah membuat kemajuan yang menarik dalam bidang pengesanan objek umum, menggunakan Faster R-CNN, pengesan objek lanjutan. Dengan menggabungkan latihan bersama CNN lata, rangkaian cadangan wilayah (RPN) dan Faster R-CNN, para penyelidik mencapai pengoptimuman hujung ke hujung dan mencapai hasil yang menggalakkan. Dari segi pengesanan muka, algoritma Faster R-CNN digabungkan dengan perlombongan negatif keras dan ResNet, yang meningkatkan prestasinya pada penanda aras pengesanan muka seperti FDDB. Pendekatan gabungan ini menjadikan algoritma pengesanan muka lebih tepat dan boleh dipercayai. Ringkasnya, Faster R-CNN dan latihan bersama serta algoritma gabungannya telah membawa kemajuan yang ketara kepada bidang pengesanan objek dan pengesanan muka, dan membuka hala tuju baharu untuk pembangunan teknologi pembelajaran mendalam.
Set data AFW: Set data AFW dibina menggunakan imej Flickr. Ia termasuk 205 imej dan 473 muka berlabel. Untuk setiap wajah, anotasi imej termasuk kotak sempadan segi empat tepat, 6 tanda tempat dan sudut pose.
dataset PASCAL FACE: Set data ini digunakan untuk pengecaman muka dan pengecaman muka; ia adalah subset PASCAL VOC dan mengandungi 1335 muka berlabel dalam 851 imej dengan penampilan muka yang besar dan variasi pose.
Pangkalan data muka MIT CBCL: Pangkalan data pengecaman muka MIT-CBCL mengandungi set latihan (2429 muka, 4548 bukan muka) dan set anggaran (472 muka, 23573 bukan muka).
Set Data FDDB: Set data ini mengandungi 5171 muka dengan anotasi seperti oklusi, pose sukar dan peleraian imej rendah dalam 2845 imej. Imej ini digunakan untuk latihan tentang variasi penampilan yang besar, oklusi yang teruk dan kemerosotan kabur yang teruk, yang biasa berlaku apabila mengesan wajah dalam senario kehidupan sebenar tanpa batasan.
Pangkalan data CMU PIE: Pangkalan data CMU Multi-PIE Face mengandungi 41,368 imej 68 orang, dengan setiap orang dalam 13 pose berbeza, 43 keadaan pencahayaan berbeza dan 4 ekspresi berbeza.
Set Data SCface: SCface ialah pangkalan data imej statik muka. Imej-imej itu dirakam menggunakan lima kamera pengawasan video dengan kualiti yang berbeza-beza dalam persekitaran dalaman yang tidak terkawal. Set data ini mengandungi 4160 imej statik (spektrum kelihatan dan inframerah) daripada 130 subjek.
Setset WAJAH LEBIH LEBIH: Set data penanda aras pengesanan muka termasuk 32,203 imej dan 393,703 muka berlabel, yang sangat berubah-ubah dalam skala, pose dan oklusi, menjadikan pengesanan wajah amat mencabar seks. Tambahan pula, set data WIDER FACE disusun mengikut 61 kategori acara.
Atas ialah kandungan terperinci Sejarah pembangunan dan set data pengecaman muka yang biasa digunakan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!