Rumah >Peranti teknologi >AI >YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB
WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBasal
2024-06-12 17:49:26412semak imbas

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Alamat kertas: YOLOCS: Pengesanan Objek berdasarkan Pemampatan Saluran Padat untuk Pemejalan Ruang Ciri (arxiv.org)

01 Ringkasan

Dalam perkongsian pemeriksaan dan gradasi ciri hari ini, ciri-ciri penyelidik korelasi antara ciri saluran dan kernel lilitan semasa perambatan belakang, memfokuskan pada perambatan ke hadapan dan ke belakang dalam rangkaian. Oleh itu, penyelidik mencadangkan kaedah pemejalan ruang ciri yang dipanggil pemampatan saluran padat. Berdasarkan konsep teras kaedah tersebut, dua modul inovatif untuk rangkaian tulang belakang dan kepala diperkenalkan: mampatan saluran padat (DCFS) untuk pemejalan ruang ciri dan kepala decoupled mampatan berbilang peringkat asimetri (ADH). Apabila disepadukan ke dalam model YOLOv5, kedua-dua modul ini menunjukkan prestasi yang luar biasa, menghasilkan model yang lebih baik yang dikenali sebagai YOLOCS.

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Dinilai pada set data MSCOCO, AP bagi model YOLOCS besar, sederhana dan kecil masing-masing adalah 50.1%, 47.6% dan 42.5%. Walaupun mengekalkan kelajuan inferens yang serupa dengan model YOLOv5, model YOLOCS besar, sederhana dan kecil masing-masing mencapai kelebihan 1.1%, 2.3% dan 5.2% berbanding AP YOLOv5.

02 Latar Belakang

Dalam beberapa tahun kebelakangan ini, teknologi pengesanan objek telah mendapat perhatian yang meluas dalam bidang penglihatan komputer. Antaranya, teknologi pengesanan sasaran berdasarkan algoritma single shot multi-box (Single Shot Multi Box Detector, dirujuk sebagai SSD) dan teknologi pengesanan sasaran berdasarkan rangkaian neural convolutional (Convolutional Neural Networks, dirujuk sebagai CNN) adalah dua teknologi pengesanan sasaran yang paling biasa digunakan. Walau bagaimanapun, disebabkan ketepatan rendah algoritma berbilang bingkai tembakan tunggal dan kerumitan pengiraan tinggi bagi teknologi pengesanan sasaran berdasarkan rangkaian neural konvolusi, mencari teknologi pengesanan sasaran yang cekap dan berketepatan tinggi telah menjadi tumpuan dalam penyelidikan semasa. satu.

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Dense Channel Compression (DCC) ialah teknologi pemampatan rangkaian neural konvolusi baharu yang mencapai pemampatan dan pecutan parameter rangkaian dengan mengukuhkan peta ciri dalam rangkaian saraf konvolusi secara spatial. Walau bagaimanapun, aplikasi teknologi DCC dalam bidang pengesanan sasaran belum dikaji sepenuhnya. Teknologi Mampatan Saluran Padat (DCC) bertujuan untuk meningkatkan kecekapan pengiraan dengan mengurangkan bilangan parameter rangkaian. Khususnya, DCC mengurangkan bilangan parameter lapisan konvolusi dengan melakukan pemampatan saluran pada peta ciri keluaran lapisan konvolusi. Teknik mampatan ini boleh dicapai dengan mengalih keluar saluran yang berlebihan dan tidak perlu, atau menggunakan kaedah seperti penguraian peringkat rendah. Walaupun teknologi DCC sangat berkesan dalam tugas pengelasan imej, oleh itu, teknologi pengesanan sasaran berdasarkan Pemampatan Saluran Padat dicadangkan, dinamakan YOLOCS (YOLO dengan Pemampatan Saluran Padat). Teknologi YOLOCS menggabungkan teknologi DCC dengan algoritma YOLO (You Only Look Once) untuk mencapai pemprosesan pengesanan sasaran yang cekap dan berketepatan tinggi. Khususnya, teknologi YOLOCS menggunakan teknologi DCC untuk mengukuhkan peta ciri secara spatial, dengan itu mencapai kedudukan yang tepat bagi kedudukan sasaran pada masa yang sama, teknologi YOLOCS menggunakan ciri algoritma berbilang bingkai tunggal bagi algoritma YOLO untuk mencapai klasifikasi sasaran pengiraan.

03 Rangka Kerja BaharuYoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Mampatan Saluran Padat untuk Struktur Pemejalan Spatial Ciri (DCFS)

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan(gambar dalam kaedah penyelidikan yang dicadangkan di atas) sahaja isu antara lebar dan kedalaman rangkaian juga memampatkan ciri dari lapisan kedalaman yang berbeza melalui lilitan 3×3, mengurangkan bilangan saluran sebanyak separuh sebelum mengeluarkan dan menggabungkan ciri. Pendekatan ini membolehkan penyelidik memperhalusi keluaran ciri daripada lapisan berbeza ke tahap yang lebih besar, dengan itu meningkatkan kepelbagaian ciri dan keberkesanan semasa peringkat gabungan.

Selain itu, ciri termampat dari setiap lapisan datang dengan pemberat isirong lilitan yang lebih besar (3×3), dengan berkesan mengembangkan medan penerimaan ciri keluaran. Pendekatan ini dipanggil pemampatan saluran padat dipadatkan ruang ciri. Rasional di sebalik pemampatan saluran padat untuk pemejalan ruang ciri bergantung pada penggunaan kernel konvolusi yang lebih besar untuk memudahkan pemampatan saluran. Teknik ini mempunyai dua kelebihan utama: Pertama, ia mengembangkan medan penerimaan bagi persepsi ciri semasa penyebaran ke hadapan, dengan itu memastikan butiran ciri yang berkaitan serantau digabungkan untuk meminimumkan kehilangan ciri sepanjang peringkat pemampatan. Kedua, peningkatan butiran ralat semasa perambatan balik ralat membolehkan pelarasan berat yang lebih tepat.

Untuk menggambarkan lebih lanjut kedua-dua kelebihan ini, dua saluran dimampatkan menggunakan konvolusi dengan dua jenis kernel yang berbeza (1×1 dan 3×3), seperti yang ditunjukkan di bawah:

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Rangkaian DCFS Struktur ditunjukkan dalam rajah di bawah. Struktur kesesakan tiga lapisan digunakan untuk memampatkan saluran secara beransur-ansur semasa proses penyebaran ke hadapan rangkaian. Konvolusi 3×3 separuh saluran digunakan pada semua cawangan, diikuti oleh lapisan normalisasi kelompok (BN) dan fungsi pengaktifan. Selepas itu, lapisan konvolusi 1 × 1 digunakan untuk memampatkan saluran ciri output agar sepadan dengan saluran ciri input.

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

  • Asymmetric Multi-level Channel Compression Decoupled Head (ADH)

dalam rangka menyelesaikan masalah YOLO

ers menjalankan beberapa siri Penyelidikan dan eksperimen. Hasilnya mendedahkan korelasi logik antara penggunaan struktur kepala yang dipisahkan dan fungsi kehilangan yang berkaitan. Khususnya, untuk tugas yang berbeza, struktur kepala penyahgandingan hendaklah dilaraskan mengikut kerumitan pengiraan kerugian. Selain itu, apabila struktur kepala yang dipisahkan digunakan pada pelbagai tugas, memampatkan terus saluran ciri lapisan sebelumnya (seperti yang ditunjukkan di bawah) ke dalam saluran tugasan boleh mengakibatkan kehilangan ciri yang ketara disebabkan perbezaan dalam dimensi output akhir. Ini, seterusnya, boleh menjejaskan prestasi keseluruhan model.

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Tambahan pula, apabila mempertimbangkan kaedah pemampatan saluran padat yang dicadangkan untuk pemejalan ruang ciri, secara langsung mengurangkan bilangan saluran dalam lapisan akhir agar sepadan dengan saluran keluaran boleh menyebabkan kehilangan ciri semasa perambatan ke hadapan, dengan itu Mengurangkan prestasi rangkaian . Pada masa yang sama, dalam konteks perambatan balik, struktur ini boleh membawa kepada perambatan balik ralat suboptimum, menghalang pencapaian kestabilan kecerunan. Untuk menangani cabaran ini, kepala penyahgandingan baharu diperkenalkan, dipanggil kepala penyahgandingan mampatan berbilang peringkat asimetri (lihat Rajah (b) di bawah).

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Secara khusus, para penyelidik memperdalam laluan rangkaian yang dikhaskan untuk tugas pemarkahan sasaran dan menggunakan 3 konvolusi untuk mengembangkan medan penerimaan dan bilangan parameter tugas. Pada masa yang sama, ciri setiap lapisan konvolusi dimampatkan di sepanjang dimensi saluran. Kaedah ini bukan sahaja berkesan mengurangkan kesukaran latihan yang berkaitan dengan tugas pemarkahan sasaran dan meningkatkan prestasi model, tetapi juga mengurangkan parameter dan GFLOP modul kepala decoupled dengan ketara, dengan itu meningkatkan kelajuan inferens dengan ketara. Tambahan pula, 1 lapisan konvolusi digunakan untuk memisahkan tugasan klasifikasi dan kotak sempadan. Ini kerana untuk sampel positif yang dipadankan, kerugian yang berkaitan dengan kedua-dua tugas adalah agak kecil, sekali gus mengelakkan pelanjutan yang berlebihan. Pendekatan ini mengurangkan parameter dan GFLOP dengan ketara dalam pengepala penyahgandingan, akhirnya meningkatkan kelajuan inferens.

04 Visualisasi percubaan

Eksperimen Ablasi pada MS-COCO val2017

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

Perbandingan ujian YOLOCS, YOLOX dan YOLOX dan YOLOX pada MS-COCO val2017-r6.1

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan

YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan


🎜

Atas ialah kandungan terperinci YoloCS: Mengurangkan kerumitan ruang peta ciri dengan berkesan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn