Rumah >Peranti teknologi >AI >Algoritma pengesanan yang dipertingkatkan: untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi

Algoritma pengesanan yang dipertingkatkan: untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi

PHPzasal: 2024-06-06 12:33:01980semak imbas

01 Tinjauan Tinjauan

Pada masa ini, sukar untuk mencapai keseimbangan yang tepat antara kecekapan pengesanan dan hasil pengesanan. Kami telah membangunkan algoritma YOLOv5 yang dipertingkatkan untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi, menggunakan piramid ciri berbilang lapisan, strategi kepala pengesanan berbilang dan modul perhatian hibrid untuk meningkatkan kesan rangkaian pengesanan sasaran dalam imej penderiaan jauh optik. Menurut set data SIMD, peta algoritma baharu adalah 2.2% lebih baik daripada YOLOv5 dan 8.48% lebih baik daripada YOLOX, mencapai keseimbangan yang lebih baik antara hasil pengesanan dan kelajuan.

02 Latar Belakang & Motivasi

Dengan perkembangan pesat teknologi penderiaan jauh, imej penderiaan jauh optik resolusi tinggi telah digunakan untuk menggambarkan banyak objek di permukaan bumi, termasuk pesawat, kereta, bangunan, dll. Pengesanan objek memainkan peranan penting dalam tafsiran imej penderiaan jauh dan boleh digunakan untuk pembahagian, penerangan dan penjejakan sasaran imej penderiaan jauh. Walau bagaimanapun, disebabkan medan pandangan yang agak besar dan keperluan altitud tinggi, imej penderiaan jauh optik udara mempamerkan kepelbagaian dalam skala, kekhususan sudut pandangan, orientasi rawak dan kerumitan latar belakang yang tinggi, manakala kebanyakan set data tradisional mengandungi pandangan darat . Akibatnya, teknik yang digunakan untuk membina pengesanan ciri buatan secara tradisinya mempunyai rekod perbezaan besar dalam ketepatan dan kelajuan. Disebabkan keperluan masyarakat dan sokongan pembangunan pembelajaran mendalam, penggunaan rangkaian saraf untuk pengesanan sasaran dalam imej penderiaan jauh optik adalah perlu.

Pada masa ini, algoritma pengesanan sasaran yang menggabungkan pembelajaran mendalam untuk menganalisis foto penderiaan jauh optik boleh dibahagikan kepada tiga jenis: diawasi, tidak diawasi dan diawasi lemah. Walau bagaimanapun, disebabkan oleh kerumitan dan ketidakpastian algoritma yang tidak diselia dan diselia dengan lemah, algoritma yang diselia ialah algoritma yang paling biasa digunakan. Tambahan pula, algoritma pengesanan objek yang diselia boleh dibahagikan kepada satu peringkat atau dua peringkat. Berdasarkan andaian bahawa pesawat biasanya terletak di lapangan terbang dan kapal biasanya terletak di pelabuhan dan lautan, mengesan lapangan terbang dan pelabuhan dalam imej bintang yang dikurangkan dan kemudian memetakan objek yang ditemui kembali kepada imej satelit resolusi ultra tinggi asal boleh mengesan objek saiz yang berbeza secara serentak. Sesetengah penyelidik telah mencadangkan kaedah pengesanan sasaran berputar berdasarkan RCNN, yang meningkatkan ketepatan pengesanan sasaran dalam imej penderiaan jauh dengan menyelesaikan masalah rawak arah sasaran.

03 Penyelidikan algoritma baharu

Kebanyakan kepala pengesanan siri YOLO semasa adalah berdasarkan ciri keluaran FPN dan PAFPN Antaranya, rangkaian berasaskan FPN, seperti YOLOv3, dan variannya ditunjukkan dalam Rajah a di bawah. Mereka secara langsung menggunakan ciri gabungan sehala untuk output. YOLOv4 dan YOLOv5 berdasarkan algoritma PAFPN menambah saluran tahap rendah ke tahap tinggi atas dasar ini, yang secara langsung menghantar isyarat tahap rendah ke atas (b di bawah).