Heim >Technologie-Peripheriegeräte >KI >Verbesserter Erkennungsalgorithmus: zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern

Verbesserter Erkennungsalgorithmus: zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern

PHPzOriginal: 2024-06-06 12:33:011216Durchsuche

01 Ausblick im Überblick

Derzeit ist es schwierig, das richtige Gleichgewicht zwischen Erkennungseffizienz und Erkennungsergebnissen zu finden. Wir haben einen verbesserten YOLOv5-Algorithmus zur Zielerkennung in hochauflösenden optischen Fernerkundungsbildern entwickelt, der mehrschichtige Merkmalspyramiden, Multierkennungskopfstrategien und hybride Aufmerksamkeitsmodule verwendet, um die Wirkung des Zielerkennungsnetzwerks in optischen Fernerkundungsbildern zu verbessern. Laut SIMD-Datensatz ist der mAP des neuen Algorithmus 2,2 % besser als YOLOv5 und 8,48 % besser als YOLOX, wodurch ein besseres Gleichgewicht zwischen Erkennungsergebnissen und Geschwindigkeit erreicht wird.

02 Hintergrund & Motivation

Mit der rasanten Entwicklung der Fernerkundungstechnologie wurden hochauflösende optische Fernerkundungsbilder verwendet, um viele Objekte auf der Erdoberfläche zu beschreiben, darunter Flugzeuge, Autos, Gebäude usw. Die Objekterkennung spielt eine entscheidende Rolle bei der Interpretation von Fernerkundungsbildern und kann zur Segmentierung, Beschreibung und Zielverfolgung von Fernerkundungsbildern verwendet werden. Aufgrund ihres relativ großen Sichtfelds und der Notwendigkeit großer Höhen weisen optische Fernerkundungsbilder aus der Luft jedoch Unterschiede in Bezug auf Maßstab, Blickpunktspezifität, zufällige Ausrichtung und hohe Hintergrundkomplexität auf, während die meisten herkömmlichen Datensätze terrestrische Ansichten enthalten. Daher weisen die zur Konstruktion künstlicher Merkmalserkennung verwendeten Techniken traditionell große Unterschiede in Genauigkeit und Geschwindigkeit auf. Aufgrund der Bedürfnisse der Gesellschaft und der Unterstützung der Entwicklung von Deep Learning ist der Einsatz neuronaler Netze zur Zielerkennung in optischen Fernerkundungsbildern notwendig.

Derzeit können Zielerkennungsalgorithmen, die Deep Learning zur Analyse optischer Fernerkundungsfotos kombinieren, in drei Typen unterteilt werden: überwacht, unbeaufsichtigt und schwach überwacht. Aufgrund der Komplexität und Unsicherheit unbeaufsichtigter und schwach überwachter Algorithmen sind überwachte Algorithmen jedoch die am häufigsten verwendeten Algorithmen. Darüber hinaus können überwachte Objekterkennungsalgorithmen in einstufige oder zweistufige Algorithmen unterteilt werden. Basierend auf der Annahme, dass sich Flugzeuge normalerweise an Flughäfen und Schiffe normalerweise an Häfen und Ozeanen befinden, können durch die Erkennung von Flughäfen und Häfen in heruntergesampelten Sternbildern und die anschließende Zuordnung der entdeckten Objekte auf die ursprünglichen ultrahochaufgelösten Satellitenbilder Objekte von erkannt werden verschiedene Größen gleichzeitig. Einige Forscher haben eine auf RCNN basierende rotierende Zielerkennungsmethode vorgeschlagen, die die Genauigkeit der Zielerkennung in Fernerkundungsbildern verbessert, indem das Randomisierungsproblem der Zielrichtungen gelöst wird.

03 Neue Algorithmusforschung

Die meisten Erkennungsköpfe der aktuellen YOLO-Serie basieren auf den Ausgabeeigenschaften von FPN und PAFPN. Darunter sind FPN-basierte Netzwerke wie YOLOv3 und ihre Varianten in Abbildung dargestellt a unten Sie nutzen direkt die Einweg-Fusionsfunktion für die Ausgabe. YOLOv4 und YOLOv5 basieren auf dem PAFPN-Algorithmus und fügen auf dieser Basis einen Low-Level-zu-High-Level-Kanal hinzu, der Low-Level-Signale direkt nach oben überträgt (b unten).