Maison >Périphériques technologiques >IA >Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

PHPzoriginal: 2024-06-06 12:33:01990parcourir

01 Aperçu d'Outlook

Actuellement, il est difficile de trouver un équilibre approprié entre l'efficacité de la détection et les résultats de la détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse.

02 Contexte et motivation

Avec le développement rapide de la technologie de télédétection, les images de télédétection optique haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. La détection d'objets joue un rôle essentiel dans l'interprétation des images de télédétection et peut être utilisée pour la segmentation, la description et le suivi de cibles des images de télédétection. Cependant, en raison de leur champ de vision relativement large et de leurs exigences en matière d'altitude élevée, les images aériennes de télédétection optique présentent une diversité d'échelle, de spécificité de point de vue, d'orientation aléatoire et de complexité d'arrière-plan élevée, alors que la plupart des ensembles de données traditionnels contiennent des vues terrestres. En conséquence, les techniques utilisées pour construire une détection artificielle de caractéristiques présentent traditionnellement de grandes différences en termes de précision et de vitesse. En raison des besoins de la société et du soutien au développement de l’apprentissage profond, l’utilisation de réseaux de neurones pour la détection de cibles dans les images de télédétection optique est nécessaire.

Actuellement, les algorithmes de détection de cibles qui combinent l'apprentissage profond pour analyser les photos de télédétection optique peuvent être divisés en trois types : supervisés, non supervisés et faiblement supervisés. Cependant, en raison de la complexité et de l’incertitude des algorithmes non supervisés et faiblement supervisés, les algorithmes supervisés sont les algorithmes les plus couramment utilisés. De plus, les algorithmes de détection d'objets supervisés peuvent être divisés en une ou deux étapes. En partant de l'hypothèse que les avions sont généralement situés dans des aéroports et que les navires sont généralement situés dans des ports et des océans, la détection des aéroports et des ports dans des images d'étoiles sous-échantillonnées, puis la cartographie des objets découverts avec les images satellite originales à ultra haute résolution peuvent détecter des objets de différentes tailles simultanément. Certains chercheurs ont proposé une méthode de détection de cible rotative basée sur RCNN, qui améliore la précision de la détection de cible dans les images de télédétection en résolvant le problème de randomisation des directions des cibles.

03 Nouvelle recherche d'algorithmes

La plupart des têtes de détection actuelles de la série YOLO sont basées sur les caractéristiques de sortie du FPN et du PAFPN. Parmi eux, les réseaux basés sur FPN, tels que YOLOv3, et leurs variantes sont présentés dans la figure. a ci-dessous. Ils utilisent directement la fonction de fusion unidirectionnelle pour la sortie. YOLOv4 et YOLOv5 basés sur l'algorithme PAFPN ajoutent sur cette base un canal de bas niveau à haut niveau, qui transmet directement les signaux de bas niveau vers le haut (b ci-dessous).