Maison >Périphériques technologiques >IA >Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

PHPz
PHPzoriginal
2024-06-06 12:33:01990parcourir

01 Aperçu d'Outlook

Actuellement, il est difficile de trouver un équilibre approprié entre l'efficacité de la détection et les résultats de la détection. Nous avons développé un algorithme YOLOv5 amélioré pour la détection de cibles dans des images de télédétection optique haute résolution, en utilisant des pyramides de caractéristiques multicouches, des stratégies de têtes de détection multiples et des modules d'attention hybrides pour améliorer l'effet du réseau de détection de cibles dans les images de télédétection optique. Selon l'ensemble de données SIMD, le mAP du nouvel algorithme est 2,2 % meilleur que YOLOv5 et 8,48 % meilleur que YOLOX, permettant ainsi d'obtenir un meilleur équilibre entre les résultats de détection et la vitesse.

02 Contexte et motivation

Avec le développement rapide de la technologie de télédétection, les images de télédétection optique haute résolution ont été utilisées pour décrire de nombreux objets à la surface de la Terre, notamment des avions, des voitures, des bâtiments, etc. La détection d'objets joue un rôle essentiel dans l'interprétation des images de télédétection et peut être utilisée pour la segmentation, la description et le suivi de cibles des images de télédétection. Cependant, en raison de leur champ de vision relativement large et de leurs exigences en matière d'altitude élevée, les images aériennes de télédétection optique présentent une diversité d'échelle, de spécificité de point de vue, d'orientation aléatoire et de complexité d'arrière-plan élevée, alors que la plupart des ensembles de données traditionnels contiennent des vues terrestres. En conséquence, les techniques utilisées pour construire une détection artificielle de caractéristiques présentent traditionnellement de grandes différences en termes de précision et de vitesse. En raison des besoins de la société et du soutien au développement de l’apprentissage profond, l’utilisation de réseaux de neurones pour la détection de cibles dans les images de télédétection optique est nécessaire.

Actuellement, les algorithmes de détection de cibles qui combinent l'apprentissage profond pour analyser les photos de télédétection optique peuvent être divisés en trois types : supervisés, non supervisés et faiblement supervisés. Cependant, en raison de la complexité et de l’incertitude des algorithmes non supervisés et faiblement supervisés, les algorithmes supervisés sont les algorithmes les plus couramment utilisés. De plus, les algorithmes de détection d'objets supervisés peuvent être divisés en une ou deux étapes. En partant de l'hypothèse que les avions sont généralement situés dans des aéroports et que les navires sont généralement situés dans des ports et des océans, la détection des aéroports et des ports dans des images d'étoiles sous-échantillonnées, puis la cartographie des objets découverts avec les images satellite originales à ultra haute résolution peuvent détecter des objets de différentes tailles simultanément. Certains chercheurs ont proposé une méthode de détection de cible rotative basée sur RCNN, qui améliore la précision de la détection de cible dans les images de télédétection en résolvant le problème de randomisation des directions des cibles.

03 Nouvelle recherche d'algorithmes

La plupart des têtes de détection actuelles de la série YOLO sont basées sur les caractéristiques de sortie du FPN et du PAFPN. Parmi eux, les réseaux basés sur FPN, tels que YOLOv3, et leurs variantes sont présentés dans la figure. a ci-dessous. Ils utilisent directement la fonction de fusion unidirectionnelle pour la sortie. YOLOv4 et YOLOv5 basés sur l'algorithme PAFPN ajoutent sur cette base un canal de bas niveau à haut niveau, qui transmet directement les signaux de bas niveau vers le haut (b ci-dessous).

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Comme le montre la figure ci-dessus, dans certaines études, une tête de détection a été ajoutée pour des tâches de détection spécifiques dans le modèle TPH-YOLOv5. Dans les figures b et c ci-dessus, seule la fonction PAFPN peut être utilisée pour la sortie, tandis que la fonction FPN n'est pas entièrement utilisée. Par conséquent, YOLOv7 connecte trois têtes auxiliaires à la sortie FPN, comme le montre la figure d ci-dessus, bien que les têtes auxiliaires ne soient utilisées que pour une « sélection grossière » et aient une évaluation de poids inférieure. La tête de détection SSD est proposée pour améliorer la conception trop grossière du jeu d'ancres du réseau YOLO, et propose une conception d'ancre dense basée sur plusieurs échelles. Comme le montre la figure f, cette stratégie peut utiliser simultanément les informations sur les fonctionnalités de PANet et de FPN. De plus, il existe un processus de sous-échantillonnage 64x qui ajoute directement la sortie, ce qui permet au réseau de contenir des informations globales précédentes.

La méthode des têtes de détection multiples peut utiliser efficacement les fonctionnalités de sortie du réseau. YOLO amélioré est un réseau de détection d'objets pour les photos de télédétection haute résolution. Comme le montre la figure ci-dessous :

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

La structure de base du réseau fédérateur est un réseau dense CSP avec des modules C3 et de convolution comme noyau. Après l'augmentation des données, les images sont introduites dans le réseau et après le mélange des canaux par le module Conv avec une taille de noyau 6, de nombreux modules convolutifs effectuent la récupération des fonctionnalités. Après un module d’amélioration des fonctionnalités appelé SPPF, ils sont connectés au PANet de Neck. Afin d'améliorer la capacité de détection du réseau, une fusion bidirectionnelle de fonctionnalités est effectuée. Conv2d est utilisé pour étendre indépendamment les couches de fonctionnalités fusionnées afin de générer des sorties multicouches. Comme le montre la figure ci-dessous, l'algorithme NMS combine les sorties de tous les détecteurs monocouche pour générer la trame de détection finale.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

La figure b ci-dessous décrit la composition structurelle de chaque module du réseau YOLO amélioré.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Conv comprend une couche de convolution 2D, une normalisation par lots de la couche BN et une fonction d'activation Silu, C3 comprend deux couches de convolution 2D et une couche de goulot d'étranglement, et Upsample est une couche de suréchantillonnage. Le module SPPF est une version accélérée du module SPP, le module MAB est comme mentionné ci-dessus et l'ECA est comme indiqué dans le coin inférieur gauche. Après un regroupement moyen global au niveau du canal sans réduction de dimensionnalité, des convolutions 1D rapides de taille k sont utilisées pour capturer des informations d'interaction locale entre canaux, en tenant compte de la relation de chaque canal avec ses k voisins, réalisant ainsi efficacement l'ECA. Les deux transformations ci-dessus collectent des caractéristiques le long de deux directions spatiales pour produire une paire de cartes de caractéristiques sensibles à la direction, qui sont ensuite concaténées et modifiées à l'aide de fonctions de convolution et sigmoïdes pour fournir une sortie d'attention.

04 Expérience et visualisation

L'ensemble de données SIMD est un ensemble de données de détection d'objets de télédétection multi-catégories, open source et haute résolution, contenant un total de 15 catégories, comme le montre la figure 4. De plus, l'ensemble de données SIMD est plus distribué dans les cibles de petite et moyenne taille (w

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Vous pouvez connecter la sortie du module SPPF à l'en-tête de sortie pour identifier les grandes cibles dans l'image. Cependant, la sortie du module SPPF a plusieurs connexions et implique des cibles à plusieurs échelles. Son utilisation directe pour la tête de détection afin d'identifier de gros objets entraînera une mauvaise représentation du modèle, comme le montre la figure ci-dessus, montrant avant et après l'ajout du module SPPF. Module MAB Comparaison visuelle des cartes thermiques de certains résultats de détection. Après avoir ajouté le module MAB, la tête de détection se concentre sur la détection de grandes cibles et attribue la prédiction des petites cibles à d'autres têtes de prédiction, ce qui améliore l'effet d'expression du modèle et est plus conforme aux exigences de division des têtes de détection en fonction de la cible. taille dans l'algorithme YOLO.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Certains résultats de tests sont présentés dans l'image ci-dessus. À en juger par chaque résultat de détection, il n'y a pas beaucoup de différence avec les autres algorithmes. Cependant, par rapport aux autres algorithmes, l'algorithme que nous avons étudié améliore l'effet de détection du modèle tout en garantissant que la consommation de temps n'augmente pas de manière significative et utilise le mécanisme d'attention pour. Améliorer l'effet d'expression du modèle.

Algorithme de détection amélioré : pour la détection de cibles dans des images de télédétection optique haute résolution

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn