Maison >Périphériques technologiques >IA >Application du traitement et de l'expression d'images dans l'apprentissage automatique
Tout d’abord, comprenons comment les images en noir et blanc sont stockées dans un ordinateur au format binaire. Les ordinateurs utilisent un pixel pour représenter la plus petite unité d'une image, et chaque pixel ne peut stocker que deux couleurs : noir ou blanc. L'ordinateur représente le noir par 0 et le blanc par 1, puis organise la valeur de couleur de chaque pixel en une série de nombres binaires afin de stocker l'intégralité de l'image en noir et blanc. Ensuite, nous verrons comment les images couleur sont stockées.
Chaque pixel de l'image est représenté par une valeur numérique. Ces valeurs numériques sont appelées valeurs de pixel, qui représentent la luminosité ou les informations de couleur du pixel. Dans les images en noir et blanc, les valeurs des pixels varient généralement de 0 à 1, où 0 représente le noir et 1 représente le blanc.
Ainsi, chaque image de l'ordinateur est enregistrée sous cette forme, elle contient une matrice de nombres, cette matrice est également appelée canal.
Une image en niveaux de gris est une image monochrome avec une seule couleur. Les images en niveaux de gris ne contiennent aucune information sur les couleurs, seulement des nuances de gris. Les niveaux de gris ne sont pas du noir et blanc, mais différentes nuances de gris. C'est ce qu'on appelle les niveaux de gris.
Les images normales en niveaux de gris contiennent généralement des données de 8 bits/pixel et ont 256 niveaux de gris. Les images 12 ou 16 bits/pixel sont couramment utilisées en imagerie médicale et en astronomie.
La valeur en pixels d'une image monochrome en niveaux de gris varie de 0 à 255, 0 représentant la couleur la plus sombre et 255 représentant la couleur la plus claire.
Les images couleur sont composées de trois couleurs : rouge, vert et bleu. Ces trois canaux de couleur sont disposés en RVB pour former une pile. Les images numériques couleur modernes suivent également ce principe, car toutes les couleurs peuvent être générées en mélangeant ces trois couleurs primaires.
Le traitement de l'espace tridimensionnel des images devient parfois complexe et redondant. Lors de l'extraction de caractéristiques, la compression de l'image dans une matrice bidimensionnelle peut simplifier le traitement. Ceci peut être réalisé grâce à une mise à l'échelle en niveaux de gris ou à une binarisation. La mise à l'échelle des niveaux de gris est plus riche que la binarisation car elle peut afficher l'image sous la forme d'une combinaison de différentes intensités de niveaux de gris. La binarisation construit simplement une matrice composée de 0 et de 1.
Par conséquent, lors de l'exécution de tâches de vision par ordinateur (CV) en apprentissage automatique, les fonctionnalités peuvent être extraites par compression, comme la conversion en niveaux de gris ou au format binaire.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!