Maison  >  Article  >  Quel est le principal contenu de recherche en vision par ordinateur ?

Quel est le principal contenu de recherche en vision par ordinateur ?

青灯夜游
青灯夜游original
2020-12-04 11:19:469045parcourir

Le principal contenu de recherche en vision par ordinateur est : l'utilisation de caméras et d'ordinateurs pour remplacer les yeux humains pour la vision industrielle, comme la reconnaissance, le suivi et la mesure de cibles, ainsi que le traitement graphique ultérieur, ce qui rend le traitement informatique plus adapté à l'observation de l'œil humain ou Images envoyées à l’instrument pour détection.

Quel est le principal contenu de recherche en vision par ordinateur ?

Recommandations associées : "Introduction à la programmation"

La vision par ordinateur est l'étude de la façon de fabriquer des machines "voir " La science, pour aller plus loin, fait référence à l'utilisation de caméras et d'ordinateurs pour remplacer les yeux humains dans la vision industrielle, comme l'identification, le suivi et la mesure de cibles, ainsi que le traitement graphique ultérieur pour rendre le traitement informatique plus adapté à l'observation de l'œil humain ou à la transmission à des instruments. pour la détection d'images.

En tant que discipline scientifique, la vision par ordinateur étudie les théories et technologies connexes, en essayant de construire des systèmes d'intelligence artificielle capables d'obtenir des « informations » à partir d'images ou de données multidimensionnelles. Les informations mentionnées ici font référence aux informations définies par Shannon qui peuvent être utilisées pour aider à prendre une « décision ».

Parce que la perception peut être considérée comme l'extraction d'informations à partir de signaux sensoriels, la vision par ordinateur peut également être considérée comme la science qui étudie comment faire en sorte que les systèmes artificiels « perçoivent » à partir d'images ou de données multidimensionnelles.

La vision par ordinateur est une simulation de la vision biologique à l'aide d'ordinateurs et d'équipements associés. Sa tâche principale est d'obtenir des informations tridimensionnelles sur la scène correspondante en traitant les images ou vidéos collectées, tout comme ce que font quotidiennement les humains et de nombreuses autres créatures.

Connexes

Il existe de nombreuses disciplines dont les objectifs de recherche sont similaires ou liés à la vision par ordinateur. Ces disciplines comprennent le traitement d'images, la reconnaissance de formes ou reconnaissance d'images, l'analyse de scènes, la compréhension d'images, etc. La vision par ordinateur comprend le traitement d'images et la reconnaissance de formes. Elle comprend également la description des formes spatiales, la modélisation géométrique et les processus cognitifs. Parvenir à la compréhension des images est le but ultime de la vision par ordinateur.

1. Traitement d'image

La technologie de traitement d'image convertit l'image d'entrée en une autre image avec les caractéristiques souhaitées. Par exemple, l'image de sortie peut être traitée pour avoir un rapport signal/bruit plus élevé, ou les détails de l'image peuvent être mis en évidence grâce à un traitement d'amélioration pour faciliter l'inspection par l'opérateur. La technologie de traitement d’image est souvent utilisée pour le prétraitement et l’extraction de caractéristiques dans la recherche en vision par ordinateur.

2. Reconnaissance de formes

La technologie de reconnaissance de formes divise les images en catégories prédéterminées en fonction des caractéristiques statistiques ou des informations structurelles extraites de l'image. Par exemple, la reconnaissance de texte ou la reconnaissance d'empreintes digitales. En vision par ordinateur, la technologie de reconnaissance de formes est souvent utilisée pour identifier et classer certaines parties d'une image, telles que les zones segmentées.

3. Compréhension de l'image

Étant donné une image, le programme de compréhension de l'image décrit non seulement l'image elle-même, mais décrit et interprète également la scène représentée par l'image afin de prendre des décisions concernant le contenu. représenté par l’image. Au début de la recherche sur la vision en intelligence artificielle, le terme analyse de scène était souvent utilisé pour souligner la différence entre les images bidimensionnelles et les scènes tridimensionnelles. Outre le traitement complexe des images, la compréhension des images nécessite également des connaissances sur les lois physiques de l’imagerie de la scène et des connaissances liées au contenu de la scène.

Lors de la construction d'un système de vision par ordinateur, les technologies pertinentes dans les disciplines ci-dessus doivent être utilisées, mais le contenu de la recherche en vision par ordinateur est plus large que ces disciplines. L'étude de la vision par ordinateur est étroitement liée à l'étude de la vision humaine. Afin d’atteindre l’objectif d’établir un système général de vision par ordinateur similaire au système visuel humain, il est nécessaire d’établir une théorie informatique de la vision humaine.

Pour plus d'articles connexes, veuillez visiter le Site Web PHP chinois ! !

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn