


Classification d'image de visage étreint: un guide complet avec des exemples
Adapter le visage étreint pour la classification des images: un guide complet
Classification d'image, une pierre angulaire de l'IA et de l'apprentissage automatique, trouve des applications dans divers domaines, de la reconnaissance faciale à l'imagerie médicale. Le visage étreint apparaît comme une plate-forme puissante pour cette tâche, en particulier pour ceux qui connaissent le traitement du langage naturel (NLP) et de plus en plus, la vision par ordinateur. Ce guide détaille en utilisant le visage étreint pour la classification d'images, en s'adressant à la fois aux débutants et aux praticiens expérimentés.
Comprendre la classification des images et les avantages du visage étreint
La classification d'images implique la catégorisation d'images en classes prédéfinies à l'aide d'algorithmes qui analysent le contenu visuel et prédisent les catégories basées sur des modèles apprises. Les réseaux de neurones convolutionnels (CNN) sont l'approche standard en raison de leurs capacités de reconnaissance des modèles. Pour une plongée plus profonde dans CNNS, reportez-vous à notre article «Une introduction aux réseaux de neurones convolutionnels (CNNS)». Notre article "Classification in Machine Learning: An Introduction" fournit une compréhension plus large des algorithmes de classification.
Le visage étreint offre plusieurs avantages:
Avantages clés de l'utilisation du visage étreint pour la classification d'image
- Accessibilité: Les API intuitives et la documentation complète s'adressent à tous les niveaux de compétence.
- Modèles pré-formés: Un vaste référentiel de modèles pré-formés permet un réglage fin efficace sur les ensembles de données personnalisés, la minimisation du temps de formation et des ressources de calcul. Les utilisateurs peuvent former et déployer leurs propres modèles.
- Communauté et soutien: Une communauté dynamique fournit un soutien inestimable et une assistance de dépannage.
Le visage étreint simplifie également le déploiement du modèle sur les principales plates-formes cloud (AWS, Azure, Google Cloud Platform) avec diverses options d'inférence.
Options de déploiement du modèle sur les plates-formes cloud
Préparation des données et prétraitement
Ce guide utilise l'ensemble de données «Beans» pour la démonstration. Après le chargement, nous visualiserons les données avant le prétraitement. Le cahier Google Colab qui l'accompagne fournit le code. Le code est inspiré par la documentation officielle de l'étreinte.
Exigences de la bibliothèque:
Installez les bibliothèques nécessaires à l'aide de pip:
pip -q install datasets pip -q install transformers=='4.29.0' pip -q install tensorflow=='2.15' pip -q install evaluate pip -q install --upgrade accelerate
redémarrer le noyau après l'installation. Importer des bibliothèques requises:
import torch import torchvision import numpy as np import evaluate from datasets import load_dataset from huggingface_hub import notebook_login from torchvision import datasets, transforms from torch.utils.data import DataLoader from transformers import DefaultDataCollator from transformers import AutoImageProcessor from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor from transformers import AutoModelForImageClassification, TrainingArguments, Trainer import matplotlib.pyplot as plt
Chargement des données et organisation:
Chargez l'ensemble de données:
pip -q install datasets pip -q install transformers=='4.29.0' pip -q install tensorflow=='2.15' pip -q install evaluate pip -q install --upgrade accelerate
L'ensemble de données contient 1034 images, chacune avec 'Image_File_Path', 'Image' (objet PIL) et 'Labels' (0: Angular_leaf_Spot, 1: Bean_rust, 2: Sain
Une fonction d'assistance visualise les images aléatoires:
import torch import torchvision import numpy as np import evaluate from datasets import load_dataset from huggingface_hub import notebook_login from torchvision import datasets, transforms from torch.utils.data import DataLoader from transformers import DefaultDataCollator from transformers import AutoImageProcessor from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor from transformers import AutoModelForImageClassification, TrainingArguments, Trainer import matplotlib.pyplot as pltVisualisez six images aléatoires:
beans_train = load_dataset("beans", split="train")
Exemples d'images de l'ensemble de données Beans
Prétraitement des données:
diviser l'ensemble de données (Train à 80%, validation de 20%):
labels_names = {0: "angular_leaf_spot", 1: "bean_rust", 2: "healthy"} def display_random_images(dataset, num_images=4): # ... (function code as in original input) ...Créer des mappages d'étiquettes:
display_random_images(beans_train, num_images=6)Modèle de chargement et de réglage fin
Chargez le modèle VIT pré-formé:
beans_train = beans_train.train_test_split(test_size=0.2)Le code charge le modèle pré-formé, définit les transformations (redimensionnement, normalisation) et prépare l'ensemble de données pour la formation. La métrique de précision est définie pour l'évaluation.
Connectez-vous au visage étreint:
labels = beans_train["train"].features["labels"].names label2id, id2label = dict(), dict() for i, label in enumerate(labels): label2id[label] = str(i) id2label[str(i)] = label(Suivez les instructions à l'écran)
Configurer et lancer la formation:
checkpoint = "google/vit-base-patch16-224-in21k" image_processor = AutoImageProcessor.from_pretrained(checkpoint) # ... (rest of the preprocessing code as in original input) ...(résultats de formation comme indiqué dans l'entrée d'origine)
Déploiement et intégration du modèle
Poussez le modèle formé au centre de visage étreint:
notebook_login()Le modèle est alors accessible et utilisé via:
- Portail de visage étreint: Téléchargez directement des images pour la prédiction.
- Bibliothèque Transformers: Utilisez le modèle dans votre code Python.
- API REST: Utilisez le point de terminaison de l'API fourni pour les prédictions. Exemple utilisant l'API:
training_args = TrainingArguments( # ... (training arguments as in original input) ... ) trainer = Trainer( # ... (trainer configuration as in original input) ... ) trainer.train()Conclusion et ressources supplémentaires
Ce guide fournit une procédure pas à pas complète de la classification des images en utilisant le visage de câlin. D'autres ressources d'apprentissage incluent:
- "Une introduction à l'utilisation des transformateurs et des étreintes de visage"
- "Traitement d'image avec Python" Skill Track
- "Qu'est-ce que la reconnaissance d'image?" Article
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

L'IA rationalise la récupération des incendies de forêt Le logiciel AI de la société de technologie australienne Archistar, utilisant l'apprentissage automatique et la vision par ordinateur, automatise l'évaluation des plans de construction de conformité aux réglementations locales. Cette signification de pré-validation

Le gouvernement numérique de l'Estonie: un modèle pour les États-Unis? Les États-Unis luttent contre les inefficacités bureaucratiques, mais l'Estonie offre une alternative convaincante. Cette petite nation possède un gouvernement de près de 100% numérisé et centré sur les citoyens alimentés par l'IA. Ce n'est pas

Planifier un mariage est une tâche monumentale, souvent écrasante même les couples les plus organisés. Cet article, qui fait partie d'une série Forbes en cours sur l'impact de l'IA (voir le lien ici), explore comment l'IA génératrice peut révolutionner la planification de mariage. Le mariage PL

Les entreprises exploitent de plus en plus les agents de l'IA pour les ventes, tandis que les gouvernements les utilisent pour diverses tâches établies. Cependant, les défenseurs des consommateurs mettent en évidence la nécessité pour les individus de posséder leurs propres agents d'IA comme une défense contre les

Google mène ce changement. Sa fonction "AI AperSews" sert déjà plus d'un milliard d'utilisateurs, fournissant des réponses complètes avant que quiconque clique sur un lien. [^ 2] D'autres joueurs gagnent également du terrain rapidement. Chatgpt, Microsoft Copilot et PE

En 2022, il a fondé la startup de défense de l'ingénierie sociale Doppel pour faire exactement cela. Et alors que les cybercriminels exploitent des modèles d'IA de plus en plus avancés pour turbuler leurs attaques, les systèmes d'IA de Doppel ont aidé les entreprises à les combattre à grande échelle - plus rapidement et

Le tour est joué, via l'interaction avec les modèles mondiaux appropriés, l'IA et les LLM génératives peuvent être considérablement stimulées. Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur la dernière IA, y compris

La fête du Travail 2050. Les parcs à travers le pays se remplissent de familles bénéficiant de barbecues traditionnelles tandis que les défilés nostalgiques vont dans les rues de la ville. Pourtant, la célébration porte désormais une qualité de musée - une reconstitution historique plutôt que la commémoration de C


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

SublimeText3 version chinoise
Version chinoise, très simple à utiliser

Bloc-notes++7.3.1
Éditeur de code facile à utiliser et gratuit

Envoyer Studio 13.0.1
Puissant environnement de développement intégré PHP

PhpStorm version Mac
Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Listes Sec
SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.
