Classification d'image de visage étreint: un guide complet avec des exemples-IA-php.cn

Maison

Périphériques technologiques

Classification d'image de visage étreint: un guide complet avec des exemples

Lisa Kudrow

Mar 07, 2025 am 09:34 AM

Adapter le visage étreint pour la classification des images: un guide complet

Classification d'image, une pierre angulaire de l'IA et de l'apprentissage automatique, trouve des applications dans divers domaines, de la reconnaissance faciale à l'imagerie médicale. Le visage étreint apparaît comme une plate-forme puissante pour cette tâche, en particulier pour ceux qui connaissent le traitement du langage naturel (NLP) et de plus en plus, la vision par ordinateur. Ce guide détaille en utilisant le visage étreint pour la classification d'images, en s'adressant à la fois aux débutants et aux praticiens expérimentés.

Comprendre la classification des images et les avantages du visage étreint

La classification d'images implique la catégorisation d'images en classes prédéfinies à l'aide d'algorithmes qui analysent le contenu visuel et prédisent les catégories basées sur des modèles apprises. Les réseaux de neurones convolutionnels (CNN) sont l'approche standard en raison de leurs capacités de reconnaissance des modèles. Pour une plongée plus profonde dans CNNS, reportez-vous à notre article «Une introduction aux réseaux de neurones convolutionnels (CNNS)». Notre article "Classification in Machine Learning: An Introduction" fournit une compréhension plus large des algorithmes de classification.

Le visage étreint offre plusieurs avantages:

Hugging Face Image Classification: A Comprehensive Guide With Examples

Avantages clés de l'utilisation du visage étreint pour la classification d'image

Accessibilité: Les API intuitives et la documentation complète s'adressent à tous les niveaux de compétence.
Modèles pré-formés: Un vaste référentiel de modèles pré-formés permet un réglage fin efficace sur les ensembles de données personnalisés, la minimisation du temps de formation et des ressources de calcul. Les utilisateurs peuvent former et déployer leurs propres modèles.
Communauté et soutien: Une communauté dynamique fournit un soutien inestimable et une assistance de dépannage.

Le visage étreint simplifie également le déploiement du modèle sur les principales plates-formes cloud (AWS, Azure, Google Cloud Platform) avec diverses options d'inférence.

Hugging Face Image Classification: A Comprehensive Guide With Examples

Options de déploiement du modèle sur les plates-formes cloud

Préparation des données et prétraitement

Ce guide utilise l'ensemble de données «Beans» pour la démonstration. Après le chargement, nous visualiserons les données avant le prétraitement. Le cahier Google Colab qui l'accompagne fournit le code. Le code est inspiré par la documentation officielle de l'étreinte.

Exigences de la bibliothèque:

Installez les bibliothèques nécessaires à l'aide de pip:

pip -q install datasets
pip -q install transformers=='4.29.0'
pip -q install tensorflow=='2.15' 
pip -q install evaluate
pip -q install --upgrade accelerate

redémarrer le noyau après l'installation. Importer des bibliothèques requises:

import torch
import torchvision
import numpy as np
import evaluate
from datasets import load_dataset
from huggingface_hub import notebook_login
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from transformers import DefaultDataCollator
from transformers import AutoImageProcessor
from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer
import matplotlib.pyplot as plt

Chargement des données et organisation:

Chargez l'ensemble de données:

pip -q install datasets
pip -q install transformers=='4.29.0'
pip -q install tensorflow=='2.15' 
pip -q install evaluate
pip -q install --upgrade accelerate

L'ensemble de données contient 1034 images, chacune avec 'Image_File_Path', 'Image' (objet PIL) et 'Labels' (0: Angular_leaf_Spot, 1: Bean_rust, 2: Sain

Une fonction d'assistance visualise les images aléatoires:

import torch
import torchvision
import numpy as np
import evaluate
from datasets import load_dataset
from huggingface_hub import notebook_login
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
from transformers import DefaultDataCollator
from transformers import AutoImageProcessor
from torchvision.transforms import RandomResizedCrop, Compose, Normalize, ToTensor
from transformers import AutoModelForImageClassification, TrainingArguments, Trainer
import matplotlib.pyplot as plt

Visualisez six images aléatoires:

beans_train = load_dataset("beans", split="train")

Hugging Face Image Classification: A Comprehensive Guide With Examples

Exemples d'images de l'ensemble de données Beans

Prétraitement des données:

diviser l'ensemble de données (Train à 80%, validation de 20%):

labels_names = {0: "angular_leaf_spot", 1: "bean_rust", 2: "healthy"}

def display_random_images(dataset, num_images=4):
   # ... (function code as in original input) ...

Créer des mappages d'étiquettes:

display_random_images(beans_train, num_images=6)

Modèle de chargement et de réglage fin

Chargez le modèle VIT pré-formé:

beans_train = beans_train.train_test_split(test_size=0.2)

Le code charge le modèle pré-formé, définit les transformations (redimensionnement, normalisation) et prépare l'ensemble de données pour la formation. La métrique de précision est définie pour l'évaluation.

Connectez-vous au visage étreint:

labels = beans_train["train"].features["labels"].names
label2id, id2label = dict(), dict()
for i, label in enumerate(labels):
   label2id[label] = str(i)
   id2label[str(i)] = label

(Suivez les instructions à l'écran)

Configurer et lancer la formation:

checkpoint = "google/vit-base-patch16-224-in21k"
image_processor = AutoImageProcessor.from_pretrained(checkpoint)
# ... (rest of the preprocessing code as in original input) ...

(résultats de formation comme indiqué dans l'entrée d'origine)

Déploiement et intégration du modèle

Poussez le modèle formé au centre de visage étreint:

notebook_login()

Le modèle est alors accessible et utilisé via:

Portail de visage étreint: Téléchargez directement des images pour la prédiction.
Bibliothèque Transformers: Utilisez le modèle dans votre code Python.
API REST: Utilisez le point de terminaison de l'API fourni pour les prédictions. Exemple utilisant l'API:

training_args = TrainingArguments(
    # ... (training arguments as in original input) ...
)

trainer = Trainer(
    # ... (trainer configuration as in original input) ...
)

trainer.train()

Conclusion et ressources supplémentaires

Ce guide fournit une procédure pas à pas complète de la classification des images en utilisant le visage de câlin. D'autres ressources d'apprentissage incluent:

Ce guide permet aux utilisateurs de tous les niveaux de tirer parti des étreintes pour leurs projets de classification d'image.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn

Article connexe

La Californie tape AI pour accélérer les permis de récupération des incendies de forêtMay 04, 2025 am 11:10 AM

L'IA rationalise la récupération des incendies de forêt Le logiciel AI de la société de technologie australienne Archistar, utilisant l'apprentissage automatique et la vision par ordinateur, automatise l'évaluation des plans de construction de conformité aux réglementations locales. Cette signification de pré-validation

Ce que les États-Unis peuvent apprendre du gouvernement numérique propulsé par l'IA de l'EstonieMay 04, 2025 am 11:09 AM

Le gouvernement numérique de l'Estonie: un modèle pour les États-Unis? Les États-Unis luttent contre les inefficacités bureaucratiques, mais l'Estonie offre une alternative convaincante. Cette petite nation possède un gouvernement de près de 100% numérisé et centré sur les citoyens alimentés par l'IA. Ce n'est pas

Planification du mariage via une IA générativeMay 04, 2025 am 11:08 AM

Planifier un mariage est une tâche monumentale, souvent écrasante même les couples les plus organisés. Cet article, qui fait partie d'une série Forbes en cours sur l'impact de l'IA (voir le lien ici), explore comment l'IA génératrice peut révolutionner la planification de mariage. Le mariage PL

Que sont les agents de l'IA de la défense numérique?May 04, 2025 am 11:07 AM

Les entreprises exploitent de plus en plus les agents de l'IA pour les ventes, tandis que les gouvernements les utilisent pour diverses tâches établies. Cependant, les défenseurs des consommateurs mettent en évidence la nécessité pour les individus de posséder leurs propres agents d'IA comme une défense contre les

Guide d'un chef d'entreprise sur l'optimisation générative du moteur (GEO)May 03, 2025 am 11:14 AM

Google mène ce changement. Sa fonction "AI AperSews" sert déjà plus d'un milliard d'utilisateurs, fournissant des réponses complètes avant que quiconque clique sur un lien. [^ 2] D'autres joueurs gagnent également du terrain rapidement. Chatgpt, Microsoft Copilot et PE

Cette startup utilise des agents d'IA pour lutterMay 03, 2025 am 11:13 AM

En 2022, il a fondé la startup de défense de l'ingénierie sociale Doppel pour faire exactement cela. Et alors que les cybercriminels exploitent des modèles d'IA de plus en plus avancés pour turbuler leurs attaques, les systèmes d'IA de Doppel ont aidé les entreprises à les combattre à grande échelle - plus rapidement et

Comment les modèles mondiaux sont radicalement remodeler l'avenir de l'IA génératrice et des LLMMay 03, 2025 am 11:12 AM

Le tour est joué, via l'interaction avec les modèles mondiaux appropriés, l'IA et les LLM génératives peuvent être considérablement stimulées. Parlons-en. Cette analyse d'une percée innovante de l'IA fait partie de ma couverture de colonne Forbes en cours sur la dernière IA, y compris

Mai Jour 2050: Qu'avons-nous laissé pour célébrer?May 03, 2025 am 11:11 AM

La fête du Travail 2050. Les parcs à travers le pays se remplissent de familles bénéficiant de barbecues traditionnelles tandis que les défilés nostalgiques vont dans les rues de la ville. Pourtant, la célébration porte désormais une qualité de musée - une reconstitution historique plutôt que la commémoration de C

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Afficher plus

Article chaud

Comment réparer KB5055523 ne parvient pas à s'installer dans Windows 11?

3 Il y a quelques semainesByDDD

Comment réparer KB5055518 ne parvient pas à s'installer dans Windows 10?

3 Il y a quelques semainesByDDD

<🎜>: Dead Rails - Comment apprivoiser les loups

4 Il y a quelques semainesByDDD

Niveaux de force pour chaque ennemi et monstre de R.E.P.O.

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

<🎜>: Grow A Garden - Guide de mutation complet

2 Il y a quelques semainesByDDD

Afficher plus

Outils chauds

SublimeText3 version chinoise

Version chinoise, très simple à utiliser

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

Envoyer Studio 13.0.1

Puissant environnement de développement intégré PHP

PhpStorm version Mac

Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

Afficher plus

Sujets chauds

1655

1414

1307

1254

1228