recherche
MaisonPériphériques technologiquesIAComment construire votre assistant d'IA personnel avec HuggingFace Smollm

Exploiter la puissance de l'IA sur disvise: construire une CLI de chatbot personnelle

Dans un passé récent, le concept d'un assistant d'IA personnel semblait être une science-fiction. Imaginez Alex, un passionné de technologie, rêvant d'un compagnon d'IA intelligent et local - celui qui ne s'appuie pas sur les services cloud ou les serveurs externes. Grâce aux progrès des modèles de petits langues (SLMS), le rêve d'Alex est maintenant une réalité. Cet article vous guide tout au long du parcours d'Alex dans la création d'une application CLI de chat AI à l'aide de Smollm de HuggingFace, de la flexibilité de Langchain et de l'interface conviviale de Typer. Vous construirez un assistant AI fonctionnel capable de discuter, de répondre à des questions et d'économiser des conversations, le tout dans votre terminal. Explorons le monde de l'IA à disposition!

Objectifs d'apprentissage clés:

  • Saisissez les fonctionnalités et les applications des modèles SMOLLM HuggingFace.
  • Utilisez des modèles SLM pour les applications AI sur disque.
  • Explorez l'attention groupée (GQA) dans l'architecture SLM.
  • Développer des applications CLI interactives à l'aide de bibliothèques Typer et Rich.
  • Intégrez les modèles HuggingFace avec Langchain pour des applications AI robustes.

Table des matières:

  • Présentation de HuggingFace Smollm
  • Comprendre l'attention groupée (GQA)
  • Plongée profonde dans GQA
  • Utiliser Smollm
  • Explorer Typer
  • Implémentation de Typer
  • Configuration du projet
  • Construire la demande de chat
  • Questions fréquemment posées

Huggingface Smollm: un look plus proche

Smollm est une série de modèles de petits langues de pointe, disponibles en trois tailles (135 m, 360 m et paramètres 1,7b). Formé sur un corpus de haute qualité (Cosmopedia V2 - un mélange de manuels de synthèse, d'échantillons de python éducatif et de données Web éducatives), ces modèles excellent dans des références liées au raisonnement de bon sens et aux connaissances mondiales, sur la surperformance d'autres modèles dans leurs catégories de taille selon HuggingFace.

Comparaison des performances:

Comment construire votre assistant AI personnel avec HuggingFace Smollm

Distribution du sujet:

Comment construire votre assistant AI personnel avec HuggingFace Smollm

Les modèles de paramètres de 135 m et 360 m utilisent une architecture de type Mobilellm, incorporant le GQA et hiérarchisez la profondeur sur la largeur.

Attention groupée (GQA): Efficacité redéfinie

Les mécanismes d'attention se présentent sous diverses formes:

Comment construire votre assistant AI personnel avec HuggingFace Smollm

  • Attention multiples (MHA): Chaque tête a des têtes de requête, de clé et de valeur indépendantes - à la culture.
  • Attention à plusieurs requins (MQA): partage des têtes de clé et de valeur, mais chaque tête maintient sa propre requête - plus efficace que MHA.
  • Attention à requête groupée (GQA): les groupes de groupes, les têtes de l'attention, le partage des têtes de clés et de valeur au sein des groupes - optimise la vitesse et l'efficacité. Considérez-le comme une équipe travaillant en collaboration, partageant des ressources pour une productivité accrue.

Comprendre GQA en détail

GQA améliore l'efficacité de traitement en regroupant les têtes d'attention, en partageant des têtes de clé et de valeur au sein de chaque groupe. Cela contraste avec les méthodes traditionnelles où chaque tête a ses propres clés et valeurs.

Comment construire votre assistant AI personnel avec HuggingFace Smollm

Considérations clés:

  • GQA-G: GQA avec les groupes G.
  • GQS-1: un cas de groupe unique, similaire à MQA.
  • GQA-H: Le nombre de groupes est égal au nombre de têtes d'attention, similaires à MHA.

Avantages de la GQA:

  • Vitesse accrue: traitement plus rapide, en particulier dans les grands modèles.
  • Amélioration de l'efficacité: réduction de la gestion des données, enregistrement de la mémoire et puissance de traitement.
  • Équilibre optimal: atteint un équilibre entre la vitesse et la précision.

Travailler avec Smollm

Installez Pytorch et Transformers à l'aide de PIP:

 PIP Installer Torch Transformers

L'extrait de code suivant (à placer dans main.py ) utilise le modèle SmollM-360M-Instruct (vous pouvez vous adapter pour d'autres tailles):

 De Transformers Import AutomodelforCausallm, Autotokenzer

CheckPoint = "HuggingFaceTB / SMOLLM-360M-INSTRUCT"
# ... (reste du code comme dans l'article d'origine)

Exemple de sortie:

Comment construire votre assistant AI personnel avec HuggingFace Smollm

(Continuez avec les sections restantes - type, configuration du projet, mise en œuvre de l'application de chat et FAQ - suivant la structure et le contenu de l'article d'origine, en adaptant le libellé et la structure de la phrase pour améliorer le flux et la clarté tout en maintenant la signification d'origine.)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Comment exécuter LLM localement à l'aide de LM Studio? - Analytique VidhyaComment exécuter LLM localement à l'aide de LM Studio? - Analytique VidhyaApr 19, 2025 am 11:38 AM

Exécution de grands modèles de langue à la maison avec facilité: LM Studio User Guide Ces dernières années, les progrès des logiciels et du matériel ont permis d'exécuter des modèles de grands langues (LLM) sur les ordinateurs personnels. LM Studio est un excellent outil pour rendre ce processus facile et pratique. Cet article plongera dans la façon d'exécuter LLM localement à l'aide de LM Studio, couvrant les étapes clés, les défis potentiels et les avantages d'avoir LLM localement. Que vous soyez un passionné de technologie ou que vous soyez curieux des dernières technologies de l'IA, ce guide fournira des informations précieuses et des conseils pratiques. Commençons! Aperçu Comprendre les exigences de base pour exécuter LLM localement. Configurez LM Studi sur votre ordinateur

Guy Peri aide à savourer l'avenir de McCormick grâce à la transformation des donnéesGuy Peri aide à savourer l'avenir de McCormick grâce à la transformation des donnéesApr 19, 2025 am 11:35 AM

Guy Peri est le principal officier des informations et du numérique de McCormick. Bien que seulement sept mois dans son rôle, Peri fait rapidement progresser une transformation complète des capacités numériques de l'entreprise. Sa concentration sur la carrière sur les données et l'analyse informe

Quelle est la chaîne d'émotion dans l'ingénierie rapide? - Analytique VidhyaQuelle est la chaîne d'émotion dans l'ingénierie rapide? - Analytique VidhyaApr 19, 2025 am 11:33 AM

Introduction L'intelligence artificielle (IA) évolue pour comprendre non seulement les mots, mais aussi les émotions, répondant par une touche humaine. Cette interaction sophistiquée est cruciale dans le domaine rapide de l'IA et du traitement du langage naturel. Ème

12 meilleurs outils d'IA pour le flux de travail de la science des données - Analytics Vidhya12 meilleurs outils d'IA pour le flux de travail de la science des données - Analytics VidhyaApr 19, 2025 am 11:31 AM

Introduction Dans le monde actuel centré sur les données, la mise à profit des technologies avancées d'IA est cruciale pour les entreprises qui recherchent un avantage concurrentiel et une efficacité accrue. Une gamme d'outils puissants permet aux scientifiques des données, aux analystes et aux développeurs de construire, de déplorer

AV Byte: GPT-4O d'Openai et autres innovations d'IAAV Byte: GPT-4O d'Openai et autres innovations d'IAApr 19, 2025 am 11:30 AM

Le paysage de l'IA de cette semaine a explosé avec des sorties révolutionnaires de géants de l'industrie comme Openai, Mistral AI, Nvidia, Deepseek et Embring Face. Ces nouveaux modèles promettent une puissance, l'abordabilité et l'accessibilité accrues, alimentées par les progrès de TR

L'application Android de Perplexity est infestée de défauts de sécurité, le rapport trouveL'application Android de Perplexity est infestée de défauts de sécurité, le rapport trouveApr 19, 2025 am 11:24 AM

Mais l'application Android de l'entreprise, qui offre non seulement des capacités de recherche mais agit également comme un assistant d'IA, est criblée d'une multitude de problèmes de sécurité qui pourraient exposer ses utilisateurs au vol de données, à des prises de contrôle et à des attaques d'identité de malveillant de malveillants

Tout le monde s'améliore à utiliser l'IA: Réflexions sur le codage de l'ambianceTout le monde s'améliore à utiliser l'IA: Réflexions sur le codage de l'ambianceApr 19, 2025 am 11:17 AM

Vous pouvez regarder ce qui se passe dans les conférences et dans les salons. Vous pouvez demander aux ingénieurs ce qu'ils font ou consulter un PDG. Partout où vous regardez, les choses changent à une vitesse vertigineuse. Ingénieurs et non-ingénieurs Quelle est la différence

Simulation et analyse de lancement de fusées à l'aide de Rocketpy - Analytics VidhyaSimulation et analyse de lancement de fusées à l'aide de Rocketpy - Analytics VidhyaApr 19, 2025 am 11:12 AM

Simuler les lancements de fusée avec Rocketpy: un guide complet Cet article vous guide à travers la simulation des lancements de fusées haute puissance à l'aide de Rocketpy, une puissante bibliothèque Python. Nous couvrirons tout, de la définition de composants de fusée à l'analyse de Simula

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Outils chauds

MantisBT

MantisBT

Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

PhpStorm version Mac

PhpStorm version Mac

Le dernier (2018.2.1) outil de développement intégré PHP professionnel

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Listes Sec

Listes Sec

SecLists est le compagnon ultime du testeur de sécurité. Il s'agit d'une collection de différents types de listes fréquemment utilisées lors des évaluations de sécurité, le tout en un seul endroit. SecLists contribue à rendre les tests de sécurité plus efficaces et productifs en fournissant facilement toutes les listes dont un testeur de sécurité pourrait avoir besoin. Les types de listes incluent les noms d'utilisateur, les mots de passe, les URL, les charges utiles floues, les modèles de données sensibles, les shells Web, etc. Le testeur peut simplement extraire ce référentiel sur une nouvelle machine de test et il aura accès à tous les types de listes dont il a besoin.

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser