recherche
MaisonPériphériques technologiquesIAComment construire un chatbot à l'aide de l'API Openai et du Pinecone

LLM CHATBOTS: révolutionner l'IA conversationnelle avec une génération augmentée de récupération (RAG)

Depuis le lancement de Chatgpt en novembre 2022, les chatbots de grande langue (LLM) sont devenus omniprésents, transformant diverses applications. Bien que le concept de chatbots ne soit pas nouveau - beaucoup de chatbots plus anciens étaient trop complexes et frustrants - les LLM ont revitalisé le domaine. Ce blog explore la puissance des LLM, la technique de génération augmentée (RAG) de récupération, et comment construire votre propre chatbot en utilisant l'API et PineCone GPT d'Openai.

Ce guide couvre:

  • Génération augmentée de récupération (RAG)
  • Modèles de grande langue (LLMS)
  • en utilisant Openai GPT et autres API
  • Bases de données vectorielles et leur nécessité
  • Création d'un chatbot avec pinecone et openai dans python

Pour une plongée plus profonde, explorez nos cours sur les bases de données vectorielles pour les incorporations avec PineCone et le code-along sur Construire des chatbots avec API OpenAI et Pinecone .

Modèles de grande langue (LLMS)

How to Build a Chatbot Using the OpenAI API & Pinecone

source d'image

LLMS, tels que GPT-4, sont des algorithmes sophistiqués d'apprentissage automatique utilisant l'apprentissage en profondeur (en particulier l'architecture de transformateur) pour comprendre et générer un langage humain. Formés sur des ensembles de données massifs (milliards de mots provenant de diverses sources en ligne), ils gèrent des tâches de langage complexes.

LLMS excellent à la génération de texte dans divers styles et formats, de l'écriture créative à la documentation technique. Leurs capacités incluent le résumé, l'IA conversationnelle et la traduction du langage, capturant souvent les fonctionnalités linguistiques nuancées.

Cependant, les LLM ont des limites. Les «hallucinations» - générer des informations plausibles mais incorrectes - et les biais des données de formation sont des défis importants. Bien que les LLM représentent une progression importante de l'IA, une gestion minutieuse est cruciale pour atténuer les risques.

Génération augmentée de récupération (RAG)

How to Build a Chatbot Using the OpenAI API & Pinecone

source d'image

Les limitations des LLMS (des informations obsolètes, génériques ou fausses dues aux limitations de données ou aux «hallucinations») sont traitées par RAG. Le chiffon améliore la précision et la fiabilité en ordonnant aux LLM de récupérer les informations pertinentes à partir de sources spécifiées. Cela donne aux développeurs plus de contrôle sur les réponses LLM.

Le processus de chiffon (simplifié)

(Un didacticiel détaillé est disponible séparément.)

  1. Préparation des données: Les données externes (par exemple, la recherche actuelle, les actualités) sont préparées et converties en format (intégres) utilisable par le llm.
  2. Stockage d'intégration: Les incorporations sont stockées dans une base de données vectorielle (comme Pinecone), optimisée pour une récupération efficace des données vectorielles.
  3. Retrievale d'informations: Une recherche sémantique utilisant la requête de l'utilisateur (converti en vecteur) récupère les informations les plus pertinentes de la base de données.
  4. Augmentation invite: Les données récupérées et la requête utilisateur augmentent l'invite LLM, conduisant à des réponses plus précises.
  5. Mises à jour des données: Les données externes sont régulièrement mises à jour pour maintenir la précision.

Bases de données vectorielles

How to Build a Chatbot Using the OpenAI API & Pinecone

source d'image

Les bases de données vectorielles gèrent les vecteurs de haute dimension (représentations mathématiques des données). Ils excellent à des recherches de similitude en fonction de la distance vectorielle, permettant une requête sémantique. Les applications comprennent la recherche d'images, de documents ou de produits similaires. Pinecone est un exemple populaire, efficace et convivial. Ses techniques d'indexation avancées sont idéales pour les applications de chiffon.

API OpenAI

L'API d'Openai donne accès à des modèles comme GPT, Dall-E et Whisper. Accessible via les demandes HTTP (ou simplifiées avec la bibliothèque openai de Python), il est facilement intégré dans divers langages de programmation.

Python Exemple:

import os
os.environ["OPENAI_API_KEY"] = "YOUR_API_KEY"

from openai import OpenAI
client = OpenAI()

completion = client.chat.completions.create(
  model="gpt-4",
  messages=[
    {"role": "system", "content": "You are expert in Machine Learning."},
    {"role": "user", "content": "Explain how does random forest works?."}
  ]
)

print(completion.choices[0].message)

Langchain (aperçu du cadre)

Langchain simplifie le développement d'applications LLM. Bien que puissant, il est toujours en cours de développement actif, donc les changements d'API sont possibles.

Exemple Python de bout en bout: Construire un chatbot LLM

Cette section construit un chatbot à l'aide d'Openai GPT-4 et de Pinecone. (Remarque: une grande partie de ce code est adaptée du guide officiel de Langchain.)

1. Configuration Openai et Pinecone: Obtenez des clés API.

2. Installez les bibliothèques: utilisez PIP pour installer langchain, langchain-community, openai, tiktoken, pinecone-client, et pinecone-datasets.

3. Exemple d'ensemble de données: Chargez un ensemble de données pré-incorporé (par exemple, wikipedia-simple-text-embedding-ada-002-100K de pinecone-datasets). (L'échantillonnage d'un sous-ensemble est recommandé pour un traitement plus rapide.)

4. Configuration de l'index de pignon: Créez un index de Pinecone (langchain-retrieval-augmentation-fast dans cet exemple).

5. Insertion de données: Upser les données échantillonnées dans l'index de Pinecone.

6. Intégration de Langchain: Initialisez un magasin vectoriel de Langchain à l'aide de l'index de pin et d'Openai.

7. Requête: utilisez le magasin vectoriel pour effectuer des recherches de similitude.

8. Intégration LLM: utilisez

et ChatOpenAI (ou RetrievalQA pour l'attribution de la source) pour intégrer le LLM avec le magasin vectoriel. RetrievalQAWithSourcesChain

Conclusion

Ce blog a démontré la puissance de RAG pour construire des chatbots fiables et pertinents sur LLM. La combinaison de LLMS, de bases de données vectorielles (comme PineCone) et de cadres comme Langchain autorise les développeurs à créer des applications de l'IA conversationnelles sophistiquées. Nos cours offrent d'autres opportunités d'apprentissage dans ces domaines.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Qu'est-ce que le graphique de la pensée dans l'ingénierie rapideQu'est-ce que le graphique de la pensée dans l'ingénierie rapideApr 13, 2025 am 11:53 AM

Introduction Dans l'ingénierie rapide, «Graph of Thought» fait référence à une nouvelle approche qui utilise la théorie des graphiques pour structurer et guider le processus de raisonnement de l'IA. Contrairement aux méthodes traditionnelles, qui impliquent souvent des s linéaires

Optimiser le marketing par e-mail de votre organisation avec les agents de GenaiOptimiser le marketing par e-mail de votre organisation avec les agents de GenaiApr 13, 2025 am 11:44 AM

Introduction Félicitations! Vous gérez une entreprise prospère. Grâce à vos pages Web, campagnes de médias sociaux, webinaires, conférences, ressources gratuites et autres sources, vous collectez 5000 identifiants de messagerie par jour. La prochaine étape évidente est

Surveillance des performances de l'application en temps réel avec Apache PinotSurveillance des performances de l'application en temps réel avec Apache PinotApr 13, 2025 am 11:40 AM

Introduction Dans l'environnement de développement logiciel au rythme rapide d'aujourd'hui, garantissant des performances optimales d'application est cruciale. La surveillance des mesures en temps réel telles que les temps de réponse, les taux d'erreur et l'utilisation des ressources peuvent aider

Chatgpt frappe 1 milliard d'utilisateurs? 'Doublé en seulement des semaines', explique le PDG d'OpenaiChatgpt frappe 1 milliard d'utilisateurs? 'Doublé en seulement des semaines', explique le PDG d'OpenaiApr 13, 2025 am 11:23 AM

«Combien d'utilisateurs avez-vous?» il a poussé. "Je pense que la dernière fois que nous avons dit était de 500 millions d'actifs hebdomadaires, et cela croît très rapidement", a répondu Altman. "Vous m'avez dit que cela a doublé en quelques semaines", a poursuivi Anderson. «J'ai dit que le priv

PIXTRAL-12B: Mistral AI & # 039; s Modèle multimodal - Analytics VidhyaPIXTRAL-12B: Mistral AI & # 039; s Modèle multimodal - Analytics VidhyaApr 13, 2025 am 11:20 AM

Introduction Mistral a publié son tout premier modèle multimodal, à savoir le pixtral-12b-2409. Ce modèle est construit sur les 12 milliards de paramètres de Mistral, Nemo 12b. Qu'est-ce qui distingue ce modèle? Il peut maintenant prendre les deux images et Tex

Cadres agentiques pour les applications d'IA génératrices - Analytics VidhyaCadres agentiques pour les applications d'IA génératrices - Analytics VidhyaApr 13, 2025 am 11:13 AM

Imaginez avoir un assistant alimenté par AI qui non seulement répond à vos requêtes mais rassemble également de manière autonome des informations, exécute des tâches et gère même plusieurs types de données - texte, images et code. Cela semble futuriste? En ce

Applications de l'IA générative dans le secteur financierApplications de l'IA générative dans le secteur financierApr 13, 2025 am 11:12 AM

Introduction L’industrie financière est la pierre angulaire du développement de tout pays, car elle stimule la croissance économique en facilitant des transactions efficaces et une disponibilité du crédit. La facilité avec laquelle les transactions se produisent et le crédit

Guide de l'apprentissage en ligne et des algorithmes agressifs passifsGuide de l'apprentissage en ligne et des algorithmes agressifs passifsApr 13, 2025 am 11:09 AM

Introduction Les données sont générées à un rythme sans précédent à partir de sources telles que les médias sociaux, les transactions financières et les plateformes de commerce électronique. Gérer ce flux continu d'informations est un défi, mais il offre un

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

MinGW - GNU minimaliste pour Windows

MinGW - GNU minimaliste pour Windows

Ce projet est en cours de migration vers osdn.net/projects/mingw, vous pouvez continuer à nous suivre là-bas. MinGW : un port Windows natif de GNU Compiler Collection (GCC), des bibliothèques d'importation et des fichiers d'en-tête librement distribuables pour la création d'applications Windows natives ; inclut des extensions du runtime MSVC pour prendre en charge la fonctionnalité C99. Tous les logiciels MinGW peuvent fonctionner sur les plates-formes Windows 64 bits.

MantisBT

MantisBT

Mantis est un outil Web de suivi des défauts facile à déployer, conçu pour faciliter le suivi des défauts des produits. Cela nécessite PHP, MySQL et un serveur Web. Découvrez nos services de démonstration et d'hébergement.

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Bloc-notes++7.3.1

Bloc-notes++7.3.1

Éditeur de code facile à utiliser et gratuit

SublimeText3 version chinoise

SublimeText3 version chinoise

Version chinoise, très simple à utiliser