Maison  >  Article  >  Périphériques technologiques  >  Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de l'industrie

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de l'industrie

王林
王林avant
2023-04-12 23:13:04832parcourir

Il y a quelque temps, l'équipe de développement intelligent de Yuanyu a formé un grand modèle de dialogue fonctionnel ChatYuan similaire à ChatGPT et a ouvert une interface d'essai dans la version Web.

Vous pouvez désormais également déployer un ChatYuan sur votre propre machine !

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Le modèle peut être utilisé dans des scénarios de questions et réponses, et peut mener des dialogues et diverses tâches de génération en fonction du contexte, y compris l'écriture créative, et peut également répondre à des questions dans des domaines tels que le droit et le COVID-19. .

Et il prend en charge l'apprentissage sans échantillon dans toutes les tâches chinoises. Les utilisateurs peuvent l'utiliser en fournissant des invites. Il prend en charge près de 30 types de tâches chinoises dans les catégories de génération de texte, d'extraction d'informations et de compréhension.

ChatYuan est davantage formé sur la base de PromptCLUE-large combiné à des centaines de millions de questions et réponses fonctionnelles et de données de dialogue à plusieurs tours. Le modèle dispose de 770 millions de paramètres et d'environ 6 Go de mémoire vidéo. une carte graphique civile. Le modèle est actuellement ouvert au téléchargement.

PromptCLUE est pré-entraîné sur un corpus chinois de 100 milliards de jetons, a appris un total de 1,5 billion de jetons chinois et organise une formation basée sur les tâches Prompt sur des centaines de tâches.

Pour les tâches de compréhension, telles que la classification, l'analyse des sentiments, l'extraction, etc., le système d'étiquettes peut être personnalisé ; pour une variété de tâches de génération, l'échantillonnage peut être généré librement.

Comment utiliser

1. Github

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Adresse du projet : https://github.com/clue-ai/ChatYuan

2.

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Adresse du projet : https://huggingface.co/ClueAI/ChatYuan-large-v1

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

3. ModelScope

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Adresse du projet : https://modelscope.cn/models/ClueAI/ChatYuan-large

Charger le modèle :

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Utilisez le modèle Raisonnement prédictif méthodes :

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

4. PaddlePaddle

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Adresse du projet : https://aistudio.bai duo.com du.com/aistudio/projectdetail /5404182

Adresse du modèle : https://huggingface.co/ClueAI/ChatYuan-large-v1-paddle

Utilisez vos propres données pour entraîner le modèle

1 Organisez les données

.

Les données sont organisées dans un format unifié et se composent de deux parties : entrée (Input) et sortie (Output).

Pour une seule série de questions et réponses ou de génération :

Entrée : description de la tâche + texte de saisie

Sortie : le texte que le système doit prédire, comme indiqué après "Xiaoyuan" dans l'image ci-dessous le contenu.

Pour les conversations à plusieurs tours :

Entrée : description de la tâche + ci-dessus + texte de saisie

Sortie : le texte que le système doit prédire, comme le montre l'image ci-dessous "Xiao Yuan" le contenu suivant.

Format de données de conversation à un tour :

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Format de données de conversation à plusieurs tours : 2. Modèle de formation

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

Pour le code de formation, veuillez vous référer à : Utilisation de l'ensemble de données pCLUE pour la formation, la prédiction et la vérification des effets, la mise en œuvre de pytorch - collaboration en ligne.

Projet Github : https://colab.research.google.com/drive/1lEyFhEfoc-5Z5xqpEKkZt_iMaojH1MP_?usp=sharing

Un exempleLe déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

====== =====Exemple 1==========

Utilisateur :

Que pouvez-vous faire

Xiaoyuan :

Bonjour ! Je suis Yuanyu AI. Je peux répondre à vos questions, rédiger des articles, des devoirs, traduire, et je peux également vous fournir des informations sur des questions juridiques et autres.

==========Exemple 2==========

Utilisateur :

Écrire un poème sur l'hiver

Xiao Yuan :

La nuit d'hiver est calme et froide,

les nuages ​​flottent dans le ciel,

sur la neige blanche gelée,

froide comme la neige.

Les flocons de neige fondent en glace,

Comme ces flocons de neige qui tombent,

Dans le froid de l'hiver,

ressentez la joie du printemps.

En hiver,

le vent et la neige se sont progressivement calmés,

il y avait le silence,

Apportez du bonheur et de la chaleur à la maison.

==========Exemple 3==========

Utilisateur :

En stage pour les majeures de l'éducation préscolaire, sur l'élève côté Il y aura des problèmes, veuillez suggérer des mesures d'amélioration. 800 mots

Xiaoyuan :

Lors des stages dans les majeures de l'éducation préscolaire, il y aura certains problèmes avec les étudiants, tels que le manque de connaissances professionnelles des étudiants, le manque de conscience de la coopération, le manque de sens de base des responsabilités, etc., dont nous avons besoin. Nous prenons des mesures pour résoudre ces problèmes.

Tout d'abord, pendant le processus de stage, nous devons cultiver la conscience d'équipe des étudiants, renforcer la coopération entre les étudiants et les enseignants, renforcer la communication avec les parents et améliorer leurs compétences en communication. En outre, nous devons également renforcer l'indépendance des élèves, leur permettre d'apprendre à penser de manière indépendante, à communiquer avec les enseignants et les parents et à cultiver leur indépendance.

De plus, dans le travail quotidien, nous devons également offrir aux étudiants des opportunités et des opportunités appropriées, afin que les étudiants puissent avoir plus de contacts avec la société et participer à davantage d'activités sociales, approfondir leur compréhension de la société et de l'école et cultiver leur initiative. , la positivité et l'esprit d'innovation.

Enfin, nous devons également prêter attention aux problèmes que rencontrent les étudiants lors des stages, notamment le manque de coopération des étudiants, la dépendance, le fait de ne pas savoir partager, la procrastination, etc. Ces étudiants doivent attirer notre attention et formuler des améliorations raisonnables. mesures. , améliorer ces problèmes.

Technologie et processus de formation

ChatYuan est un modèle obtenu par une formation continue basée sur PromptCLUE. Il supprime les tâches de compréhension de texte et d'extraction d'informations, et renforce l'apprentissage et la formation des questions et réponses, du dialogue et de diverses tâches génératives

Compte tenu du fait que les dialogues à plusieurs tours sont facilement perturbés par le contexte, les données anti-interférences ; est ajouté afin que le modèle puisse ignorer le contexte non pertinent si nécessaire ; l'apprentissage des données de commentaires des utilisateurs est ajouté, de sorte que le modèle possède non seulement certaines capacités générales de compréhension du langage et des capacités de génération de tâches spécifiques, mais peut également mieux répondre aux intentions de l'utilisateur.

Processus d'apprentissage PromptCLUE

Le déploiement de ChatGPT domestique ne nécessite que 6 Go de mémoire vidéo ! Le modèle ChatYuan est ouvert au téléchargement : le premier grand modèle chinois open source de dialogue fonctionnel de lindustrie

  1. Trois unifications majeures : cadre de modèle unifié (texte à texte), formulaire de tâche unifié (invite), méthode d'application unifiée (zéro-shot/quelques-shots) (T0)
  2. Pré-formation à grande échelle : en t5 -large Sur la base de la version, des centaines de corpus chinois G ont été utilisés, 1 million d'étapes ont été formées et 1,5 billion de jetons au niveau des mots chinois ont été formés de manière cumulative
  3. Données de tâches à grande échelle : 16 types de tâches, des centaines de tâches et un un total cumulé de 100 millions ont été utilisés Données de tâches de niveau
  4. Pré-formation hybride : D'une part, les tâches en aval sont utilisées comme corpus de pré-formation, et d'autre part, les tâches en aval et le corpus de pré-formation sont entraînées ensemble pour réduire l'oubli de tâches en cas de catastrophe et raccourcir la distance entre les tâches de pré-formation et en aval pour une meilleure adaptation. un échantillonnage fluide est effectué en fonction de la quantité de données de la tâche, et les données de la tâche sont limitées en même temps par la limite supérieure du pool d'échantillonnage. Un échantillonnage fluide peut réduire les préjudices biaisés de l'entraînement aux tâches, et l'entraînement au sein de chaque lot peut réduire le transfert négatif d'entraînement entre des tâches hétérogènes (T5)
  5. Entraînement par phases : d'une part, il fait référence à la phase de pré-entraînement, impliquant le longueur de la séquence d'entraînement. Le phasage (128 et 512) accélère la vitesse de pré-entraînement (Bert) ; d'autre part, le phasage d'entraînement en aval implique des changements dans le taux d'apprentissage et la longueur de la séquence, ainsi qu'une diminution des restrictions de volume de données en aval. tâches, s'adaptant mieux aux différentes tâches en aval.
  6. Augmenter la formation du modèle de langage : reportez-vous à t5.1.1, en plus d'utiliser la construction Span Corrpution pour la formation non supervisée, et également d'utiliser le préfixe LM pour la formation afin d'améliorer la capacité à générer des tâches (LM adapté)
  7. Ajouter un encodeur au modèle Et formation au décodeur : construisez des corpus de données de pré-formation Data_text et Data_target respectivement basés sur les données de tâches en aval, et ajoutez-les à la pré-formation pour améliorer respectivement la capacité de compréhension de l'encodeur et la capacité de génération de décodeur du modèle (voir UIE)
  8. Reconstruire le modèle chinois dictionnaire : utilisez Sentencepiece pour apprendre et construire un dictionnaire modèle sur les jetons Qianyi, qui est plus conforme aux habitudes de la langue chinoise
  9. Travail de suivi

La version actuelle peut effectuer des questions et réponses, des dialogues et diverses écritures créatives ou générations de texte Par rapport à la version en ligne, ses capacités de compréhension et de génération d'intentions ont encore une marge d'amélioration considérable dans certaines situations ; La version existante sera ensuite améliorée en fonction des commentaires.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer