Modèle de génération de code 3B open source Stability AI : peut être complété et débogué-IA-php.cn

Maison

Périphériques technologiques

Modèle de génération de code 3B open source Stability AI : peut être complété et débogué

王林

Mar 28, 2024 pm 01:21 PM

ai模型开源overflow

Ce lundi, Stability AI a open source le modèle de pré-formation en petit volume Stable Code Instruct 3B.

Stable Code Instruct 3B est un modèle de langage de codage adapté aux instructions (Code LM) basé sur Stable Code 3B. En fournissant des invites en langage naturel, le modèle peut être appliqué à diverses tâches, notamment la génération de code, des problèmes mathématiques et d'autres tâches liées au génie logiciel.

Stability AI affirme que son modèle présente des performances de pointe à l'échelle 3B, surpassant les modèles à plus grande échelle comme le 7B Instruct de CodeLlama et correspondant même au modèle 15B de StarChat dans les tâches liées au génie logiciel. Les performances sont comparables.

Stability AI开源3B代码生成模型：可补全，还能Debug

Modèle : https://huggingface.co/stabilityai/stable-code-instruct-3b
HuggingFace Trial : https://huggingface.co/spaces/ Stabilityai/stable-code-instruct-3b
Rapport technique sur le code stable : https://static1.squarespace.com/static/6213c340453c3f502425776e/t/6601c5713150412edcd56f8e/1711392114564/Stable _Code _TechReport_release.pdf

Stable Code Instruct 3B a mis à niveau sa fonction de complétion de code et prend en charge l'interaction en langage naturel, dans le but d'améliorer l'efficacité et l'intuitivité des tâches de programmation et de développement de logiciels. Les résultats expérimentaux montrent que ce modèle fonctionne bien dans diverses tâches liées au codage, surpassant les modèles concurrents tels que Codellama 7B Instruct et DeepSeek-Coder Instruct 1.3B.

Introduction à la méthode

Stable Code est basé sur Stable LM 3B. Stable Code est un transformateur de décodeur pur causal, similaire à l'architecture LLaMA. Les principales différences par rapport à LLaMA sont les suivantes :

L'intégration de position, l'intégration de position pivotée est appliquée aux premiers 25 % de la dimension d'intégration de la tête pour améliorer le débit.
Standardisation, LayerNorm avec termes de biais appris ;
Biais, à l'exception des biais pour les projections de clés, de requêtes et de valeurs, Stable Code supprime tous les termes de biais des réseaux de rétroaction et des couches d'auto-attention multi-têtes.

Stability AI开源3B代码生成模型：可补全，还能Debug

Le tableau suivant montre le poids d'échantillonnage, l'époque, la catégorie et d'autres informations de l'ensemble de données du corpus de pré-formation.

Stability AI开源3B代码生成模型：可补全，还能Debug

Selon le rapport d'enquête auprès des développeurs Stack Overflow 2023, Stable Code Instruct 3B se concentre sur des langages comme Python, Javascript, Java, C, C++ et Go qui sont utiles pour une variété de développeurs C'est le plus populaire et le plus influent. Bien que ces langages aient été sélectionnés comme objet de formation, le modèle a également été formé sur d'autres langages largement adoptés tels que SQL, PHP et Rust.

Stability AI开源3B代码生成模型：可补全，还能Debug

Stable Code Instruct 3B offre de solides performances de test même pour les langages qui n'étaient pas initialement inclus dans l'ensemble de formation (comme Lua). Cette compétence découle probablement d'une compréhension des principes de codage sous-jacents et de la capacité d'adapter les concepts dans différents environnements de programmation en tirant parti de la prévisibilité inhérente aux tâches de codage.

Stable Code Instruct 3B maîtrise non seulement la génération de code, mais également les tâches FIM (Fill in the Middle), les requêtes de base de données, la traduction, l'interprétation et la création de code. Ses instructions sont adaptées pour lui permettre de comprendre et d'agir sur des instructions nuancées, facilitant ainsi un large éventail de tâches de codage au-delà de la simple complétion de code, notamment la compréhension mathématique, le raisonnement logique et le traitement de descriptions techniques complexes entourant le développement de logiciels.

Évaluation des performances

Comparé aux modèles leaders tels que Codellama 7B Instruct et DeepSeek-Coder Instruct 1.3B, Stable Code Instruct 3B démontre des performances supérieures dans une gamme de tâches de codage.

Stability AI开源3B代码生成模型：可补全，还能Debug

L'équipe de recherche a également comparé les trois modèles sur le benchmark Multi-PL. Malgré moins de paramètres, Stable Code Instruct 3B surpasse considérablement CodeLlama Instruct dans tous les langages.

Stability AI开源3B代码生成模型：可补全，还能Debug

Le tableau 8 ci-dessous montre les performances de plusieurs modèles sur la tâche FIM :

Stability AI开源3B代码生成模型：可补全，还能Debug

Les tests expérimentaux montrent que Stable Code Instruct 3B a de meilleures performances en termes de précision de complétion du code et de langage naturel. traitement Comparable, voire surpassé, d'autres modèles en termes de compréhension des instructions et de capacité à couvrir différents langages de programmation.

Stability AI开源3B代码生成模型：可补全，还能Debug

La taille des paramètres de Stable Code Instruct 3B et la faible configuration matérielle requise le rendent accessible à un large public, permettant aux développeurs de travailler plus efficacement. Il convient de mentionner que Stable Code Instruct 3B est désormais disponible à des fins commerciales avec un abonnement Stability AI.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration

Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer

Article connexe

6 ChatGpt invite pour obtenir des invitations de podcast de marque de marqueApr 16, 2025 am 11:16 AM

De nombreux propriétaires d'entreprise sont assis à attendre des invitations qui n'arrivent jamais, car obtenir des entretiens de podcast nécessite une stratégie et une action cohérente. Agissez aujourd'hui. Ces invites vous positionneront comme l'invité parfait et atterriront ces carrière

5 puissantes invites d'IA qui peuvent stimuler toute idée commercialeApr 16, 2025 am 11:11 AM

Heureusement, c'est un domaine où l'IA génératrice peut être extrêmement utile. Non, il ne proposera pas de stratégies infaillibles. Mais cela peut vous aider à réfléchir à des plans d'affaires, à rechercher votre marché et à affiner le contenu marketing et la messagerie. Ce n'est pas un

Graduate Smart: Conseil de carrière pour l'ère IAApr 16, 2025 am 11:10 AM

Seule cette année se sent différente. Incertain. Ce n'est pas seulement le fait qu'une guerre tarifaire est bien avancée. L'IA est la cause sous-jacente de tant de grattage de tête et de recherche d'âme ces derniers temps. L'association caritative nationale de la jeunesse a récemment mené une enquête sur

Accélérationnisme efficace ou IA prosocial. Quel est l'avenir de l'IA?Apr 16, 2025 am 11:09 AM

Une vision accélérable: pleine vitesse à l'avance L'accélérationnisme efficace, connu sous le nom d'E / ACC pour les courts, a émergé vers 2022 comme un mouvement tech-optimiste qui a obtenu une traction significative dans la Silicon Valley et au-de

Quelles sont les références relatives, absolues et mixtes dans Excel?Apr 16, 2025 am 11:03 AM

Introduction Mes expériences initiales de feuille de calcul ont été frustrantes en raison du comportement imprévisible des formules lorsqu'ils étaient copiés. Je n'ai pas compris le référencement cellulaire à ce moment-là, mais la maîtrise des références relatives, absolues et mitigées a révolutionné ma feuille de calcul

Génération de ligne de messagerie de sujet intelligent avec word2vecApr 16, 2025 am 11:01 AM

Cet article montre comment générer des lignes d'objet de messagerie efficaces à l'aide des incorporations Word2VEC. Il vous guide dans la construction d'un système qui exploite la similitude sémantique pour créer des lignes d'objet contextuellement pertinentes, améliorant le marketing par e-mail en

Future of Data AnalystApr 16, 2025 am 11:00 AM

Analyse des données: naviguer dans le paysage en évolution Imaginez un monde où les données ne sont pas seulement des chiffres, mais la pierre angulaire de chaque décision de gestion. Dans cet environnement dynamique, l'analyste de données est indispensable, transformant les données brutes en exploitable

Quelle est la fonction de sumproduct dans Excel? - Analytique VidhyaApr 16, 2025 am 10:55 AM

Fonction de sumproduct d'Excel: une puissance d'analyse des données Déverrouillez la puissance de la fonction de sumproduct d'Excel pour l'analyse des données rationalisées. Cette fonction polyvalente combine sans effort les capacités de sommation et de multiplication, s'étendant à l'addition, soustrayant

See all articles

Outils d'IA chauds

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

Générez AI Hentai gratuitement.

Afficher plus

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Meilleurs paramètres graphiques

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Solution d'énigmes de coquille

2 Il y a quelques semainesByDDD

R.E.P.O. Comment réparer l'audio si vous n'entendez personne

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Commandes de chat et comment les utiliser

4 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Afficher plus

Outils chauds

Dreamweaver Mac

Outils de développement Web visuel

PhpStorm version Mac

Le dernier (2018.2.1) outil de développement intégré PHP professionnel

SublimeText3 version anglaise

Recommandé : version Win, prend en charge les invites de code !

DVWA

Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

mPDF

mPDF est une bibliothèque PHP qui peut générer des fichiers PDF à partir de HTML encodé en UTF-8. L'auteur original, Ian Back, a écrit mPDF pour générer des fichiers PDF « à la volée » depuis son site Web et gérer différentes langues. Il est plus lent et produit des fichiers plus volumineux lors de l'utilisation de polices Unicode que les scripts originaux comme HTML2FPDF, mais prend en charge les styles CSS, etc. et présente de nombreuses améliorations. Prend en charge presque toutes les langues, y compris RTL (arabe et hébreu) et CJK (chinois, japonais et coréen). Prend en charge les éléments imbriqués au niveau du bloc (tels que P, DIV),

Afficher plus

Sujets chauds

Où se trouve l’entrée de connexion pour la messagerie Gmail ?

7522

Tutoriel CakePHP

1378

Quel est le format du nom de compte de Steam

Clé d&amp;amp;amp;amp;amp;amp;#39;activation Win11 permanent

NYT Connexions Indices et réponses

Afficher plus