suchen
HeimTechnologie-PeripheriegeräteKIXiao Zha hat offiziell das schwergewichtige Update von Code Llama angekündigt und eine 70B-Version hinzugefügt, es gibt jedoch immer noch Kapazitätsbeschränkungen

Das leistungsstärkere Modell Code Llama 70B ist da.

Heute veröffentlicht Meta offiziell den Code Llama 70B, das größte und leistungsstärkste Modell aller Zeiten in der Code Llama-Serie.

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

Wir bieten Open Source eine verbesserte Version von Code Llama an, die ein größeres 70B-Parametermodell enthält. Das Schreiben und Bearbeiten von Code ist zu einer der wichtigsten Anwendungen moderner Modelle der künstlichen Intelligenz geworden. Es stellt sich heraus, dass für KI-Modelle die Fähigkeit, Code zu schreiben, der Schlüssel zu einer strengeren und rationaleren Verarbeitung von Informationen in anderen Bereichen ist. Ich bin sehr stolz auf diese Entwicklung und freue mich darauf, sie in Llama 3 und zukünftige Modelle zu integrieren.


Code Llama 70B ist in den gleichen drei Versionen wie zuvor veröffentlichte Code Llama-Modelle erhältlich:

  • CodeLlama – 70B, Basiscode-Modell;
  • CodeLlama – 7 0B - Python, spezialisiert 70B für Python;
  • Code Llama – 70B – Instruct 70B, das auf das Verständnis natürlichsprachlicher Anweisungen abgestimmt ist.

Code Llama war ursprünglich ein Tool, das im August 2023 von Meta eingeführt wurde und für Forschung und kommerzielle Nutzung kostenlos ist.

Laut einem Meta AI-Blogbeitrag kann Code Llama 70B mehr Abfragen verarbeiten als andere Versionen, was bedeutet, dass Entwickler ihm beim Programmieren mehr Hinweise geben können und es genauer sein kann.

Im HumanEval-Benchmark erreichte Code Llama 70B eine Genauigkeit von 53 %, besser als die 48,1 % von GPT-3.5 und näher an den im OpenAI-Papier angegebenen 67 % von GPT-4.

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

Code Llama basiert auf Llama 2 und hilft Entwicklern, Code basierend auf Eingabeaufforderungen zu erstellen und von Menschen geschriebenen Code zu debuggen. Zu Beginn der Veröffentlichung gab Meta an, dass die Open-Source-Lizenz von Code Llama mit der von Llama 2 identisch sei und für Forschungs- und kommerzielle Zwecke kostenlos sei, ebenso wie Code Llama 70B.

Zu dieser Zeit gab es drei Versionen der Modelle der Code Llama-Serie mit den Parametermengen 7B, 13B und 34B. Und unterstützt mehrere Programmiersprachen, darunter Python, C++, Java, PHP, Typescript (Javascript), C# und Bash.

Meta bietet Code Llama-Versionen, einschließlich:

  • Code Llama, grundlegendes Codemodell;
  • Code Llama-Python, optimierte Python-Version;
  • Code L lam a-Instruieren , natürlich Eine fein abgestimmte Version des Sprachbefehls.

Unter diesen konzentrieren sich die beiden letztgenannten Modelle auf bestimmte Codierungssprachen. Jetzt wurde diese Modellfamilie um Code Llama 70B erweitert, der Codierungsaufgaben auf ein neues Niveau hebt.

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

Code Llama 70B wird auf 1 TB Code und codebezogenen Daten trainiert, die im Code-Repository Hugging Face gehostet werden.

Meta sagt, dass seine größeren Modelle, die Modelle 34B und 70B, die besten Ergebnisse liefern und eine bessere Codierungsunterstützung bieten.

Doch nach Erfahrung des Entwicklers weist Code Llama 70B immer noch offensichtliche Mängel auf.

Zum Beispiel hat jemand herausgefunden, dass Code Llama 70B die Anforderung zum Generieren von Primzahlen nicht abschließen kann:

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

Einige Leute sagen auch, dass diese Einschränkung dazu dient, einige schlechte Verwendungen zu vermeiden, wie z Erzeugen illegaler Primzahlen. Illegale Primzahlen können verwendet werden, um Material darzustellen, dessen Besitz oder Verbreitung verboten ist, und die Verbreitung solcher Programme ist nach dem US-amerikanischen Digital Millennium Copyright Act illegal.

小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制

Referenzlink: https://www.theverge.com/2024/1/29/24055011/meta-llama2-code-generator-generative-ai

Verwandte Lektüre

Das obige ist der detaillierte Inhalt vonXiao Zha hat offiziell das schwergewichtige Update von Code Llama angekündigt und eine 70B-Version hinzugefügt, es gibt jedoch immer noch Kapazitätsbeschränkungen. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Dieser Artikel ist reproduziert unter:机器之心. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen
Datagemma: Grounding LLMs gegen Halluzinationen - Analytics VidhyaDatagemma: Grounding LLMs gegen Halluzinationen - Analytics VidhyaApr 12, 2025 am 09:46 AM

Einführung Große Sprachmodelle verändern die Branchen schnell-sie versetzen alles, vom personalisierten Kundendienst bis hin zum Bankgeschäft bis hin zu Echtzeitsprachübersetzung in der globalen Kommunikation. Sie können Quest beantworten

Wie baue ich ein Multi-Agent-System mit Crewai und Ollama?Wie baue ich ein Multi-Agent-System mit Crewai und Ollama?Apr 12, 2025 am 09:44 AM

Einführung Möchten Sie kein Geld für APIs ausgeben, oder sind Sie besorgt über Privatsphäre? Oder möchten Sie nur LLMs lokal ausführen? Mach dir keine Sorge; Dieser Leitfaden hilft Ihnen beim Aufbau von Agenten und Multi-Agent-Frameworks mit lokalen LLMs T

AV -Bytes: OpenAI ' S O1 -Modelle, Apples visuelle KI und mehr - Analytics VidhyaAV -Bytes: OpenAI ' S O1 -Modelle, Apples visuelle KI und mehr - Analytics VidhyaApr 12, 2025 am 09:38 AM

Einführung Diese Woche wurde in der Welt der künstlichen Intelligenz (KI) mit großen Updates gefüllt. Aus O1 -Modellen von OpenAI, die fortschrittliche Überlegungen zur bahnbrechenden visuellen Intelligenztechnologie von Apple präsentieren, Tech

Wie kann man Produktionsgrad-Agenten-Lag-Pipelines überwachen?Wie kann man Produktionsgrad-Agenten-Lag-Pipelines überwachen?Apr 12, 2025 am 09:34 AM

Einführung Im Jahr 2022 revolutionierte der Start von ChatGPT sowohl die technischen als auch die Nicht-Tech-Industrie und befugte Einzelpersonen und Organisationen mit generativer KI. Während des gesamten 2023 konzentrierten sich die Anstrengungen auf die Nutzung des großen Sprachmodus

Wie optimieren Sie das Data Warehouse mit einem Star -Schema?Wie optimieren Sie das Data Warehouse mit einem Star -Schema?Apr 12, 2025 am 09:33 AM

Das Sternschema ist ein effizientes Datenbankdesign, das für Data Warehousing und Business Intelligence verwendet wird. Es organisiert Daten in einer zentralen Faktentabelle, die mit umgebenden Dimensionstabellen verknüpft ist. Diese sternähnliche Struktur vereinfacht das komplexe q

Ein umfassender Leitfaden zum Aufbau multimodaler LappensystemeEin umfassender Leitfaden zum Aufbau multimodaler LappensystemeApr 12, 2025 am 09:29 AM

Abrufen von Augmented-Generierungssystemen, die besser als Rag-Systeme bekannt sind, sind zum De-Facto-Standard für den Aufbau intelligenter AI-Assistenten geworden

Wie agentenlagersysteme verändern die Technologie?Wie agentenlagersysteme verändern die Technologie?Apr 12, 2025 am 09:21 AM

Einführung Künstliche Intelligenz ist in eine neue Ära eingetreten. Vorbei sind die Tage, in denen Modelle einfach Informationen basierend auf vordefinierten Regeln ausgeben würden. Der modernste Ansatz in KI heute dreht sich um Lappen (Retrieval-Augmente

SQL-Assistent bei automatischen GenerenfragenSQL-Assistent bei automatischen GenerenfragenApr 12, 2025 am 09:13 AM

Haben Sie sich jemals gewünscht, Sie könnten einfach mit Ihrer Datenbank sprechen, Fragen in einfacher Sprache stellen und sofortige Antworten erhalten, ohne komplexe SQL -Abfragen zu schreiben oder über Tabellenkalkulationen zu sortieren? Mit Langchains SQL Toolkit, goq a

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vorBy尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Herunterladen der Mac-Version des Atom-Editors

Herunterladen der Mac-Version des Atom-Editors

Der beliebteste Open-Source-Editor

MantisBT

MantisBT

Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Leistungsstarke integrierte PHP-Entwicklungsumgebung

EditPlus chinesische Crack-Version

EditPlus chinesische Crack-Version

Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

SecLists

SecLists

SecLists ist der ultimative Begleiter für Sicherheitstester. Dabei handelt es sich um eine Sammlung verschiedener Arten von Listen, die häufig bei Sicherheitsbewertungen verwendet werden, an einem Ort. SecLists trägt dazu bei, Sicherheitstests effizienter und produktiver zu gestalten, indem es bequem alle Listen bereitstellt, die ein Sicherheitstester benötigen könnte. Zu den Listentypen gehören Benutzernamen, Passwörter, URLs, Fuzzing-Payloads, Muster für vertrauliche Daten, Web-Shells und mehr. Der Tester kann dieses Repository einfach auf einen neuen Testcomputer übertragen und hat dann Zugriff auf alle Arten von Listen, die er benötigt.