Heim  >  Artikel  >  Technologie-Peripheriegeräte  >  Der Open-Source-KI-Programmierer ist da: GPT-4-Segen, Fähigkeiten vergleichbar mit Devin, 1,4.000 Sterne pro Tag

Der Open-Source-KI-Programmierer ist da: GPT-4-Segen, Fähigkeiten vergleichbar mit Devin, 1,4.000 Sterne pro Tag

WBOY
WBOYnach vorne
2024-04-03 15:01:201092Durchsuche

Um mehr über AIGC zu erfahren, besuchen Sie bitte:

51CTO AI.x Community

https://www.51cto.com/aigc/

In letzter Zeit ersetzen viele Menschen ihre eigene KI-Arbeit und machen sich Sorgen.

Devin, der „erste KI-Programmierer“, der letzten Monat im KI-Kreis populär wurde, beherrscht Full-Stack-Fähigkeiten, indem er die Fähigkeiten großer Modelle nutzt. Er kann komplexe Codeaufgaben automatisch erledigen, indem er nur natürliche Sprache benötigt Anweisungen von Menschen.

Die von Devin demonstrierten Tool-Fähigkeiten sind sehr erstaunlich, insbesondere für dieses Startup-Unternehmen, das den Closed-Source-Weg geht. Derzeit können nur wenige Personen dieses Closed-Beta-Kontingent nutzen.

Am Dienstag veröffentlichten Forscher der Princeton University NLP Group SWE-Agent, einen Open-Source-KI-Programmierer, der in weniger als einem Tag Tausende von GitHub-Sternen erhielt. Dieser SWE-Agent basiert auf Deep-Learning-Technologie und kann automatisch effizienten und zuverlässigen Code schreiben. Seine Veröffentlichung erregte große Aufmerksamkeit und viele Entwickler brachten große Anerkennung für seine Technologie und Leistung zum Ausdruck. Diese Erfolge belegen auch den Fortschritt der KI-Forschung im Bereich NLP

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k Star

SWE-Agent ist ein neues System zur autonomen Lösung von Problemen in GitHub-Repositories. Es erreichte eine ähnliche Genauigkeit wie Devin auf der SWE-Bank und benötigte durchschnittlich 93 Sekunden. Die John Yang, der Autor des Projekts, sagte, dass am 10. April auch eine Vorabdruckversion des entsprechenden Papiers hochgeladen werde.

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k StarIm Prinzip kann der SWE-Agent Fehler und Probleme in echten GitHub-Repositories beheben, indem er große Modelle (wie GPT-4) in Software-Engineering-Agenten umwandelt.

  • Auf dem kompletten SWE-Bench-Testset löste der SWE-Agent 12,29 % der Probleme und erreichte SOTA-Leistung.
  • Um den Entwicklungsprozess zu automatisieren, interagiert der SWE-Agent mit einem dedizierten Terminal, das Dateiinhalte öffnen, durchsuchen, die automatische Syntaxprüfung verwenden, bestimmte Zeilen bearbeiten und auch Tests schreiben und ausführen kann .

Die Entwickler dieses Projekts haben die Benutzeroberfläche sorgfältig entworfen und auf GitHub eingeführt.

Agent-Computer-Schnittstelle (ACI)

Das Forschungsteam hat ein einfaches, auf große Modelle (LM) ausgerichtetes Befehls- und Feedbackformat entwickelt, um es großen Modellen zu ermöglichen, das Repository einfacher zu durchsuchen, anzuzeigen, zu bearbeiten und auszuführen Codedatei, dies wird als Agent-Computer-Schnittstelle (ACI) bezeichnet. Das Forschungsteam erstellte außerdem ein SWE-Agenten-Repository, um ACI-Designs von codierten Agenten auf Repository-Ebene einfach zu iterieren.

开源版AI程序员来了:GPT-4加持,能力比肩Devin,一天1.4k StarSo wie Sprachmodelle eine gute schnelle Entwicklung erfordern, führt ein gutes ACI-Design zu besseren Ergebnissen bei der Verwendung von Agenten. Der Basisagent ohne gut abgestimmte ACI schneidet viel schlechter ab als der SWE-Agent.

SWE-Agent enthält Funktionen, die das Forschungsteam beim Entwurf der Agent-Computer-Schnittstelle als sehr nützlich empfand, darunter:

1. Fügen Sie einen Linter hinzu, der ausgeführt wird, wenn ein Bearbeitungsbefehl ausgegeben wird, sofern die Codesyntax falsch ist, wird der Bearbeitungsbefehl nicht zugelassen.

2. Stellen Sie einen speziell entwickelten Dateibetrachter für den Agenten bereit. Das Forschungsteam stellte fest, dass dieser Dateibetrachter am besten funktioniert, wenn er nur 100 Zeilen pro Runde anzeigt, und dass der Dateieditor über Befehle zum Auf- und Abscrollen und Durchführen von Suchen innerhalb der Datei verfügt.

3. Stellen Sie speziell entwickelte verzeichnisweite Zeichenfolgensuchbefehle für Agenten bereit. Das Forschungsteam fand es wichtig, dass das Tool Übereinstimmungen prägnant auflistet – listen Sie einfach jede Datei auf, die mindestens eine Übereinstimmung aufweist. Die Studie zeigte, dass es für das Modell zu verwirrend wäre, dem Modell mehr Kontext zu jeder Übereinstimmung anzuzeigen.

4. Wenn die Ausgabe des Befehls leer ist, geben Sie eine Meldung zurück: „Ihr Befehl wurde erfolgreich ausgeführt, hat aber keine Ausgabe erzeugt.“

Zukünftig veröffentlichte Artikel werden weitere Informationen enthalten.

Installation und Verwendung

Um den SWE-Agenten zu verwenden, müssen Sie zunächst die folgenden Bedingungen festlegen:

1. Installieren Sie Docker und starten Sie Docker lokal;

2. Installieren Sie Miniconda und verwenden Sie conda env create - fenvironment.yml erstellt die Swe-Agent-Umgebung.

5. Erstellen Sie eine Datei „keys.cfg“ im Stammverzeichnis dieses Repositorys und füllen Sie den folgenden Inhalt aus:

OPENAI_API_KEY: 'OpenAI API Key Here if using OpenAI Model (optional)'ANTHROPIC_API_KEY: 'Anthropic API Key Here if using Anthropic Model (optional)'GITHUB_TOKEN: 'GitHub Token Here (required)'
Die SWE-Agent-Pipeline besteht aus zwei Schritten:

Schritt 1: SWE-Agent empfängt

Schritt 2: Bewerten Sie die Pull-Anfrage, um sicherzustellen, dass sie das Problem tatsächlich behebt (derzeit nur für Probleme im SWE-Benchmark verfügbar).

  • Wenn Sie den gesamten SWE-Bench ausführen und auswerten möchten, ist die Verwendung einer x86-Maschine am einfachsten.
  • python run.py --model_name gpt4 \--data_path https://github.com/pvlib/pvlib-python/issues/1603 --config_file config/default_from_url.yaml
python run.py --model_name gpt4 \--per_instance_cost_limit 2.00 \--config_file ./config/default.yaml

Wenn Sie eine einzige Frage in SWE-Bench ausführen möchten, können Sie-In-instance_filter:

python run.py --model_name gpt4 \--instance_filter marshmallow-code__marshmallow-1359
, um mehr über AIGC zu erfahren, bitte besuchen Sie:

51CTO AI . x Community

https://www.51cto.com/aigc/

Das obige ist der detaillierte Inhalt vonDer Open-Source-KI-Programmierer ist da: GPT-4-Segen, Fähigkeiten vergleichbar mit Devin, 1,4.000 Sterne pro Tag. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Dieser Artikel ist reproduziert unter:51cto.com. Bei Verstößen wenden Sie sich bitte an admin@php.cn löschen