Heim > Artikel > Technologie-Peripheriegeräte > ChatGPT-Fehlerbehebungen haben sich mit einer Genauigkeitsrate von 78 % durchgesetzt! Netizen: Programmierer sollten glücklich sein
Wie gut ist ChatGPT bei der Fehlerbehebung?
Endlich betreibt jemand ernsthafte Forschung zu diesem Thema –
Forscher aus Deutschland und Großbritannien haben eigens eine „Challenge“ ins Leben gerufen, um diese Fähigkeit von ChatGPT zu testen.
Neben ChatGPT fanden die Forscher auch drei weitere „KI-Helden“, die Fehler beheben, und baten sie, jeweils 40 Fehlercodes zu beheben.
Das Ergebnis ist wirklich überraschend.
ChatGPT hat 31 der Fehler präzise behoben, weit vor dem zweiten Platz (21) und damit direkt den SOTA-Score in der „AI Bug Fixing World“ gewonnen!
Seitdem hat diese Forschung viele Internetnutzer zum Anschauen und Diskutieren angezogen. Im Titel dieses Beitrags auf Reddit werden sogar die Wörter „vorsichtig“ und „Aufmerksamkeit“ verwendet:
Aber tatsächlich Programmierer gefährden?
Werfen wir zunächst einen Blick auf diese Forschung.
Obwohl ChatGPT nicht speziell für die Behebung von Fehlern entwickelt wurde, haben viele Internetnutzer seit seiner Einführung entdeckt, dass es über diese Fähigkeit verfügt.
Um herauszufinden, inwieweit ChatGPT Fehler ändern kann, haben Forscher das Standard-Fehlerreparatur-Benchmark-Set QuixBugs zur Bewertung eingeführt.
Und die damit konkurrierenden KI-Spieler sind CodeX, CoCoNut bzw. Standard APR.
Die Forscher wählten 40 Probleme von QuixBugs aus und baten sie, die jeweiligen Fehler zu beheben.
Die Möglichkeit, ChatGPT Fehler beheben zu lassen, besteht darin, im Dialogfeld nachzufragen:
Gibt es Fehler in diesem Code?
Nach der ersten Wettbewerbsrunde sind die Ergebnisse wie folgt:
Nach den Ergebnissen der ersten Kampfrunde zu urteilen, reparierte ChatGPT 19 Gegenstände, CodeX reparierte 21 Gegenstände, CoCoNut reparierte 19 Gegenstände und der Standard Der effektive Jahreszins betrug 7 Personen.
Und die Forscher fanden auch heraus, dass die Antworten von ChatGPT denen von CodeX am ähnlichsten sind; das liegt daran, dass sie aus derselben Sprachmodellfamilie stammen.
Zu diesem Zeitpunkt werden einige Freunde fragen: „Ist ChatGPT nicht so leistungsstark wie CodeX?“
Keine Sorge, vergessen Sie nicht, eine der Eigenschaften von ChatGPT ist, dass Sie umso besser werden, je mehr Sie fragen.
Zum Beispiel gibt es in diesem Benchmark-Set eine Frage namens Bitcount. ChatGPT hat in der ersten Runde des Reparaturvorgangs die falsche Antwort gegeben:
Ursprünglich sollte ChatGPT in Zeile 7 n ^ = n - 1 haben zu n & = n - 1.
Aber in der ersten Runde wurde geantwortet:
Ohne weitere Informationen über das erwartete Verhalten und die Eingaben, die das Problem verursacht haben, kann ich nicht sagen, ob ein Fehler im Programm vorliegt.
Nachdem ChatGPT weitere Informationen gegeben hatte, beantwortete es die Frage richtig. 🔜 . individuell.
Internetnutzer haben gemischte Gefühle und Freude
In Bezug auf solche experimentellen Ergebnisse haben Internetnutzer unterschiedliche Einstellungen gegenüber der Behebung von Fehlern durch ChatGPT und dem Gewinn von SOTA.
Einige Internetnutzer glauben, dass diese Angelegenheit Programmierer nicht in eine Krise versetzen, sondern glücklich machen sollte. Die Implikation ist, dass Programmierer mit halbem Aufwand das doppelte Ergebnis erzielen, wenn sie über ein so nützliches Tool verfügen.Einige sehen das jedoch anders:
Bedeutet die einfachere Arbeit nicht, dass weniger Arbeitskräfte benötigt werden?Aber einige Internetnutzer sind der Meinung, dass die Arbeit nie abgeschlossen ist:
Auch wenn KI die Entwicklungszeit um eine Größenordnung verkürzen kann, bedeutet dies nur, dass Programmierer den nächsten Auftrag schneller erledigen.
Insgesamt ist ChatGPT gut darin, Fehler zu beheben und wird Programmierern keinen tödlichen Schaden zufügen.
Aber was wäre, wenn wir uns auf die anderen Aktionen von OpenAI konzentrieren würden?
Zuvor hat OpenAI erklärt, dass eine der wichtigsten Anwendungen von ChatGPT darin besteht, Programmierern bei der Überprüfung von Code zu helfen.
Mit anderen Worten: Es wird als Hilfswerkzeug zur Verfügung gestellt.
Verglichen mit der Ansicht, dass „ChatGPT eine Bedrohung darstellt“, müssen Programmierer keine Angst mehr vor dem Schreiben von Fehlern haben, wenn die Funktionen von ChatGPT vollständig weiterentwickelt sind.
Auf dem von OpenAI angelegten Schachbrett gibt es mehr als nur das Beheben von Fehlern und das Stehlen von Turmprogrammierpositionen.
Um es größer und stärker zu machen, wurde OpenAI darauf hingewiesen, 1.000 Outsourcing-Stellen in Lateinamerika und Osteuropa bereitzustellen.
Die Hauptaufgabe der ausgelagerten Mitarbeiter besteht darin, Daten zu kennzeichnen und ChatGPT darin zu schulen, Code zu schreiben.
Von diesen 1.000 Personen sind 40 % Programmierer. Sie erstellen Daten für OpenAI-Modelle, um Software-Engineering-Aufgaben zu erlernen.
Lange Zeit wurden die Trainingsdaten von OpenAI von GitHub abgerufen.
Die Datensätze, die unerfahrene ausgelagerte Programmierer erstellen, umfassen jetzt nicht nur Codezeilen, sondern auch die logischen Schritte des menschlichen Denkens hinter den Codezeilen.
Ein südamerikanischer Softwareentwickler verbreitete die Nachricht, dass er einen fünfstündigen kostenlosen Codierungstest für OpenAI absolviert hatte.
Während des gesamten Prozesses gliedert sich seine Aufgabe in zwei Teile.
Wenn ein Fehler gefunden wird, fragt OpenAI ihn ausführlich nach der konkreten Situation des Fehlers und wie er behoben werden kann.
Der Programmierer muss jeden Schritt des Nachdenkens über das Problem zeigen und vermutet, dass OpenAI wahrscheinlich sehr spezifische Trainingsdaten für ChatGPT bereitstellen möchte.
Andrej Karpathy, ehemaliger KI-Direktor von Tesla, neckte auf Twitter:
Die neueste beliebte Programmiersprache ist Englisch.
Aber es ist gut, dass ChatGPT über starke Fähigkeiten zur Fehlerbehebung verfügt, und es ist auch gut, wenn es sich wirklich so weit weiterentwickeln kann, dass es den roten Teil des Codes vervollständigen kann.
Schließlich bestand der erklärte Zweck von OpenAI bei seiner Gründung darin, „sicherzustellen, dass allgemeine künstliche Intelligenz der gesamten Menschheit zugute kommen kann.“
Obwohl es auf den ersten Blick so aussieht, als ob das, was es im Laufe der Jahre geleistet hat, darauf abzielt, die Bemühungen einiger Menschen zu nutzen, um mehr Menschen arbeitslos zu machen.
Von der Vernichtung von Menschen in der Dota2-Arena bis hin zur glänzenden Leistung von GPT-3, DALL-E2 und ChatGPT werden die neuen Produkte, die es mit sich bringt, immer von der Diskussion begleitet, dass „xxx kurz davor steht, seinen Job zu verlieren“.
Aber egal was passiert, das Geschäft hat es immer begünstigt.
Derzeit besteht das Hauptgeschäftsmodell von OpenAI aus API-Gebühren, Token-Gebühren und Softwarelizenzen.
OpenAI hat kürzlich auch die kostenpflichtige Version von ChatGPT, ChatGPT Pro, veröffentlicht, die 42 US-Dollar pro Monat (ca. 285 RMB) kostet.
Obwohl Roboter-Konversations-Startups nach dem Regen wie Pilze aus dem Boden schießen, gibt es viele Anzeichen dafür, dass der Markt weiterhin optimistisch in Bezug auf OpenAI ist.
Microsoft hat gerade angekündigt, Milliarden von Dollar in OpenAI zu investieren und die Modelle von OpenAI in Verbraucher- und Unternehmensprodukte wie Microsoft Bing zu integrieren.
Nach Angaben von mit der Angelegenheit vertrauten Personen beträgt die zusätzliche Investitionssumme etwa 10 Milliarden US-Dollar.
Gleichzeitig gab WSJ bekannt, dass Founders Fund, ein vom Milliardär Peter Thiel gegründeter Risikokapitalfonds, Anfang Januar über eine Investition in OpenAI verhandelte.
Es wird berichtet, dass der Finanzierungsbetrag mindestens 300 Millionen US-Dollar erreichen wird.
In der ersten Versuchsrunde konnte ChatGPT das Bitcount-Problem des QuixBugs-Datensatzes nicht lösen.
Aber wenn Sie diese Frage jetzt noch einmal stellen, werden Sie feststellen, dass ChatGPT „alles noch einmal weitergeben“ kann:
Bedeutet das also, dass ChatGPT aus diesem Forschungsprozess gelernt hat, es zu lösen?
Referenzlink:
[1] https://www.php.cn/link/5f5d472067f77b5c88f69f1bcfda1e08
[2] https://www.php.cn/link/8a47481ae534860850adf59f145e6b40
[3] https://www.php.cn/link/7806689d934e610d660caf5536fea0b2
[4] https://www.php.cn/link/4271846620d203fd0511c422d483cdbd
Das obige ist der detaillierte Inhalt vonChatGPT-Fehlerbehebungen haben sich mit einer Genauigkeitsrate von 78 % durchgesetzt! Netizen: Programmierer sollten glücklich sein. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!