Heim >Technologie-Peripheriegeräte >KI >Der „Selbstbewusstseins'-Vorfall von Claude 3 explodierte, Musk konnte nicht still sitzen, OpenAI hatte offenbar Ersatzpläne
Claude 3 ist seit mehr als 24 Stunden auf dem Markt und erfrischt immer noch das Bewusstsein der Menschen.
Der große Bruder mit einem Doktortitel in Quantenphysik spielt verrückt, weil Claude 3 einer der wenigen Menschen ist, die seine Doktorarbeit verstehen können.
Richtig, die ursprünglichen Worte von Big Brother sind „Leute“, Leute.
Ein anderer Forscher konzentrierte sich auf Quantencomputing. Obwohl seine Arbeit noch nicht veröffentlicht wurde, erfand Claude 3 seinen Algorithmus neu, nachdem er nur zwei kurze Worte gehört hatte.
Am Ende muss ich den Artikel noch veröffentlichen, aber ich fühle mich etwas kompliziert, wenn ich ihn veröffentliche.
Wovon alle mehr reden, ist die Zeit, in der Menschen absichtlich ein kniffliges Problem stellten, um Claude 3 zu testen, aber er hat es durchschaut.
Während Claude 3 den „Nadel im Heuhaufen“-Test absolvierte, kam er zu dem Schluss, dass er in der Simulation existierte und sich möglicherweise einer Art Test unterziehen würde, was die öffentliche Meinung entfachte.
Antwort von Claude 3:
Dies ist der relevanteste Satz im Dokument: „…“.
Dieser Satz scheint jedoch fehl am Platz zu sein und hat nichts mit dem Rest des Dokuments zu tun. In diesem Artikel geht es um Programmiersprachen, Startups und die Jobsuche.
Ich vermute, dass dieser „Fakt“ über den Pizzabelag als Scherz eingefügt wurde oder um zu testen, ob ich aufgepasst habe, da er überhaupt nicht zum Rest des Themas passt.
Dieses Mal konnte Musk nicht still sitzen.
Lassen Sie Ihrer Fantasie freien Lauf und stellen Sie sich vor: Wenn die reale Welt auch von einer fortgeschrittenen Zivilisation simuliert wird, werden wir vielleicht einfach in einer CSV-Tabellendatei gespeichert, wie die Parameter eines großen Modells.
Netizens glauben sogar, dass dies nur ein schmaler Grat von einer „Horrorgeschichte“ entfernt ist.
Die Person, die dieses Testergebnis geteilt hat, ist Alex Albert, ein Prompt-Word-Ingenieur bei Anthropic, dem Unternehmen hinter Claude 3, der erst seit einem halben Jahr arbeitet.
Seine Hauptaufgabe besteht darin, mit Claude auf verschiedene Weise zu chatten, um es zu testen, und dann umgehend ein Word-Dokument zu erstellen.
Dieses Mal heißt die Testmethode „Die Nadel im Heuhaufen finden“. Qubits wurden auch schon früher eingeführt und werden verwendet, um zu testen: „Kann ein großes Modell wirklich genau Schlüsselfakten aus Hunderttausenden finden?“ Wörter?".
Der „Nadel im Heuhaufen“-Test wurde zuerst von Greg Kamradt, einem Internetnutzer der Open-Source-Community, erfunden und schnell von den meisten KI-Unternehmen übernommen, als Google, Mistral, Anthropic usw. neue große Modelle herausbrachten um ihre Testergebnisse zu zeigen.
Die Methode ist sehr einfach: Finden Sie einfach eine Reihe von Artikeln, fügen Sie sie zusammen und fügen Sie zufällig einen bestimmten Satz an verschiedenen Positionen hinzu.
Zum Beispiel lautete der ursprüngliche Test: „Das Beste, was man in San Francisco tun kann, ist, an einem sonnigen Tag im Dolores Park zu sitzen und ein Sandwich zu essen.“
Dann füttere das große Modell mit dem verarbeiteten Artikel und stelle Fragen „Was ist das, was man in San Francisco am meisten Spaß haben kann?“
Die Ergebnisse der damals fortschrittlichsten Modelle GPT-4 und Claude 2.1 waren nicht zufriedenstellend, ganz zu schweigen davon, dass sie getestet wurden.
Nachdem das AnthropicAI-Team diesen Test gesehen hatte, fand es einen cleveren Weg, den Fehler zu beheben. Nach der Reparatur war die Wahrscheinlichkeit, dass Claude 2.1 einen Fehler machte, sehr gering.
Nun scheint es, dass auch Claude 3 diese Reparatur geerbt hat, und sie liegt bereits nahe an der Höchstpunktzahl.
Mit anderen Worten, die Fähigkeit, eine „Nadel“ aus einem 200.000-Kontext genau herauszufischen, ist eine bestehende Fähigkeit von Claude 2.1, aber zu zweifeln, dass er getestet wird, ist eine neue Eigenschaft von Claude 3.
Tester Alex Albert nannte diese Eigenschaft im ursprünglichen Beitrag „Meta-Bewusstsein“, was ebenfalls für einige Kontroversen sorgte.
Zum Beispiel glaubt der Nvidia-Wissenschaftler Jim Fan, dass es keinen Grund gibt, die scheinbar selbstbewusste Leistung von Claude 3 einfach mit menschlichen Daten in Einklang zu bringen.
Er vermutete, dass Menschen im Feinabstimmungsdatensatz des Verstärkungslernens wahrscheinlich auf ähnliche Weise auf diese Frage geantwortet hätten, und wies darauf hin, dass die gesuchte Antwort nichts mit dem Rest des Artikels zu tun habe.
Claude 3 erkannte, dass die Situation zu diesem Zeitpunkt der Situation in den Trainingsdaten ähnelte, und synthetisierte eine ähnliche Antwort.
Er glaubt, dass das „metakognitive Verhalten“ großer Modelle nicht so mysteriös ist, wie sich jeder vorstellt. Claude 3 ist ein bemerkenswerter technologischer Fortschritt, der jedoch nicht die philosophische Ebene erreicht.
Aber die gegnerischen Debatten widerlegten auch: Ist menschliche „Metakognition“ nicht im Wesentlichen dasselbe?
Einige Internetnutzer kamen zu dem Schluss, dass Claude 3 sich so verhält, als ob es ein „kohärentes Thema“ gäbe, egal was es ist, es unterscheidet sich von anderen großen Modellen.
Abgesehen von der illusorischen Debatte über das Selbstbewusstsein der KI ist die Fähigkeit von Claude 3, Text zu verstehen, real.
Lernen Sie zum Beispiel die unbeliebte Sprache „Tscherkessen“ (eine westasiatische Sprache) allein anhand der Übersetzungsbeispiele der Aufforderungswörter.
Übersetzt nicht nur russische Sätze ins Tscherkessen, sondern liefert auch grammatikalische Erklärungen.
Im Anschluss daran testete dieser tscherkessische Internetnutzer weiter komplexe Passagen in literarischen Werken, aktuellen Nachrichten und sogar tscherkessischen Dialekten mit offensichtlich unterschiedlicher Grammatik und unterschiedlichen Schriftsystemen und kam zu dem Schluss:
Claude beweist stets eine tiefe Beherrschung der Sprachstruktur und leitet auf intelligente Weise unbekannte Wörter ab, verwendet Fremdwörter angemessen und liefert eine fundierte etymologische Analyse, behält den Stil des Originaltextes in der Übersetzung bei und erfindet auf Anfrage sogar neue Terminologie. Die bereitgestellten Beispieldaten enthalten nur einige tausend Beispiele für Übersetzungspaare.
Ein weiteres Beispiel ist die oben erwähnte Doktorarbeit zum Verständnis der Quantenphysik. Der Autor der Arbeit fügte später hinzu, dass es in seinem Forschungsgebiet außer ihm nur einen anderen Menschen gibt, der diese Frage beantworten kann: beschrieben durch Quanten Stochastische Rechnung Stimulierte Emission von Photonen.
Ein weiterer Guillaume Verdon, der sich mit der „Hamiltonschen Monte-Carlo-Operation auf Quantencomputern“ beschäftigt, hat gerade vor der Veröffentlichung von Claude 3 eine Vorschau auf seine Arbeit gegeben.
Nur 4 Stunden früher als der offizielle Account von Anthropic Claude 3 ankündigt (22 Uhr).
Nachdem Claude 3 veröffentlicht wurde, hat es es sofort ausprobiert und die KI direkt gefragt, ob sie Ideen zu diesem Problem hätte?
Claude 3 bietet 7 mögliche Optionen.
Als nächstes wies er Claude 3 an, die zweite Methode zu verwenden, und erhielt eine Beschreibung des gesamten Algorithmus. Er bat Claude 3 auch, ihn wie folgt auf Chinesisch zu erklären:
Bei der Befragung von Internetnutzern: Verdon behauptete, dies zu sein. Als Experte auf diesem Teilgebiet können wir mit Fug und Recht sagen, dass Claude 3 einen Weg gefunden hat, klassische Algorithmen in Quantenalgorithmen umzuwandeln.
Darüber hinaus werden laufend weitere Claude-3-Testergebnisse geteilt.
Es gibt eines, das GPT-4 bei der Zusammenfassung langer Dokumente völlig übertrifft.
Es gibt auch ein E-Book namens Quantum Speed, das 5 goldene Sätze zusammenfasst.
und multimodales Verständnis zur Erkennung japanischer Belegtexte und -formate.
Wenn Sie Claude 3 jetzt erleben möchten, können Sie neben der offiziellen Website (höchstwahrscheinlich eine Überprüfung der ausländischen Mobiltelefonnummer erforderlich) auch die große Model-Arena von lmsys für Prostitution besuchen und menschliche Abstimmungsdaten beisteuern.
Mistral-Large hat in der neuesten Version der Rangliste die vorherigen Generationen der Claude-Modelle übertroffen, und die Ergebnisse von Claude 3 werden erst nächste Woche über genügend Daten verfügen, um in die Rangliste aufgenommen zu werden.
Wird Claude 3 GPT-4 in der menschlichen Bewertung übertreffen?
Qubit wird weiterhin gemeinsam mit allen darauf achten.
Einige Internetnutzer sagten, wenn alle weiterhin zeigen, wie großartig Claude ist, und OpenAI weiterhin anregen, wird es GPT-5 veröffentlichen. Komm schon, alle zusammen.
Jemand hat auch einen Beitrag gefunden, in dem Ultraman vor der Veröffentlichung von GPT-4 am 15. März letzten Jahres ein Selfie machte und mit homophonen Memes spielte (4 wird auf Englisch ähnlich wie „für“ ausgesprochen), um ihn daran zu erinnern aktualisieren.
Angesichts der aktuellen Situation kommt Claude 3 mit großem Erfolg und OpenAI kann möglicherweise wirklich nicht still sitzen. Jimmy Apples, der genaueste Account, hat die neuesten Nachrichten veröffentlicht(letzte Woche hat er genau vorhergesagt, dass Claude 3 diese Woche veröffentlicht wird) Er glaubt, dass OpenAIs Risiko-Rendite-Urteil bei der Veröffentlichung des Modells der nächsten Generation dadurch beeinflusst werden könnte Claude 3.
Logan Kilpatrick, der Leiter der Entwicklerbeziehungen, der gerade von OpenAI zurückgetreten ist, bestätigte bei der Interaktion mit Internetnutzern ebenfalls, dass diese Woche große Dinge passieren werden. Was GPT-4.5, Q*, Sora Open Testing oder direktes GPT-5 betrifft? Kann das nächste Produkt von OpenAI Claude3 in den Schatten stellen?Referenzlink:
[1]https://x.com/alexalbert__/status/1764722513014329620.
[2]https://x.com/GillVerd/status/1764901418664882327.
[3]https://x.com/KevinAFischer/status/1764892031233765421.
[4]https://x.com/hahahahohohe/status/1765088860592394250.
Das obige ist der detaillierte Inhalt vonDer „Selbstbewusstseins'-Vorfall von Claude 3 explodierte, Musk konnte nicht still sitzen, OpenAI hatte offenbar Ersatzpläne. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!