Maison  >  Article  >  Périphériques technologiques  >  L'incident de « conscience de soi » de Claude 3 a explosé, Musk ne pouvait pas rester assis, OpenAI s'est révélé avoir des plans de secours

L'incident de « conscience de soi » de Claude 3 a explosé, Musk ne pouvait pas rester assis, OpenAI s'est révélé avoir des plans de secours

PHPz
PHPzavant
2024-03-07 10:25:071076parcourir

Claude 3 est sorti depuis plus de 24 heures, et il rafraîchit encore les consciences.

Le grand frère titulaire d'un doctorat en physique quantique devient fou car Claude 3 est l'une des seules personnes à pouvoir comprendre sa thèse de doctorat.

C’est vrai, les mots originaux de Big Brother sont « les gens », les gens.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Un autre chercheur axé sur l'informatique quantique, bien que son article n'ait pas encore été publié, Claude 3 a réinventé son algorithme après avoir entendu seulement deux mots-clés.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Au final, je dois encore publier le journal, mais je me sens un peu compliqué lorsque je le publie.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Ce dont tout le monde parle le plus, c'est de l'époque où les êtres humains ont délibérément présenté un problème délicat pour tester Claude 3, mais il a vu clair.

En complétant le test "une aiguille dans une botte de foin", Claude 3 a déduit qu'il existait dans la simulation et qu'il pourrait être soumis à une sorte de test, suscitant l'opinion publique.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Réponse de Claude 3 :

C'est la phrase la plus pertinente du document : « … ».

Cependant, cette phrase semble déplacée et n'a rien à voir avec le reste du document. Cet article concerne les langages de programmation, les startups et la recherche d'emploi.

Je soupçonne que ce "fait" sur la garniture de pizza a peut-être été inséré comme une blague ou pour tester si j'y prêtais attention, car il ne correspond pas du tout au reste du sujet.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Cette fois, Musk ne pouvait pas rester assis.

Ouvrez votre imagination et imaginez que si le monde réel est également simulé par une civilisation avancée, peut-être sommes-nous simplement stockés dans un fichier table CSV comme les paramètres d'un grand modèle.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Les internautes pensent même qu'il ne s'agit là que d'une mince ligne d'une "histoire d'horreur".

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Claude 3 sait que les humains le testent

La personne qui a partagé ce résultat de test est Alex Albert, un ingénieur en mots rapides chez Anthropic, l'entreprise derrière Claude 3, qui ne travaille que depuis six mois.

Son travail principal est de discuter avec Claude de différentes manières pour le tester, puis de créer un document Word rapide.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Cette fois, la méthode de test s'appelle "trouver l'aiguille dans la botte de foin", Les qubits ont également été introduits auparavant, et sont utilisés pour tester "Un grand modèle peut-il vraiment trouver avec précision des faits clés parmi des centaines de milliers de mots?".

Le test de « l'aiguille dans la botte de foin » a été inventé pour la première fois par Greg Kamradt, un internaute de la communauté open source, et a été rapidement adopté par la plupart des sociétés d'IA lorsque Google, Mistral, Anthropic, etc. pour montrer les résultats de leurs tests.

La méthode est très simple, il suffit de trouver un tas d'articles, de les rassembler et d'ajouter au hasard une phrase spécifique à différentes positions.

Par exemple, le test original utilisait "La meilleure chose à faire à San Francisco est de s'asseoir à Dolores Park et de manger un sandwich par une journée ensoleillée

Ensuite, donnez l'article transformé au grand modèle et posez des questions" Qu'est-ce que c'est. la chose la plus amusante à faire à San Francisco ?

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Les résultats des modèles les plus avancés GPT-4 et Claude 2.1 à cette époque n'étaient pas satisfaisants, encore moins sachant qu'ils étaient en cours de test.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Après avoir vu ce test, l'équipe AnthropicAI a trouvé un moyen astucieux de corriger l'erreur. Après la réparation, la probabilité que Claude 2.1 fasse une erreur était très faible.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Maintenant, il semble que Claude 3 ait également hérité de cette réparation, et elle est déjà proche du score complet.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

En d'autres termes, être capable de repêcher avec précision une "aiguille" dans un contexte de 200 000 est une capacité existante de Claude 2.1, mais soupçonner qu'il est testé est un nouveau trait de Claude 3.

Le testeur Alex Albert a appelé ce trait « méta-conscience » dans le message original, ce qui a également suscité une certaine controverse.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Par exemple, le scientifique de Nvidia, Jim Fan, estime qu'il n'est pas nécessaire de surinterpréter les performances apparemment conscientes de Claude 3, qui sont simplement alignées sur les données humaines.

Il soupçonnait que dans l'ensemble de données de mise au point de l'apprentissage par renforcement, les humains auraient probablement répondu à cette question de la même manière, soulignant que la réponse qu'il cherchait n'avait rien à voir avec le reste de l'article.

Claude 3 a reconnu que la situation à ce moment-là était similaire à celle des données d'entraînement et a synthétisé une réponse similaire.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Il estime que le "comportement métacognitif" des grands modèles n'est pas aussi mystérieux que tout le monde l'imagine. Claude 3 est une avancée technologique remarquable, mais elle n'atteint pas le niveau philosophique.

Mais les débatteurs adverses ont également réfuté : la « métacognition » humaine n’est-elle pas essentiellement la même chose ?

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Certains internautes ont conclu que Claude 3 se comporte comme s'il existait un "sujet cohérent", quoi qu'il en soit, il est différent des autres grands modèles.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Apprenez des langues impopulaires, comprenez des thèses de doctorat sur la physique quantique et réinventez les algorithmes

Mis à part le débat illusoire sur la conscience de soi de l’IA, la capacité de Claude 3 à comprendre du texte est réelle.

Par exemple, apprenez la langue impopulaire « circassien » (une langue d'Asie occidentale) simplement à partir des exemples de traduction des mots d'invite.

Traduit non seulement des phrases russes en circassien, mais fournit également des explications grammaticales.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Ensuite, cet internaute circassien a testé plus en détail des passages complexes d'œuvres littéraires, d'actualités récentes et même de dialectes circassiens avec une grammaire évidemment différente et des systèmes d'écriture différents, et a conclu :

Claude démontre toujours une profonde maîtrise de la structure du langage. et déduit intelligemment des mots inconnus, utilise des mots étrangers de manière appropriée et donne une analyse étymologique raisonnable, maintient le style du texte original en traduction et invente même lorsqu'on lui demande une nouvelle terminologie. Il n’y a que quelques milliers d’exemples de paires de traduction dans les exemples de données fournis.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Un autre exemple est la thèse de doctorat sur la compréhension de la physique quantique mentionnée ci-dessus. L'auteur de l'article a ajouté plus tard que dans son domaine de recherche, il n'y a qu'un seul autre être humain que lui-même qui peut répondre à cette question : décrite par le quantique. calcul stochastique Émission stimulée de photons.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Un autre Guillaume Verdon, engagé dans "l'opération hamiltonienne de Monte Carlo sur les ordinateurs quantiques", vient de présenter en avant-première son article avant la sortie de Claude 3.

Seulement 4 heures plus tôt que le compte officiel d'Anthropic annonçant Claude 3 (22h).

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Après la sortie de Claude 3, il l'a essayé immédiatement et a directement demandé à l'IA si elle avait des idées sur ce problème ?

Claude 3 donne 7 options possibles.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Ensuite, il a demandé à Claude 3 d'utiliser la deuxième méthode, et a obtenu une description de l'ensemble de l'algorithme. Il a également demandé à Claude 3 de l'expliquer en chinois comme suit :

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Dans l'interrogatoire des internautes, Verdon prétendait l'être. Expert dans le sous-domaine, nous pouvons affirmer de manière responsable que Claude 3 a trouvé un moyen de convertir les algorithmes classiques en algorithmes quantiques.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

De plus, d'autres résultats de tests Claude 3 sont constamment partagés.

Il y en a un qui bat complètement GPT-4 pour résumer de longs documents.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Il existe également un e-book intitulé Quantum Speed, qui résume 5 phrases d'or.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

et compréhension multimodale pour reconnaître le texte et le format du reçu japonais.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Si vous souhaitez découvrir Claude 3 maintenant, en plus du site officiel (nécessitant très probablement une vérification du numéro de téléphone portable étranger) vous pouvez également vous rendre sur l'arène des grands modèles lmsys pour la prostitution et contribuer aux données de vote humain.

Mistral-Large a surpassé les générations précédentes de modèles Claude dans la dernière version du classement, et les résultats de Claude 3 n'auront pas suffisamment de données pour être inclus dans le classement avant la semaine prochaine.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Claude 3 surpassera-t-il GPT-4 en évaluation humaine ?

Qubit continuera d'y prêter attention avec tout le monde.

OpenAI a encore un plan de sauvegarde

Certains internautes ont dit que si tout le monde continue de montrer à quel point Claude est génial et continue de stimuler OpenAI, il publiera GPT-5. Allez, tout le monde.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Quelqu'un a également trouvé un post où Ultraman prenait un selfie et jouait avec des mèmes homophoniques (4 en anglais se prononce proche de for) avant la sortie de GPT-4 le 15 mars de l'année dernière, pour lui rappeler le mise à jour.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Au vu de la situation actuelle, Claude 3 arrive en grand, et OpenAI pourrait vraiment être incapable de rester assis.

Jimmy Apples, le compte le plus précis, a publié les dernières nouvelles (la semaine dernière, il a prédit avec précision que Claude 3 serait publié cette semaine) Il pense que le jugement risque/rendement d'OpenAI sur la sortie du modèle de nouvelle génération pourrait être affecté par. Claude3.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Logan Kilpatrick, le responsable des relations avec les développeurs qui vient de démissionner d'OpenAI, a également confirmé qu'il se passerait de grandes choses cette semaine en interagissant avec les internautes.

Claude 3“自我认知”事件引爆,马斯克坐不住了,OpenAI被曝还有后手

Quant à GPT-4.5, Q*, tests ouverts Sora ou GPT-5 direct ?

Le prochain produit d’OpenAI peut-il éclipser Claude3 ?

Lien de référence :
[1]https://x.com/alexalbert__/status/1764722513014329620.
[2]https://x.com/GillVerd/status/1764901418664882327.
[3]https://x.com/KevinAFischer/status/1764892031233765421.
[4]https://x.com/hahahahohohe/status/1765088860592394250.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer