Maison >Périphériques technologiques >IA >Après avoir terminé l'évaluation complète de GPT-4, le hot paper de Microsoft indique que la première version d'AGI sera bientôt disponible.
En 1956, lors d'un séminaire organisé au Dartmouth College, le concept d'intelligence artificielle a été formellement proposé.
Le terme a depuis interpellé les psychologues, les philosophes et les informaticiens car il est très difficile à définir. En 1994, 52 psychologues ont publié un article commun tentant d’en saisir l’essence.
Au fil du temps, les chercheurs commencent à porter leur attention sur les systèmes d'IA dans des domaines spécifiques, comme le défi AlphaGo 2016 contre le champion d'échecs coréen et une victoire éclatante. Puis, à la fin des années 1990 et au début des années 2000, les chercheurs ne se contentaient plus de l’IA spécialisée, de sorte que les appels au développement de systèmes d’intelligence artificielle plus généraux se sont multipliés. Parallèlement à cela, le terme Intelligence Générale Artificielle (AGI) a commencé à gagner en popularité au début des années 2000.
Ces derniers temps, comme vous pouvez le constater, les grands modèles de langage (LLM) sont devenus sous le feu des projecteurs. Ces réseaux de neurones sont basés sur l'architecture Transformer et formés sur de grandes quantités d'ensembles de données textuelles. En particulier, la dernière version d'OpenAI de GPT-4 démontre la polyvalence des modèles de langage à grande échelle et maîtrise les mathématiques, l'écriture, le droit, la médecine et d'autres domaines.
Nous ne pouvons nous empêcher de nous demander si GPT-4 est une étape importante vers l’AGI ?
La réponse donnée par Microsoft est oui, et dans un article récemment publié, ils ont développé ce point de vue. Cet article fournit une évaluation complète de GPT-4. Microsoft estime que "compte tenu de l'étendue et de la profondeur des capacités de GPT-4, nous pensons qu'il devrait raisonnablement être considéré comme une version précoce (mais encore incomplète) d'un système d'intelligence générale artificielle (AGI)."
Microsoft a également déclaré : " Cet article L'objectif principal est d'explorer les capacités et les limites de GPT-4. Nous pensons que l'intelligence de GPT-4 marque un véritable changement de paradigme en informatique et dans d'autres domaines "
Adresse papier : https://arxiv.org/pdf/2303.12712.pdf
Fait intéressant, ce document populaire comportait également de nombreuses suppressions, alors quelqu'un a trouvé la version intégrale du document.
Dans la version non coupée, ce blogueur a également révélé de nombreux détails cachés, tels que le nom interne de GPT-4 est DV-3, qui était en fait le troisième auteur caché de l'article, et a ensuite été supprimé. Les chercheurs de Microsoft ne semblent pas savoir grand-chose sur les détails techniques de GPT-4. De plus, le blogueur a également révélé que la partie concernant le contenu toxique avait été supprimée lors de la publication de cet article (pour éviter des effets négatifs sur OpenAI ?).
Nous avons collé le fil Twitter du blogueur ci-dessous pour que ceux qui souhaitent le consulter.
Fil Twitter : https://twitter.com/DV2559106965076/status/1638769434763608064
Retour à l'article lui-même.
Selon l'article, l'AGI est la capacité spécifique de raisonner, de planifier, de résoudre des problèmes, de penser de manière abstraite, de comprendre des idées complexes, d'apprendre rapidement et d'apprendre de l'expérience. À partir de ces capacités, l’article mène des expériences et des évaluations intéressantes.
L'article est divisé en 10 chapitres : le chapitre 1 est la partie générale ; le chapitre 2 présente la multimodalité, principalement liée au contenu de génération visuelle ; 4 : Capacité mathématique ; Chapitre 5 : Interaction avec le monde ; Chapitre 6 : Interaction avec les humains ; Chapitre 7 : Discrimination ; Chapitre 8 : Limitations du GPT-4 ; Chapitre 10 : Orientations futures et conclusions.
Utilisons des exemples spécifiques pour voir si GPT-4 est vraiment entré dans l'ère AGI.
Pour tester la capacité du modèle à combiner art et programmation, l'étude a demandé à GPT-4 d'écrire un code en javascript pour générer des images aléatoires de style Kandinsky, illustrées ci-dessous. L'une a été créée par Wassily. Kandinsky, le deuxième et le troisième ont été générés respectivement par GPT-4 et ChatGPT :
Voici le processus d'implémentation du code GPT-4 :
Comprendre les concepts visuels : dans cette tâche de dessin, entrez des invites pour laisser le modèle dessiner les formes des lettres Y, O, et H une personne. En fait, dans le processus de formation de GPT-4, il n'y a aucune connaissance sur la forme des lettres. On ne peut que vaguement apprendre que les lettres sont liées à certaines formes spécifiques à partir des données de formation pertinentes. 4 ne sont pas mauvais :
Pour la génération de croquis : GPT-4 peut également être combiné avec Stable Diffusion. L'image ci-dessous est une capture d'écran de la modélisation d'une ville en 3D. L'invite de saisie présente une rivière qui coule de gauche à droite, un désert avec des pyramides construites à côté de la rivière et quatre boutons en bas de l'écran, dont les couleurs sont vertes. bleu, marron et rouge. Voici le résultat généré :
Vous pouvez également demander à GPT-4 de générer et de modifier des mélodies en utilisant la notation ABC :
GPT-4 a des capacités de programmation très puissantes. Comprend l’écriture de code conformément aux instructions et la compréhension du code existant. L'étude a spécifiquement testé les capacités de programmation de GPT-4.
Écriture de code
La figure 3.1 ci-dessous est un exemple de laisser GPT-4 écrire des fonctions python. Cette étude utilise LeetCode pour déterminer en ligne si le code est correct.
Ensuite, l'étude a permis à GPT-4 de visualiser les données de précision sur LeetCode dans le tableau 2 ci-dessus sous forme de graphique, et les résultats sont présentés dans la figure 3.2 ci-dessous.
Front-end/Développement de jeux
Comme le montre la figure 3.3 ci-dessous, cette étude permet à GPT-4 d'écrire des jeux 3D en HTML en utilisant JavaScript, et GPT-4 n'en utilise aucun. exemples Un jeu a été généré et répondait à toutes les exigences.
Programmation d'apprentissage en profondeur
L'écriture de code pour l'apprentissage en profondeur nécessite des connaissances en mathématiques, en statistiques et une familiarité avec des frameworks et des bibliothèques tels que PyTorch, TensorFlow, Keras, etc. Comme le montre la figure 3.4 ci-dessous, les chercheurs ont besoin de GPT-4 et de ChatGPT pour écrire des modules d'optimisation personnalisés, une tâche qui représente également un défi pour les experts en apprentissage profond humain. Les chercheurs fournissent des descriptions en langage naturel pour GPT-4 et ChatGPT, qui incluent une série d'opérations importantes, telles que l'application de SVD, etc.
De plus, l'étude a également testé la capacité de GPT-4 à convertir du code en formules LaTex, et les résultats sont présentés dans la figure 3.5 ci-dessous.
En termes de compréhension du code, cette recherche tente de laisser GPT-4 et ChatGPT « lire » un programme C/C++ et prédire la sortie du programme. Les performances des deux sont les suivantes :
. Ensuite, la recherche Laissez GPT-4 expliquer un morceau de code Python :
et expliquer un morceau de pseudo-code :
Pendant longtemps, la capacité mathématique de les grands modèles de langage ne semblent pas très bons. Alors, comment GPT-4 fonctionne-t-il à cet égard ? Après une série d'évaluations dans cet article, les résultats montrent que GPT-4 a fait un saut qualitatif en mathématiques par rapport aux modèles précédents, mais il est encore loin du niveau expert et n'a pas la capacité de faire des recherches mathématiques.
En comparaison avec ChatGPT, GPT-4 a généré avec succès la solution, tandis que ChatGPT a généré la mauvaise réponse :
Sur la question AP, résultats de la comparaison GPT-4 vs ChatGPT. GPT-4 utilise la bonne approche, mais une erreur de calcul conduit à une mauvaise réponse finale, tandis que ChatGPT produit un argument incohérent.
De plus, cet article teste la capacité de GPT-4 à utiliser la pensée mathématique et la technologie pour résoudre des problèmes du monde réel : la figure ci-dessous montre comment GPT-4 construit avec succès la rationalité d'un système complexe qui nécessite des connaissances mathématiques interdisciplinaires approfondies. modèle, tandis que ChatGPT n’a pas réussi à faire des progrès significatifs.
Étant donné que l'article fait 154 pages, cet article n'affiche qu'un grand nombre de résultats d'évaluation. Pour plus d'informations, les lecteurs peuvent se référer à l'article original.
Enfin ci-joint la table des matières :
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!