Maison >Périphériques technologiques >IA >Intelligence artificielle générale, perception de l'intelligence artificielle et grands modèles de langage
Peut-être n’avez-vous pas remarqué que les récentes performances des systèmes d’intelligence artificielle sont devenues de plus en plus surprenantes.
Par exemple, le nouveau modèle DALL-E 2 d'OpenAI peut générer des images originales attrayantes basées sur de simples invites textuelles. Avec des modèles comme DALL-E, il est plus difficile de nier l’idée selon laquelle l’intelligence artificielle peut être créative. Considérez, par exemple, la vision imaginative de DALL-E sur « une vache hip-hop portant une veste en jean enregistrant un single à succès en studio ». Ou pour un exemple plus abstrait, consultez l'explication de DALL-E sur l'ancienne phrase de Peter Thiel "Nous voulons des voitures volantes, pas 140 caractères."
Pendant ce temps, DeepMind a récemment annoncé un nouveau modèle appelé Gato, qui peut à lui seul en exécuter des centaines. de différentes tâches, depuis jouer à des jeux vidéo, avoir des conversations, empiler des blocs du monde réel avec un bras robotique. Presque tous les modèles d’IA précédents étaient capables de faire une chose et une seule : par exemple jouer aux échecs. En tant que tel, Gato représente une étape importante vers une intelligence machine plus large et plus flexible.
Et les grands modèles de langage (LLM) d’aujourd’hui – du GPT-3 d’OpenAI au PaLM de Google en passant par l’OPT de Facebook – disposent d’un éventail vertigineux de capacités linguistiques. Ils peuvent avoir des conversations nuancées et approfondies sur presque tous les sujets. Ils peuvent générer eux-mêmes du contenu impressionnant et original, des mémos professionnels à la poésie. Pour ne donner qu'un exemple récent, GPT-3 a récemment rédigé un article universitaire bien rédigé sur lui-même et fait actuellement l'objet d'un examen par les pairs en vue d'une publication dans une revue scientifique prestigieuse.
Ces avancées ont inspiré des spéculations audacieuses et des discussions animées au sein de la communauté de l’intelligence artificielle sur l’orientation du développement technologique.
Certains chercheurs crédibles en IA pensent que nous sommes désormais très proches de « l’intelligence générale artificielle » (AGI), une référence souvent discutée qui fait référence à une intelligence artificielle puissante et flexible qui peut accomplir n’importe quelle tâche cognitive mieux que les humains. Le mois dernier, un ingénieur de Google nommé Blake Lemoine a fait la une des journaux en affirmant de manière dramatique que le modèle linguistique à grande échelle de Google, LaMDA, était sensible.
La résistance à de telles affirmations a été tout aussi forte, de nombreux commentateurs d’IA rejetant d’emblée cette possibilité.
Alors, que pensons-nous de toutes les incroyables avancées récentes en matière d’intelligence artificielle ? Comment devrions-nous penser à des concepts tels que l’intelligence artificielle et la perception de l’intelligence artificielle ?
Le discours public sur ces sujets doit être recadré de plusieurs manières importantes. Les enthousiastes surexcités qui croient que l’IA superintelligente est à nos portes, et les sceptiques dédaigneux qui croient que les développements récents de l’IA ne sont qu’un battage publicitaire, se trompent tous deux dans leur réflexion sur certains aspects fondamentaux de l’IA moderne.
Un principe de base sur l'intelligence artificielle que les gens ignorent souvent est que l'intelligence artificielle est fondamentalement différente de l'intelligence humaine.
Il est faux de comparer trop directement l’intelligence artificielle à l’intelligence humaine. L’intelligence artificielle d’aujourd’hui est bien plus qu’une simple forme « moins évoluée » d’intelligence humaine. L’IA ultra-avancée de demain ne sera pas seulement une version plus puissante de l’intelligence humaine.
De nombreux modes et dimensions d'intelligence différents sont possibles. Il est préférable de considérer l’IA non pas comme une imitation imparfaite de l’intelligence humaine, mais comme une forme unique et extraterrestre d’intelligence dont les contours et les capacités diffèrent fondamentalement des nôtres.
Pour rendre cela plus concret, considérons brièvement l’état actuel de l’intelligence artificielle. L’intelligence artificielle actuelle dépasse de loin les capacités humaines dans certains domaines, tout en étant loin derrière dans d’autres.
Par exemple : Depuis un demi-siècle, le « problème du repliement des protéines » constitue un défi majeur dans le domaine de la biologie. En bref, le problème du repliement des protéines nécessite de prédire la forme tridimensionnelle d’une protéine sur la base de sa séquence d’acides aminés unidimensionnelle. Des décennies et des générations des esprits les plus brillants du monde ont travaillé ensemble pour échouer à résoudre ce défi. Un critique en 2007 l'a décrit comme « l'un des problèmes les plus importants encore non résolus de la science moderne ».
Fin 2020, un modèle d'IA appelé AlphaFold de DeepMind a apporté une solution au problème du repliement des protéines. Comme l'a déclaré John Moult, qui est engagé dans la recherche sur les protéines depuis longtemps : « C'est la première fois dans l'histoire que de graves problèmes scientifiques sont résolus par l'IA. -des formes de raisonnement dimensionnelles, qui dépassent tout simplement les capacités humaines. La portée de la pensée. Mais cela n’est pas hors de portée des systèmes modernes d’apprentissage automatique.
Pendant ce temps, tout enfant humain en bonne santé possède une « intelligence incarnée » qui dépasse de loin l’intelligence artificielle la plus sophistiquée au monde.
Dès leur plus jeune âge, les humains peuvent facilement faire des choses comme jouer à la balle, marcher sur un terrain inconnu ou ouvrir le réfrigérateur de la cuisine pour une collation. Il s’avère que ces capacités physiques sont difficiles à maîtriser pour l’intelligence artificielle.
Ceci est résumé dans le « paradoxe de Moravec ». Comme le disait le chercheur en IA Hans Moravec dans les années 1980 : « Il est relativement facile de faire en sorte qu'un ordinateur réussisse à un niveau adulte à un test d'intelligence ou qu'il joue aux échecs, mais il est difficile, voire impossible, de faire en sorte qu'un ordinateur soit performant au niveau d'un adulte. un enfant d'un an. .Perception et mobilité."
L'explication de Moravec pour ce fait peu intuitif est évolutive : "Dans les grandes parties sensorielles et motrices hautement évoluées du cerveau humain, des milliards d'années de connaissances sur la nature de le monde et son expérience de la façon d'y survivre [d'un autre côté], ce processus de réflexion que nous appelons le raisonnement supérieur, est, je crois, la couche la plus fine de l'esprit humain, et il ne fonctionne que parce qu'il est alimenté. Grâce à des connaissances sensori-motrices plus anciennes, plus puissantes, bien que souvent inconscientes, nous sommes tous de grands olympiens en matière de perception et de mouvement, si bons que nous rendons les choses difficiles faciles. "
À ce jour, les robots le font toujours. Luttes avec les capacités physiques de base . Il y a quelques semaines à peine, une équipe de chercheurs de DeepMind écrivait dans un nouvel article : « La compréhension actuelle de la « physique intuitive » par les systèmes d'IA est pâle en comparaison avec celle des très jeunes enfants.
L’intelligence artificielle générale n’existe pas.
AGI n'est ni possible ni impossible. Il s’agit plutôt d’un concept incohérent.
L’intelligence n’est pas une capacité unique, bien définie et généralisable, ni même un ensemble spécifique de capacités. Au plus haut niveau, le comportement intelligent est simplement un agent qui acquiert et utilise des connaissances sur son environnement pour poursuivre ses objectifs. Parce qu’il existe un grand nombre (théoriquement infini) d’agents, d’environnements et d’objectifs différents, l’intelligence peut se manifester d’innombrables manières différentes.
Le gourou de l’IA Yann LeCun l’a bien résumé : « L’intelligence artificielle générale n’existe pas… même les humains sont spécialisés.
Définissez l’intelligence artificielle « générale » ou « vraie » comme celle qui peut faire ce que les humains peuvent faire. La chose (mais meilleure) à propos de l’intelligence artificielle – l’idée selon laquelle l’intelligence humaine est une intelligence générale – est la myopie centrée sur l’humain. Si nous considérons l’intelligence humaine comme le point d’ancrage et la norme ultime pour le développement de l’intelligence artificielle, nous passerons à côté de toutes les capacités puissantes, profondes, inattendues, socialement bénéfiques et totalement non humaines que peut posséder l’intelligence artificielle.
Imaginez une IA dotée d’une compréhension au niveau atomique de la composition de l’atmosphère terrestre et capable de prédire dynamiquement avec une extrêmement grande précision l’évolution de l’ensemble du système au fil du temps. Imaginez s'il pouvait être conçu pour concevoir une intervention de géo-ingénierie précise et sûre dans laquelle nous déposons certaines quantités de certains composés à certains endroits de l'atmosphère, neutralisant ainsi l'effet de serre provoqué par les émissions continues de carbone de l'humanité, atténuant ainsi les effets du réchauffement climatique. la surface de la Terre.
Imaginez une intelligence artificielle capable de comprendre tous les mécanismes biologiques et chimiques du corps humain jusqu'au niveau moléculaire. Imaginez s'il pouvait ainsi prescrire un régime alimentaire adapté pour optimiser la santé de chacun, diagnostiquer avec précision la cause profonde de n'importe quelle maladie, générer de nouvelles thérapies personnalisées (même si elles n'existaient pas encore) pour traiter n'importe quelle maladie grave.
Imaginez qu'une IA puisse inventer un protocole pour fusionner les noyaux atomiques de manière à produire en toute sécurité plus d'énergie qu'elle n'en consomme, libérant ainsi la fusion nucléaire en tant que source d'énergie bon marché, durable et infiniment abondante pour l'humanité.
Tous ces scénarios restent aujourd’hui encore des fantasmes et sont hors de portée de l’intelligence artificielle d’aujourd’hui. Le fait est que le véritable potentiel de l’IA réside dans le chemin qui mène au développement de nouvelles formes d’intelligence qui sont complètement différentes de tout ce que les humains peuvent faire. Si l’IA peut atteindre un tel objectif, qui se soucie de savoir si elle est « universelle » dans le sens de correspondre aux capacités humaines dans leur ensemble ?
Se positionner comme « intelligence artificielle générale » limite et diminue le potentiel de cette technologie. Et parce que l’intelligence humaine n’est pas une intelligence générale, qui n’existe pas, elle est en premier lieu conceptuellement incohérente.
Qu'est-ce que ça fait d'être une intelligence artificielle ?
L'ingénieur de Google, Blake Lemoine, a déclenché une vague de controverses et de commentaires le mois dernier lorsqu'il a publiquement affirmé que l'un des grands modèles linguistiques de Google en avait pris conscience. (Avant de vous forger une opinion définitive, cela vaut la peine de lire vous-même la transcription complète de la discussion entre Lemoine et AI.)
La plupart des gens - en particulier les experts en IA - pensent que les affirmations de Lemoine sont fausses et déraisonnables.
Google a déclaré dans sa réponse officielle : « Notre équipe a examiné les préoccupations de Black et l'a informé que les preuves n'étayent pas ses affirmations. » Le professeur Erik Brynjolfsson de l'Université de Stanford estime que l'intelligence artificielle sensorielle pourrait prendre encore 50 ans. Gary Marcus est intervenu, qualifiant les affirmations de Lemoine de « conneries » et concluant qu'« il n'y a rien à voir ici
».Le problème avec toute cette discussion - y compris le rejet de celle-ci par les experts - est que l'existence ou l'absence de perception est, par définition, indémontrable, infalsifiable et inconnaissable.
Lorsque nous parlons de perception, nous faisons référence à l’expérience intérieure subjective de l’agent, et non à une quelconque manifestation intellectuelle externe. Personne – ni Blake Lemoine, ni Erik Brynjolfsson, ni Gary Marcus – ne peut être entièrement sûr de ce que font ou ne subissent pas les réseaux neuronaux artificiels très complexes en interne.
En 1974, le philosophe Thomas Nagel publie un article intitulé "Qu'est-ce que ça fait d'être une chauve-souris ?" "Article. Cet article, l’un des articles philosophiques les plus influents du XXe siècle, a résumé le concept notoirement insaisissable de conscience en une définition simple et intuitive : un agent est conscient s’il y a quelque chose qui veut être cet agent. Par exemple, être mon voisin d’à côté ou même son chien, c’est quelque chose, mais être sa boîte aux lettres n’a rien de comparable.
Un message clé de l’article est qu’il est impossible de savoir exactement ce que l’on ressent en étant un autre organisme ou une autre espèce de manière significative. Plus un autre organisme ou une autre espèce est différent de nous, plus son expérience interne sera inaccessible.
Nagel utilise les chauves-souris comme exemple pour illustrer ce point. Il a choisi les chauves-souris parce que, en tant que mammifères, ce sont des créatures très complexes, mais leur expérience de la vie est très différente de la nôtre : elles volent, elles utilisent le sonar comme principal moyen de percevoir le monde, etc.
Comme le dit Nagel (cela vaut la peine de citer quelques paragraphes de l'article dans leur intégralité) :
« Notre propre expérience fournit le matériau de base de notre imagination, donc la portée de l'imagination est limitée. Imaginez une personne avec un palmé, permettant un. une personne qui vole au crépuscule et à l'aube, avec des insectes dans la bouche, ce qui n'aide pas ; une personne avec une très mauvaise vue perçoit le monde qui l'entoure grâce à un système de signaux sonores réfléchis à haute fréquence ; grenier toute la journée.
« Pour autant que je puisse l'imaginer (ce qui n'est pas très loin), cela me dit seulement ce que ce serait d'agir comme une chauve-souris. Mais ce n'est pas le problème. Je me demande ce que ça fait pour une chauve-souris d'être une chauve-souris. Cependant, si j’essayais d’imaginer cela, je serais limité aux ressources de mon propre esprit, qui sont insuffisantes pour cette tâche. Je ne peux pas y parvenir en imaginant des ajouts à mon expérience actuelle, ou en imaginant des fragments qui en sont progressivement soustraits, ou en imaginant une combinaison d'ajouts, de soustractions et de modifications. «
Les réseaux de neurones artificiels sont bien plus étrangers et inaccessibles à nous, les humains, que les chauves-souris, qui sont au moins des mammifères et des formes de vie à base de carbone.
Encore une fois, c'est l'erreur fondamentale que font trop de commentateurs sur ce sujet (souvent même pas prise en compte). est l'hypothèse que nous pouvons simplement mapper nos attentes en matière de perception ou d'intelligence humaine à l'intelligence artificielle
Nous ne pouvons pas du tout déterminer directement ou directement ou même penser à l'expérience inhérente à l'intelligence artificielle
Donc. Comment aborder le sujet de la perception de l'IA de manière productive ?
On peut souvent s'inspirer du test de Turing, proposé pour la première fois par Alan Turing en 1950. Critiqué ou incompris, et certainement imparfait, il a résisté à l'épreuve du temps comme un point de référence dans le domaine de l'IA car il capture certaines informations fondamentales sur la nature de l'intelligence artificielle que nous reconnaissons et acceptons. Il n'y a jamais d'accès direct à la réalité de l'expérience interne d'une IA. Le principe est que si nous le voulons. pour mesurer l'intelligence d'une IA, notre seule option est d'observer son comportement, puis de tirer les conclusions appropriées (pour être clair, figure. L'accent est mis sur l'évaluation de la capacité d'une machine à penser, pas nécessairement de sa capacité à ressentir ; cependant, pour nos besoins, ce qui est pertinent, ce sont les principes sous-jacents. Douglas Hofstadter a formulé cette idée de manière particulièrement éloquente : « Comment savez-vous que quelque chose qui ressemble à ce que vous appelez « penser » se passe en moi lorsque je vous parle ? Le test de Turing est une sonde étonnante, comparable à un accélérateur de particules en physique. Tout comme en physique, lorsque vous voulez comprendre ce qui se passe au niveau atomique ou subatomique, puisque vous ne pouvez pas le voir directement, vous dispersez les particules accélérées loin des cibles pertinentes et observez leur comportement. De cela, vous pouvez déduire les propriétés internes de la cible. Le test de Turing étend cette idée à l'esprit. Il traite les idées comme des « objets » qui ne sont pas directement visibles mais dont la structure peut être déduite de manière plus abstraite. En « distrayant » le problème de l’esprit de la cible, vous pouvez comprendre son fonctionnement interne, tout comme en physique. «
Pour progresser dans le débat sur la perception de l'intelligence artificielle, nous devons nous orienter vers des représentations observables en tant que proxy de l'expérience interne ; sinon, nous tournerons en rond dans des débats lâches, vides et sans issue
Erik Brynjolfsson. est convaincu que l'IA d'aujourd'hui n'est pas sensible, mais ses commentaires indiquent qu'il pense que l'IA finira par être sensible. Comment saura-t-il que ?
Dans le débat sur l'IA, les sceptiques décrivent souvent la technologie en termes simplifiés qui minimisent ses capacités.
Comme l’a dit un chercheur en IA en réponse à l’actualité de Blake Lemoine : « Il est mystérieux d’espérer acquérir une conscience, une compréhension ou du bon sens grâce au traitement symbolique et aux données utilisant des fonctions paramétriques de dimension supérieure. » Dans un article récent Dans un article de blog. , Gary Marcus a fait valoir que les modèles d'IA d'aujourd'hui ne sont même pas « intelligents sur le plan télépathique » car « tout ce qu'ils font, c'est faire correspondre des modèles et extraire des données d'énormes bases de données statistiques ». Il estime que le modèle de langage à grande échelle de Google, LaMDA, n'est qu'une « feuille de calcul de texte ».
Ce raisonnement est trompeur et trivial. Après tout, si nous le souhaitons, nous pouvons construire l’intelligence humaine d’une manière tout aussi simplifiée : notre cerveau n’est « qu’ » un vaste ensemble de neurones interconnectés de manière spécifique, « juste » un ensemble de réactions chimiques de base au sein de notre crâne.
Mais cela passe à côté de l’essentiel. Le pouvoir et la magie de l’intelligence humaine ne résident pas dans des mécanismes spécifiques mais dans l’incroyable capacité à émerger d’une manière ou d’une autre. Des fonctions de base simples peuvent produire des systèmes profondément intellectuels.
En fin de compte, nous devons juger l’IA en fonction de ses capacités.
Si l'on compare l'état de l'IA il y a cinq ans à l'état de la technologie aujourd'hui, il ne fait aucun doute que ses capacités et sa profondeur se sont développées de manière significative (et toujours de plus en plus rapide) grâce à des avancées dans des domaines tels que l'apprentissage auto-supervisé, Transformateurs et apprentissage par renforcement.
L'intelligence artificielle n'est pas comme l'intelligence humaine. Quand et si une IA devient sensible – quand et si jamais elle devient, selon la formulation de Nagel, « comme quelque chose » – elle sera incomparable à ce que signifie être humain. L’intelligence artificielle est une forme de cognition unique, peu familière, fascinante et en évolution rapide.
Ce qui compte, c'est ce que l'intelligence artificielle peut réaliser. Des percées dans la science fondamentale comme AlphaFold, la réponse à des défis au niveau des espèces comme le changement climatique, la promotion de la santé et de la longévité humaines et l’approfondissement de notre compréhension du fonctionnement de l’univers : ces résultats sont un véritable test de la puissance et de la complexité de l’IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!