Maison >Périphériques technologiques >IA >Un moyen simple et objectif d'introduire de grands modèles pour éviter une surinterprétation

Un moyen simple et objectif d'introduire de grands modèles pour éviter une surinterprétation

王林
王林avant
2023-05-12 18:13:061034parcourir

1. Avant-propos

Cet article vise à fournir aux lecteurs sans formation en informatique des informations sur ChatGPT et ses systèmes d'intelligence artificielle similaires (tels que GPT-3, GPT-4, Bing Chat, Barde, etc.) fonctionne. ChatGPT est un chatbot construit sur un grand modèle de langage pour l'interaction conversationnelle. Ces termes peuvent être obscurs, je vais donc les expliquer. Dans le même temps, nous discuterons des concepts fondamentaux qui les sous-tendent, et cet article ne nécessite pas que le lecteur ait des connaissances techniques ou mathématiques de base. Nous ferons un usage intensif de métaphores pour expliquer des concepts liés afin de mieux les comprendre. Nous discuterons également des implications de ces techniques et de ce que nous devrions ou ne devrions pas nous attendre à pouvoir faire avec de grands modèles de langage comme ChatGPT.

Ensuite, nous partirons de la base "Qu'est-ce que l'intelligence artificielle" d'une manière qui n'utilise pas autant que possible de termes professionnels, et discuterons progressivement en profondeur des termes et concepts liés aux grands modèles de langage et ChatGPT, et utilisera des métaphores pour les expliquer. Dans le même temps, nous parlerons également de ce que signifient ces technologies et de ce que nous devrions ou ne devrions pas attendre d'elles qu'elles soient capables de faire.

2. Qu'est-ce que l'intelligence artificielle

Tout d'abord, commençons par quelques termes de base que vous entendrez peut-être souvent. Alors, qu’est-ce que l’intelligence artificielle ?

Intelligence artificielle : fait référence à une entité qui peut présenter un comportement similaire à ce que les humains considéreraient comme intelligent. L’utilisation du terme « intelligence » pour définir l’intelligence artificielle pose certains problèmes, car le terme « intelligence » lui-même n’a pas de définition claire. Cependant, cette définition reste pertinente. Cela signifie essentiellement que si nous voyons quelque chose créé par l’homme qui adopte des comportements intéressants, utiles et apparemment difficiles, alors nous pourrions dire qu’il est intelligent. Par exemple, dans les jeux informatiques, nous appelons souvent les personnages contrôlés par ordinateur « IA ». La plupart de ces rôles sont des programmes simples basés sur un code if-then-else (par exemple, "Si le joueur est à portée, tirez, sinon déplacez-vous vers la pierre la plus proche et cachez-vous"). Mais si les personnages peuvent nous garder engagés et divertis sans rien faire de manifestement stupide, alors nous pourrions penser qu'ils sont plus complexes qu'ils ne le sont en réalité.

Une fois que nous comprenons comment quelque chose fonctionne, nous ne pensons peut-être pas que c'est magique, mais nous nous attendons à quelque chose de plus complexe dans les coulisses. Tout dépend de notre connaissance de ce qui se passe dans les coulisses.

Le point important est que l'intelligence artificielle n'est pas magique. Parce que ce n’est pas magique, ça s’explique.

3. Qu'est-ce que l'apprentissage automatique

Un autre terme souvent associé à l'intelligence artificielle est l'apprentissage automatique.

Machine learning : Une méthode de création de comportement en collectant des données, en formant un modèle, puis en exécutant le modèle. Parfois, il est difficile de créer manuellement un ensemble d'instructions if-then-else pour capturer un phénomène complexe (comme le langage). Dans ce cas, nous essayons de trouver de grandes quantités de données et de les modéliser à l’aide d’algorithmes capables de trouver des modèles dans les données.

Alors c'est quoi un mannequin ? Un modèle est une version simplifiée d’un phénomène complexe. Par exemple, un modèle de voiture est une version plus petite et plus simple d’une vraie voiture qui partage de nombreuses propriétés de la vraie voiture, mais n’est bien sûr pas destinée à remplacer complètement la version originale. Les modèles réduits de voitures peuvent sembler réalistes et sont utiles pour expérimenter.

Un moyen simple et objectif dintroduire de grands modèles pour éviter une surinterprétation

Tout comme nous pouvons construire une voiture plus petite et plus simple, nous pouvons également construire un modèle plus petit et plus simple du langage humain. Nous utilisons le terme « grand modèle de langage » car ces modèles sont très volumineux du point de vue de la quantité de mémoire (mémoire vidéo) qu'ils doivent utiliser. Les plus grands modèles actuellement en production, tels que ChatGPT, GPT-3 et GPT-4, sont si volumineux qu'ils nécessitent pour leur création et leur exécution des superordinateurs exécutés sur les serveurs du centre de données.

4. Qu'est-ce qu'un réseau de neurones

Il existe de nombreuses façons d'apprendre un modèle grâce aux données, et les réseaux de neurones en font partie. La technologie est vaguement basée sur la structure du cerveau humain, qui consiste en une série de neurones interconnectés qui transmettent des signaux électriques entre eux, nous permettant d'accomplir diverses tâches. Le concept de base des réseaux de neurones a été inventé dans les années 1940, et le concept de base sur la façon de former les réseaux de neurones a été inventé dans les années 1980. À cette époque, les réseaux de neurones étaient très inefficaces. Il a fallu attendre les mises à niveau du matériel informatique vers 2017 pour que nous puissions le faire. Ils peuvent être utilisés à grande échelle.

Cependant, je préfère personnellement utiliser des métaphores de circuits pour simuler des réseaux de neurones. Grâce à la résistance, la circulation du courant dans les fils, nous pouvons simuler le fonctionnement des réseaux neuronaux.

Imaginez que nous voulions fabriquer une voiture autonome capable de rouler sur l'autoroute. Nous avons installé des capteurs de distance à l'avant, à l'arrière et sur les côtés de la voiture. Le capteur de distance signale une valeur de 1 lorsqu'un objet s'approche et une valeur de 0 lorsqu'il n'y a aucun objet détectable à proximité.

Nous avons également installé un robot pour faire fonctionner le volant, freiner et accélérer. Lorsque l'accélérateur reçoit une valeur de 1, il utilise l'accélération maximale, tandis qu'une valeur de 0 signifie aucune accélération. De même, une valeur de 1 envoyée au mécanisme de freinage signifie un freinage d'urgence, tandis que 0 signifie aucun freinage. Le mécanisme de direction accepte une valeur comprise entre -1 et +1, avec un nombre négatif indiquant un virage à gauche, un nombre positif indiquant un virage à droite et 0 indiquant une ligne droite.

Bien sûr, nous devons enregistrer les données de conduite. Lorsque la voie à suivre est libre, vous accélérez. Quand il y a une voiture devant vous, vous ralentissez. Lorsqu'une voiture s'approche trop près de la gauche, vous faites un écart vers la droite et changez de voie, en supposant bien sûr qu'il n'y a pas de voiture à droite. Ce processus est très complexe et nécessite différentes opérations (tourner à gauche ou à droite, accélérer ou décélérer, freiner) basées sur différentes combinaisons d'informations de capteur, chaque capteur doit donc être connecté à chaque mécanisme du robot.

Un moyen simple et objectif dintroduire de grands modèles pour éviter une surinterprétation

Que se passe-t-il lorsque vous conduisez sur la route ? Le courant électrique circule de tous les capteurs vers tous les actionneurs du robot, et le véhicule tourne à gauche, à droite, accélère et freine simultanément. Cela créera un désordre.

Un moyen simple et objectif dintroduire de grands modèles pour éviter une surinterprétation

Sortez les résistances et commencez à les placer dans différentes parties du circuit afin que le courant puisse circuler plus librement entre certains capteurs et certains bras robotiques. Par exemple, nous aimerions que le courant circule plus librement du capteur de proximité avant vers les freins plutôt que vers le mécanisme de direction. Nous avons également installé des éléments appelés portes qui empêcheraient le courant de circuler jusqu'à ce que suffisamment de charge s'accumule pour déclencher l'interrupteur (permettant au courant de circuler uniquement lorsque les capteurs de proximité avant et arrière signalaient un nombre élevé), ou permettaient au courant de circuler uniquement lorsque la puissance d'entrée Envoie de la puissance vers l'avant lorsque l'intensité est faible (envoie plus de puissance à l'accélérateur lorsque le capteur de proximité avant signale une valeur faible).

Mais où devons-nous placer ces résistances et ces portes ? Je ne sais pas non plus. Placez-les au hasard à différents endroits. Puis réessayez. Peut-être que la voiture roule mieux cette fois-ci, ce qui signifie qu'elle freine et dirige parfois lorsque les données indiquent qu'il est préférable de freiner et de diriger, etc., mais elle ne fait pas les choses correctement à chaque fois. Et il y a certaines choses qu'il fait pire (il accélère lorsque les données suggèrent qu'il doit parfois freiner). Nous avons donc continué à essayer au hasard différentes combinaisons de résistances et de portes. Finalement, nous tomberons sur une combinaison suffisamment bonne et nous déclarerons le succès. Par exemple, la combinaison suivante :

Un moyen simple et objectif dintroduire de grands modèles pour éviter une surinterprétation

(en fait, nous n'ajouterons ni ne supprimerons de portes, mais nous modifierons la porte pour qu'elle puisse être activée par le bas avec moins d'énergie, ou nécessiter que plus d'énergie soit émise par le bas , Ou libérer beaucoup d'énergie uniquement lorsqu'il y a très peu d'énergie en dessous. Les puristes de l'apprentissage automatique peuvent se sentir mal à l'aise avec cette description. Techniquement, cela se fait en ajustant le biais de la porte. Ce n'est généralement pas montré dans des diagrammes comme celui-ci, mais à partir d'un. Du point de vue de la métaphore du circuit, il peut être considéré comme un câble qui se branche directement sur l'alimentation et peut être modifié comme tous les autres câbles)

Un moyen simple et objectif dintroduire de grands modèles pour éviter une surinterprétation

Ce n'est pas bien d'essayer au hasard. Un algorithme appelé rétropropagation permet de deviner assez bien la modification des configurations de circuit. Les détails de l'algorithme n'ont pas d'importance, sachez simplement qu'il affine le circuit pour qu'il se comporte plus proche de ce que suggèrent les données, et après des milliers de réglages précis, vous pouvez éventuellement obtenir des résultats qui correspondent aux données.

Nous appelons paramètres de résistances et de portes car elles sont en fait partout, et l'algorithme de rétropropagation déclare que chaque résistance est plus forte ou plus faible. Par conséquent, si nous connaissons le tracé et les valeurs des paramètres du circuit, l’ensemble du circuit peut être reproduit sur d’autres voitures.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer