Maison  >  Article  >  Périphériques technologiques  >  Tant que le modèle et les échantillons sont suffisamment grands, l’IA peut devenir plus intelligente !

Tant que le modèle et les échantillons sont suffisamment grands, l’IA peut devenir plus intelligente !

王林
王林avant
2023-04-29 15:25:061434parcourir

​Il n'y a aucune différence de mécanisme mathématique entre le modèle d'IA et le cerveau humain.

Tant que le modèle est suffisamment grand et que les échantillons sont suffisamment grands, l'IA peut devenir plus intelligente ! L’émergence du

chatGPT l’a effectivement prouvé.

1. Les détails sous-jacents de l'IA et du cerveau humain sont basés sur des instructions if else

opérations logiques, qui sont les opérations de base qui produisent l'intelligence.

La logique de base du langage de programmation est if else, qui divise le code en deux branches basées sur des expressions conditionnelles.

Sur cette base, les programmeurs peuvent écrire des codes très complexes et mettre en œuvre diverses logiques métier.

La logique de base du cerveau humain est aussi if else. Les deux mots if else viennent de l'anglais, et le vocabulaire chinois correspondant est if...else...

#🎜🎜 #cerveau humain C'est le même raisonnement logique lorsque l'on réfléchit à des problèmes. Ce n'est pas différent des ordinateurs à cet égard.

Tant que le modèle et les échantillons sont suffisamment grands, l’IA peut devenir plus intelligente !

if else, le cœur de la logique

L'« instruction if else » du modèle d'IA est la fonction d'activation!

Nœud de calcul du modèle de l'IA, on peut aussi l'appeler un « neurone ».

Il a un vecteur d'entrée X, une matrice de poids W, un vecteur de biais b et une fonction d'activation.

La fonction d'activation est en fait une instruction if else, et l'opération linéaire WX + b est une expression conditionnelle.

Après activation, le code du modèle AI équivaut à s'exécuter dans la branche if, et lorsqu'il n'est pas activé, il équivaut à s'exécuter dans la branche else.

Les différents états d'activation des réseaux neuronaux multicouches sont en fait des codages binaires d'échantillons d'informations.

Tant que le modèle et les échantillons sont suffisamment grands, l’IA peut devenir plus intelligente !

Le deep learning est également un codage binaire d'informations d'échantillon

L'encodage d'informations d'échantillon par le modèle d'IA est dynamique et parallèle, plutôt que d'être statique et série comme le code CPU, mais leur fondement sous-jacent est if else.

Ce n'est pas difficile à mettre en œuvre sinon au niveau du circuit Il peut être mis en œuvre avec une triode.

2. Le cerveau humain est plus intelligent que les ordinateurs car les humains obtiennent plus d'informations

Le cerveau humain acquiert des informations du monde extérieur à chaque instant tout en mettant à jour son propre « échantillon ». base de données", le code du programme ne peut pas se mettre à jour tout seul. C'est pourquoi de nombreuses personnes peuvent le faire, mais pas les ordinateurs.

Le code du cerveau humain est vivant, mais le code de l'ordinateur est mort.

Bien sûr, le "code mort" ne peut pas être plus intelligent que le "code live", car le "code live" peut trouver activement les bugs du "code mort".

Selon la continuité des nombres réels, tant que les informations codées par "code mort" sont dénombrables, alors elles auront toujours des points de bug qui ne peuvent pas être codés.

Cela peut être mathématiquement supporté par le troisième set de Cantor.

Peu importe le nombre de chiffres décimaux ternaires que nous utilisons pour encoder des nombres réels dans l'intervalle [0, 1], il y a toujours au moins un point qui ne peut pas être encodé.

Ainsi, lorsque deux personnes se disputent, elles peuvent toujours trouver des points sur lesquels discuter

Mais une fois le code informatique écrit, il ne peut pas être activement mis à jour, donc les programmeurs peuvent réfléchir. de différentes manières de tromper le processeur.

Par exemple, le processeur d'Intel nécessitait à l'origine de changer de porte de tâche lors du changement de processus, mais Linux a trouvé un moyen de changer uniquement le répertoire de pages et le registre RSP

dans Il semble que le processeur Intel que le système Linux exécute le même processus, mais en fait ce n'est pas le cas. C'est ce qu'on appelle la commutation logicielle de processus.

Ainsi, tant que le circuit du CPU est fixe, les informations codées par le CPU sont également fixes.

Les informations codées par le CPU sont fixes, puis les informations qu'il ne peut pas coder sont illimitées et peuvent être utilisées par les programmeurs.

La raison pour laquelle les programmeurs peuvent utiliser ces informations est que le cerveau du programmeur est vivant et peut mettre à jour dynamiquement les échantillons.

3, L'émergence du réseau de neurones a changé cette situation

Le réseau de neurones est vraiment une grande invention, il réalise une mise à jour dynamique des informations sur des circuits fixes.

Les informations que tous les programmes écrits peuvent traiter sont fixes, y compris les circuits CPU et les codes de divers systèmes.

Mais ce n'est pas le cas des réseaux de neurones. Bien que son code soit écrit, il suffit de mettre à jour les données de poids pour changer le contexte logique du modèle.

En fait, tant que de nouveaux échantillons sont saisis en permanence, le modèle d'IA peut mettre à jour en permanence les données de poids à l'aide de l'algorithme BP (algorithme de descente de gradient) pour s'adapter aux nouveaux scénarios commerciaux.

La mise à jour du modèle d'IA ne nécessite pas de modifier le code, mais nécessite uniquement de modifier les données, de sorte que le même modèle CNN peut reconnaître différents objets s'il est entraîné avec différents échantillons.

Dans ce processus, le code du framework Tensorflow et la structure du réseau du modèle d'IA restent inchangés. Ce qui change, ce sont les données de poids de chaque nœud.

Théoriquement, tant qu'un modèle d'IA peut explorer les données à travers le réseau, il peut devenir plus intelligent.

Est-ce fondamentalement différent des gens qui regardent des choses via un navigateur (devenant ainsi plus intelligents) ? Il semble que non.

4. Tant que le modèle est suffisamment grand et que les échantillons sont suffisamment grands, ChatGPT peut peut-être vraiment défier le cerveau humain

Le cerveau humain possède 15 milliards de neurones, et les yeux et les oreilles humains lui fournissent de nouvelles données à chaque instant. Les modèles d’IA peuvent certainement le faire aussi.

Peut-être que par rapport à l'IA, l'avantage des humains est que la « chaîne industrielle » est plus courte

La naissance d'un bébé ne nécessite que ses parents, mais la naissance d'un modèle d'IA n'est évidemment pas quelque chose qu'un ou deux programmeurs peuvent faire .

La seule fabrication de GPU nécessite plus de dizaines de milliers de personnes.

Les programmes Cuda sur GPU ne sont pas difficiles à écrire, mais la chaîne industrielle de fabrication des GPU est trop longue, bien inférieure à la naissance et à la croissance des êtres humains.

C’est peut-être le véritable inconvénient de l’IA par rapport aux humains.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Cet article est reproduit dans:. en cas de violation, veuillez contacter admin@php.cn Supprimer