Maison >Périphériques technologiques >IA >La confidentialité des détails techniques de GPT-4 a suscité une controverse et le scientifique en chef d'OpenAI a répondu
Tôt hier matin, OpenAI a publié de manière inattendue GPT-4.
Cette annonce a été une surprise pour la communauté technologique. Après tout, on s'attendait généralement à ce que GPT-4 soit annoncé jeudi lors de l'événement « L'avenir du travail avec l'IA » de Microsoft.
Quatre mois seulement après le lancement de ChatGPT, elle a établi le record de « l'application grand public à la croissance la plus rapide de l'histoire ». Maintenant que GPT-4 est en ligne, les capacités de réponse du produit ont atteint un nouveau niveau.
Après avoir été choqués, de nombreux chercheurs ont lu attentivement le rapport technique de GPT-4, mais se sont sentis déçus : pourquoi n'y a-t-il pas de détails techniques ?
Dans l'annonce, OpenAI a partagé un grand nombre de benchmarks et de résultats de tests GPT-4 ainsi que quelques démonstrations intéressantes, mais a fourni peu d'informations sur les données utilisées pour entraîner le système. , le coût de la puissance de calcul ou l'utilisation. Informations sur le matériel ou les méthodes utilisées pour créer GPT-4.
Par exemple, la conclusion d'un article qui permet de gagner du temps en lisant GPT-4 est : "Nous utilisons Python." -4 est basé sur l'architecture Transformer. pour reproduire son travail.
La plupart des premières réactions au modèle fermé de GPT-4 ont été négatives, mais il semble que la colère ne puisse plus changer sa décision d'être « source fermée » :
En fait, les critiques d'OpenAI pour le fait de ne pas être open source dure depuis un certain temps. Même Musk, membre de l'équipe fondatrice d'OpenAI, a publiquement remis en question son "écart par rapport à l'intention initiale" :
Musk est toujours confus par cette affaire : "Je ne comprends pas. J'ai investi près de 100 millions au début. Comment une organisation à but non lucratif en dollars américains est-elle devenue une entreprise commerciale d'une valeur marchande de 30 milliards "
Ben Schmidt, vice-président de la conception de l'information de Nomic AI ? Je pense que nous pouvons arrêter de l'appeler "Open" - — Le document de 98 pages présentant GPT-4 déclare fièrement qu'ils n'ont divulgué aucune information sur le contenu de l'ensemble de formation. Certaines personnes pensent que c'est une autre raison pour laquelle OpenAI cache les détails de. GPT-4 est une responsabilité légale. Les modèles de langage d'IA sont formés sur d'énormes ensembles de données textuelles, et de nombreux modèles (y compris le premier système GPT) récupèrent des informations sur le Web, dont l'une des sources peut inclure du matériel protégé par le droit d'auteur. Plusieurs sociétés sont actuellement poursuivies en justice par des artistes indépendants et le site photo Getty Images.
Plus important encore, disent certains, cela rendra plus difficile le développement de mesures de protection contre les menaces posées par GPT-4. Ben Schmidt estime également que sans pouvoir voir les données sur lesquelles GPT-4 a été formé, il est difficile de savoir où le système peut être utilisé en toute sécurité et de proposer des correctifs.
"Il est bien connu que les réseaux de neurones comme GPT-4 sont des boîtes noires. Le fait que leur fonctionnement soit imprévisible et difficile à comprendre est l'une des questions les plus importantes quant à savoir si et où ils doivent être utilisés. Aujourd'hui, OpenAI se développe progressivement une norme qui élargit encore ce mystère", a déclaré Ben Schmidt.
Ilya Sutskever, scientifique en chef et co-fondateur d'OpenAI, a répondu à la controverse ci-dessus, affirmant qu'OpenAI ne partage pas plus de GPT-4 détails La raison de l'information est « la peur de la concurrence et l'inquiétude pour la sécurité » :
« Du point de vue du paysage concurrentiel, la concurrence externe est très féroce. Le développement de GPT-4 n'est pas facile. Il a rassemblé presque toute la puissance d'OpenAI Après avoir déployé beaucoup d'efforts pour produire cette chose, de nombreuses entreprises veulent faire la même chose "
"Les raisons de sécurité ne sont pas aussi importantes que celles de la concurrence. côté, mais cela va aussi changer. Ces modèles sont très efficaces, et ils deviennent de plus en plus efficaces à un moment donné, il sera assez facile de faire d'énormes dégâts avec ces modèles si l'on le souhaite. plus puissants, il est logique de ne pas les exposer. À un moment donné, l'IA ou l'AGI deviendront extrêmement puissantes et incroyables, alors l'open source n'a plus de sens, et je crois sincèrement que dans quelques années, il sera clair pour tout le monde que l'IA open source n'est pas judicieuse. "
PDG de Lightning AI. , William Falcon, le créateur de l'outil open source PyTorch Lightning, a déclaré à VentureBeat qu'il pouvait comprendre cette décision d'un point de vue commercial : "En tant qu'entreprise, vous avez parfaitement le droit de le faire. "
Mais il a également déclaré que la décision d'OpenAI est davantage une communauté plus large qui définit un "mauvais modèle" qui peut avoir des effets néfastes.
Concernant la raison pour laquelle OpenAI ne partage pas ses données d'entraînement, l'explication de Sutskever est la suivante : « Mon point de vue à ce sujet est que les données d'entraînement sont de la technologie. La raison pour laquelle nous ne divulguons pas les données d'entraînement est presque la même que la raison. pourquoi nous ne divulguons pas le nombre de paramètres. Lorsqu'on lui a demandé si OpenAI pouvait clairement déclarer que ses données de formation ne contiennent pas de matériel contrefait, Sutskever n'a pas répondu.
Sutskever est d'accord avec les critiques d'OpenAI selon lesquelles les modèles open source facilitent le développement de garanties. "Si davantage de personnes étudient ces modèles, nous en saurons davantage, et ce sera encore mieux", a-t-il déclaré. Pour ces raisons, OpenAI permet à certains établissements universitaires et de recherche d'accéder à ses systèmes.
À quoi pouvons-nous nous attendre ensuite ?
Les discussions animées provoquées par GPT-4 devraient se poursuivre pendant un certain temps, de sorte que les gens pourraient ignorer certains autres développements.Par exemple, au milieu de la discussion intense d’hier, l’annonce de Google semblait calme. À l'heure actuelle, l'IA générative est entièrement intégrée à Google Workspace et des fonctions telles que la génération d'images, de présentations, d'e-mails, de documents, etc. ont été mises à jour. Comme vous pouvez l’imaginer, cela représentera une énorme amélioration de la productivité.
Ensuite, les gens peuvent s'attendre à beaucoup de choses : bientôt, le PDG de Microsoft, Satya Nadella, prononcera un discours en personne pour introduire davantage de coopération entre Microsoft et OpenAI, comme la suite Office basée sur GPT-4.
Source : https://www.theinformation.com/articles/microsoft-rations-access-to-ai-hardware-for-internal-teams
Attendons de voir .
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!