Maison >Périphériques technologiques >IA >GPT-4o apporte GPT-4 à tout le monde, et voici comment cela fonctionne
Alors, qu’est-ce que GPT-4o ?
GPT-4o est le nouveau modèle d'IA du développeur ChatGPT OpenAI, révélé lors de son événement « Spring Update » début mai 2024. Il coexistera avec son précédent modèle le plus performant, GPT-4 Turbo, du moins pour le moment, et apportera un grand nombre de mises à jour à l'outil.
Contrairement à ses prédécesseurs, GPT-4o est entièrement multimodal dès son lancement (le « o » dans le nom du modèle signifie « omnimodal »). L'événement Spring Update d'OpenAI a présenté GPT-4o discutant couramment avec les hôtes de l'événement, coupant et changeant entre les interactions, mettant en valeur la « personnalité » et illustrant comment il pourrait devenir l'assistant virtuel dont les utilisateurs ont rêvé.
Il peut accepter des combinaisons d'audio, de texte, d'image et de vidéo comme entrées et sorties dans du texte, de l'audio et de l'image (pas encore de support vidéo, mais attendez-vous à ce que cela change une fois l'outil de conversion texte-vidéo Sora d'OpenAI lancé, au moins , c'est ce qui, je suppose, va se produire).
En termes de chiffres bruts fournis par OpenAI, GPT-4o surpasse tous ses modèles précédents, ainsi que ses concurrents les plus proches, tels que Claude 3 Opus, Gemini Pro 1.5 et Ultra 1.0, et Llama 3 400B.
Maintenant, les chiffres, c'est très bien, mais qu'est-ce que cela se traduit concrètement ? Eh bien, encore une fois, en fonction des chiffres d'OpenAI, GPT-4o « correspond aux performances de GPT-4 Turbo » pour l'écriture et le codage en anglais, est nettement plus rapide dans les « langues non anglaises » et, plus important encore, est plus rapide et moins cher en termes d'API. utiliser.
Je travaille dans le domaine de la technologie depuis longtemps et j'ai vu beaucoup de nouveaux « changeurs de jeu » brillants aller et venir. Mais le discours conversationnel de GPT-4o est vraiment brillant. GPT-4o peut avoir des conversations appropriées avec vous, vous permettant même d'interrompre, de changer l'orientation de la conversation, de changer de sujet, etc., presque sans sauter un battement.
Sa capacité à converser rapidement lui confère de nombreuses nouvelles applications. Même si ChatGPT disposait déjà d'une fonction vocale, celle-ci était limitée car il devait d'abord rédiger une réponse qui pouvait ensuite vous être adressée. Vous pouvez également interagir avec ChatGPT en utilisant votre voix, mais le traitement de votre demande prendrait du temps.
Désormais, la voix en temps réel de GPT-4o est presque transparente. De plus, il peut exprimer des émotions et des styles spécifiques, ce qui était encore impossible avant cette mise à jour.
Ceci s'applique également à la traduction en direct, dans laquelle GPT-4o a montré une énorme amélioration. Maintenant, je ne connais pas bien aucune autre langue, mais la traduction en direct de l'anglais vers l'italien et inversement a été bien accueillie ; tout ce qui facilite la communication lorsque vous êtes à l'étranger sera une énorme aubaine, surtout compte tenu de la rapidité de la traduction.
J'étais au Maroc récemment, et même avec Google Translate qui aide à donner un sens à l'arabe, le contexte complet de la traduction n'est jamais complètement exact. La traduction en direct de GPT-4o aurait été incroyablement utile !
GPT-4o apporte également des améliorations significatives à l'interprétation et à l'assistance du code grâce à ses capacités multimodales. Semblable aux autres outils, ChatGPT pourrait déjà fonctionner avec certaines données, mais son nouveau modèle accélère considérablement cela.
La capacité de déboguer du code en utilisant uniquement votre voix est remarquable. Cependant, son utilisation réelle ne deviendra claire que lorsque les programmeurs et développeurs réels commenceront à utiliser l'outil. Bien que les capacités de codage de ChatGPT soient utiles, elles ne sont aussi utiles que les connaissances de l'utilisateur, comme la plupart des outils d'IA générative.
GPT-4o a été lancé immédiatement pour les abonnés ChatGPT Plus payant les frais mensuels de 20 $. Mais, dans un autre moment énorme pour l’IA générative, OpenAI a révélé que GPT-4o serait lancé pour tous les utilisateurs, y compris les utilisateurs gratuits, en temps voulu.
Il n'y a pas de date précise pour que GPT-4o arrive sur les comptes gratuits ChatGPT, mais étant donné la vitesse des autres déploiements, cela ne devrait pas prendre trop de temps.
D'autres aspects du nouveau modèle ne sont pas non plus disponibles. Par exemple, je voulais faire un court extrait de la nouvelle fonctionnalité vocale en direct pour cet article, mais la fonctionnalité n'a pas encore été lancée (je suis un abonné de longue date à ChatGPT Plus), et elle n'a pas non plus trouvé son chemin vers celui d'un collègue. comptes.
GPT-4o apportera également une version de bureau ChatGPT tant attendue, à commencer par macOS, mais encore une fois, elle n'a pas encore été lancée.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!