Maison > Article > Périphériques technologiques > La qualité du système de traduction de texte IA s'est améliorée de 44 %, utilisant plus de 50 milliards de paramètres pour traduire 200 langues
Meta Platforms a ouvert aujourd'hui le code système de NLLB-200, un système d'intelligence artificielle développé en interne par Meta qui peut traduire du texte dans 200 langues.
Meta a également annoncé un ensemble d'outils conçus pour aider les chercheurs à appliquer plus facilement le NLLB-200 aux projets logiciels.
Selon Meta, bon nombre des 200 langues que NLLB-200 peut comprendre ne sont pas bien prises en charge par d'autres systèmes de traduction d'IA. Alors que les outils de traduction actuellement largement utilisés prennent en charge moins de 25 langues africaines, le NLLB-200 prend en charge jusqu'à 55 langues africaines.
Meta indique que la précision de la traduction est un autre domaine dans lequel NLLB-200 surpasse les autres outils. Meta utilise la norme de précision du système d'évaluation BLEU, un algorithme utilisé pour mesurer la qualité du texte traduit automatiquement. Selon Meta, le score BLEU du NLLB-200 est en moyenne 44 % plus élevé qu’auparavant.
Le PDG de Meta, Mark Zuckerberg, a déclaré : « Nous venons d'ouvrir un modèle d'IA développé en interne qui peut traduire 200 langues différentes – dont beaucoup ne sont pas prises en charge par les systèmes de traduction actuels. Nous appelons ce projet For No Language Left Behind, le La technologie de modélisation de l'intelligence artificielle que nous utilisons produit des traductions de haute qualité pour des langues parlées par des milliards de personnes dans le monde. »
NLLB-200 possède plus de 50 milliards de paramètres, et ces configurations déterminent le système d'IA. les données sont traitées. Plus un système d’IA possède de paramètres, plus sa précision sera élevée.
Le fait que le NLLB-200 dispose d'un si grand nombre de paramètres n'est pas le seul facteur dans sa capacité à prendre en charge 200 langues avec une grande précision, car le système NLLB-200 s'appuie également sur de nombreuses autres innovations en matière d'IA développées par Meta. ingénieurs.
Meta fournit un support pour la recherche liée à l'apprentissage automatique à l'aide de la boîte à outils LASER développée en interne. Grâce à cette boîte à outils, les chercheurs peuvent entraîner un réseau neuronal à effectuer une tâche spécifique dans une langue, puis adapter relativement facilement le réseau neuronal à d'autres langues, ce qui serait utile à des fins de traduction. Meta a développé un nouveau système NLLB-200 qui prend en charge une version améliorée de LASER - LASER3.
La version originale de LASER comprenait un réseau neuronal appelé LSTM, un composant spécialisé qui convertit le texte en une représentation mathématique que le système d'IA peut comprendre. Cette représentation mathématique permet de produire des traductions plus précises. Dans LASER3, Meta remplace le réseau neuronal LSTM par Transformer, un modèle avancé de traitement du langage naturel qui peut effectuer la même tâche plus efficacement.
Meta a également utilisé plusieurs autres méthodes pour améliorer les capacités du NLLB-200, telles que la mise à niveau Meta du système utilisé pour collecter les données de formation et la modification du flux de travail de formation de l'IA.
Meta utilise le supercalculateur Research SuperCluster développé en interne (photo) pour entraîner le NLLB-200. Lorsque Meta a introduit Research SuperCluster pour la première fois en janvier de cette année, il a déclaré que le système était équipé de 6 080 GPU de centre de données A100 de Nvidia et qu'il serait éventuellement mis à niveau vers 16 000 GPU.
Meta prévoit d'utiliser NLLB-200 pour fournir de meilleures capacités de traduction automatique sur Facebook, Instagram et d'autres plateformes, et le système devrait prendre en charge plus de 25 milliards de traductions par jour.
Alors que Meta travaille dur pour promouvoir NLLB-200 en interne, elle prévoit également d'aider d'autres entreprises à appliquer le système à leurs propres projets logiciels.
En plus de NLLB-200, Meta dispose d'un code open source qui peut être utilisé pour entraîner l'IA, ainsi que d'un ensemble de données appelé FLORES-200 pour évaluer l'exactitude de la traduction. Meta fournira jusqu'à 200 000 $ de financement pour aider les organisations à but non lucratif à adopter le NLLB-200. En outre, Meta coopérera également avec la Fondation Wikimedia pour appliquer la technologie de traduction automatique aux articles Wikipédia.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!