Maison >Périphériques technologiques >IA >OpenAI recherche des partenaires pour générer des ensembles de données pour former des modèles d'IA
Ce site a rapporté le 10 novembre qu'OpenAI a annoncé qu'il coopérerait avec des organisations pour générer des ensembles de données publiques/privées pour former des modèles d'IA. Le partenariat de données vise à « permettre à davantage d'organisations de contribuer à guider l'avenir de l'IA ». et « bénéficier de modèles plus utiles ».
Ce site a appris d'un blog qu'OpenAI a déclaré : « Pour finalement rendre l'IA plus sûre et bénéficier à toute l'humanité, nous espérons que les modèles d'IA pourront comprendre en profondeur tous les sujets, industries, cultures et langues, ce qui nécessite la plus large gamme possible de données de formation. ."
Dans le cadre du programme de partenariat de données, OpenAI affirme qu'elle collectera des ensembles de données « à grande échelle » qui « reflètent la société humaine » et qui ne sont actuellement pas facilement accessibles en ligne. Alors que l'entreprise prévoit de travailler sur plusieurs modalités, notamment les images, l'audio et la vidéo, elle recherche spécifiquement des données qui « expriment l'intention humaine » (telles que l'écriture longue ou la conversation) dans différentes langues, sujets et formats.
OpenAI affirme qu'il travaillera avec les organisations, en utilisant une combinaison d'outils de reconnaissance optique de caractères et de reconnaissance vocale automatique, pour numériser les données de formation et supprimer les informations sensibles ou personnelles si nécessaire.
OpenAI espère créer deux types d'ensembles de données : un ensemble de données public open source qui peut être utilisé par n'importe qui pour former des modèles d'IA, et un ensemble d'ensembles de données privés qui peuvent être utilisés pour former des modèles d'IA propriétaires.
OpenAI indique que l'ensemble privé est destiné aux organisations qui souhaitent garder leurs données privées mais qui souhaitent que les modèles d'OpenAI comprennent mieux leur domaine. Jusqu'à présent, OpenAI a travaillé avec le gouvernement islandais et Miðeind ehf pour améliorer les capacités de GPT-4 pour les locuteurs islandais. et travaille avec le Liberty Legal Project pour améliorer la compréhension de son modèle des documents juridiques.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!