Maison >Périphériques technologiques >IA >Le département américain du Commerce sollicite publiquement des commentaires et des suggestions sur la préparation des données GenAI
Les données sont au cœur de l'intelligence artificielle. Sans données fiables, les chances de développer des modèles d’IA utiles sont minces. Dans cet esprit, le département américain du Commerce a publié la semaine dernière une demande publique de commentaires sur la manière de mieux préparer de nombreux ensembles de données publiques pour la création de modèles d'intelligence artificielle de production (GenAI). Cette demande publique répond à un problème critique auquel est actuellement confronté le domaine de l’intelligence artificielle : le manque d’ensembles de données publiques diversifiés et de haute qualité. Ces ensembles de données sont essentiels pour former des modèles d’apprentissage automatique, favoriser l’innovation et piloter le développement d’applications d’IA. Grâce à cette demande publique, le Ministère espère recueillir les commentaires de toutes les parties pour mieux comprendre comment créer et gérer des ensembles de données publiques. Ils veulent entendre
Le ministère américain du Commerce a publié une demande d'informations (RFI) le 17 avril demandant « aux experts de l'industrie, aux chercheurs, aux organisations de la société civile et à d'autres membres du public » de fournir leur avis sur la manière de développer « a permis à l'intelligence artificielle "Smart Open Datasets" d'aider.
Le ministère du Commerce s'appelle « U.S. Data Agency » et est responsable de la collecte, du stockage et de l'analyse d'une variété de données sur les États-Unis, notamment des données sur l'économie, la population et l'environnement. Une recherche rapide dans les centres de données commerciaux révèle plus de 122 000 ensembles de données accessibles au public sur des sujets allant du climat et de la météo aux brevets en passant par les informations de recensement.
Cette section est conçue pour aider à maintenir ses activités de gestion et de partage de données aux normes technologiques actuelles à mesure que la technologie évolue et s'améliore au fil des ans. L'accès aux données par voie électronique via des formats lisibles par machine ou via des services Web et des API sont des exemples d'adaptation de ses services de données à l'époque.
Maintenant, avec l'arrivée de la révolution GenAI, le secteur recherche la localisation la plus adaptée des données afin de les utiliser pour construire des modèles d'intelligence artificielle.
Oliver Wise, directeur des données du département américain du Commerce, a écrit dans la demande d'informations : « Aujourd'hui, avec l'émergence de la technologie de l'intelligence artificielle, le ministère du Commerce est confronté à un nouveau changement technologique, qui fournit aux utilisateurs de meilleures informations. et l'accès aux données. « Les entreprises sont particulièrement intéressées par les applications d'intelligence artificielle générative (GenAI), qui peuvent digérer du texte, des images, de l'audio, de la vidéo et d'autres types d'informations provenant de différentes sources pour produire de nouvelles technologies GenAI et autres contenus artificiels qui offrent des opportunités et des opportunités. les défis auxquels sont confrontés les fournisseurs de données tels que les entreprises et les utilisateurs de données, notamment les entités gouvernementales, l'industrie, le monde universitaire et le peuple américain. "Les systèmes d'IA récents sont formés sur de grandes quantités de contenu numérique et génèrent des réponses basées sur le contexte du contenu." "Cependant, ces systèmes ne "comprennent" pas vraiment le texte de manière significative.
Les futurs systèmes d'IA doivent le faire." capable d’accéder à des données qui sont non seulement lisibles par machine, mais également « compréhensibles par machine ». Les systèmes d’IA d’aujourd’hui sont limités par leur dépendance à d’énormes magasins de données non structurées qui s’appuient sur les données sous-jacentes plutôt que sur la capacité de raisonner et de juger sur la base de leur compréhension.
Le ministère du Commerce recherche de l'aide pour partager des données en tenant compte de ces limitations fondamentales de la technologie GenAI. Il recherche de nouvelles normes de diffusion de données, y compris des normes de licence, pour des données lisibles et compréhensibles. En termes d'accessibilité et de récupération des données, le Ministère souhaite obtenir des suggestions sur la façon de rendre ses données plus accessibles, par exemple au moyen d'API ou de « robots d'exploration Web ».
Il existe un besoin particulier dans la manière d'utiliser des graphiques de connaissances qui exploitent les métadonnées pour mieux connecter les termes humains aux données. Il espère également obtenir des orientations sur l'adoption d'ontologies standards telles que Schema.org ou NIEM, et sur la manière dont les graphes de connaissances peuvent aider à « harmoniser et relier » les ontologies et les vocabulaires.
Le Département sollicite l'avis de la communauté sur la manière de faire progresser ces efforts de normalisation des données tout en maintenant les normes les plus élevées d'intégrité, de qualité, de sécurité et d'éthique des données.
Wise demande aux parties intéressées d'envoyer leurs propositions par e-mail avec pour objet « Formulaire de demande d'informations sur les actifs de données ouvertes prêts pour l'IA ». Nous espérons recevoir des commentaires ou des retours sur ces questions avant le 16 juillet.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!