Maison > Article > Périphériques technologiques > La lassitude envers l’IA peut-elle être résolue grâce à la gouvernance des données ?
Cela constitue depuis longtemps un objectif central de l'industrie des données.
La gouvernance des données regroupe toutes les mesures visant à garantir que les données sont sécurisées, privées, exactes, disponibles et fiables, y compris l'élaboration de normes internes et de politiques de données pour réglementer la collecte, le stockage, le traitement et l'élimination des données. Ce processus est essentiel pour protéger la confidentialité des utilisateurs et maintenir l’intégrité des données.
Comme le souligne cette définition, la gouvernance des données consiste à gérer les données, plus précisément le moteur qui pilote les modèles d'IA.
Bien que le lien entre la gouvernance des données et l'IA soit initialement apparent, le lier à la lassitude de l'IA en mettant l'accent sur les causes de la fatigue garantit une utilisation cohérente du terme tout au long de l'article.
La fatigue de l'IA peut survenir en raison de revers et de défis rencontrés par une entreprise, un développeur ou une équipe, entraînant une mise en œuvre ou une réalisation de valeur entravée des systèmes d'IA.
La principale raison de la sur-médiatisation de l’IA réside dans les attentes irréalistes quant à ses capacités. Les parties prenantes doivent être alignées sur les capacités, les possibilités, les limites et les risques de l’IA pour évaluer correctement sa valeur et ses applications.
En matière de risque, l’éthique est souvent considérée comme une réflexion secondaire, conduisant à l’abandon des initiatives d’IA non conformes.
Vous devez vous interroger sur le rôle de la gouvernance des données dans la lassitude de l’IA – c’est la prémisse de cet article.
C’est là que nous allons ensuite.
La fatigue de l’IA peut être grossièrement divisée en pré-déploiement et post-déploiement. Concentrons-nous d'abord sur le travail préalable au déploiement.
De nombreux facteurs entrent en jeu dans la mise à niveau d'une preuve de concept (PoC) vers le déploiement, tels que :
Une fois que nous avons évalué Pour déterminer quel problème peut être le mieux résolu à l'aide des algorithmes ML, l'équipe de science des données effectue une analyse exploratoire des données. De nombreux modèles de données sous-jacents sont révélés à ce stade, soulignant si une donnée donnée contient des signaux riches. Cela aide également à créer des fonctionnalités techniques pour accélérer le processus d'apprentissage de l'algorithme.
Ensuite, l'équipe construit le premier modèle de base et constate souvent que ses performances ne sont pas à un niveau acceptable. Un modèle dont le résultat est aussi bon que lancer une pièce de monnaie n'ajoute aucune valeur, ce qui est l'un des premiers revers et leçons apprises lors de la création de modèles ML.
Les entreprises peuvent passer d'un problème commercial à un autre, entraînant de la fatigue. Néanmoins, si les données sous-jacentes ne véhiculent pas un signal riche, aucun algorithme d’IA ne peut être construit dessus et le modèle doit apprendre des associations statistiques à partir des données d’entraînement pour les généraliser à des données invisibles.
Bien que le modèle entraîné montre des résultats prometteurs sur l'ensemble de validation, cela peut toujours se produire si le modèle ne fonctionne pas correctement dans l'environnement de production sur la base de critères commerciaux qualifiés, tels qu'une fatigue de précision de 70 %.
Ce type de fatigue de l'IA est appelé la phase post-déploiement.
D'innombrables raisons peuvent entraîner une dégradation des performances, et la mauvaise qualité des données est le problème le plus courant affectant le modèle, ce qui limite la capacité du modèle à prédire avec précision les réponses cibles en l'absence d'attributs clés.
Considérez que l'une des fonctionnalités essentielles qui manquait dans seulement 10 % des données de formation devient désormais nulle 50 % du temps dans les données de production, ce qui entraîne de telles itérations et efforts pour garantir que le modèle fonctionne de manière cohérente. épuisent les data scientists et les équipes commerciales, érodant la confiance dans le pipeline de données et mettant en danger les investissements dans les projets.
Des mesures robustes de gouvernance des données sont essentielles pour répondre aux deux types de lassitude envers l'IA. Étant donné que les données sont au cœur des modèles de ML, des données riches en signaux, sans erreurs et de haute qualité sont nécessaires au succès des projets de ML. Lutter contre la lassitude envers l’IA nécessite de se concentrer fortement sur la gouvernance des données. Par conséquent, nous devons travailler rigoureusement pour garantir la bonne qualité des données, en jetant les bases de la création de modèles de pointe et en fournissant des informations commerciales fiables.
La qualité des données est la clé d'une gouvernance des données florissante et un facteur essentiel du succès des algorithmes d'apprentissage automatique. Les entreprises doivent investir dans la qualité des données, par exemple en publiant des rapports aux consommateurs de données. Dans un projet de science des données, réfléchissez à ce qui se passe lorsque des données de mauvaise qualité entrent dans le modèle, ce qui peut entraîner de mauvaises performances.
Ce n'est que lors de l'analyse des erreurs que les équipes peuvent identifier les problèmes de qualité des données, ce qui conduit finalement à une fatigue parmi les équipes lorsque ces problèmes sont envoyés en amont pour des correctifs.
Évidemment, ce n’est pas seulement l’effort qui est nécessaire, mais aussi une énorme quantité de temps qui est perdu avant que les données correctes ne commencent à être saisies.
Par conséquent, il est toujours recommandé de résoudre les problèmes de données à la source pour éviter de telles itérations fastidieuses. En fin de compte, les rapports publiés sur la qualité des données impliquent que l'équipe de science des données (ou tout autre utilisateur en aval et consommateur de données) comprenne la qualité acceptable des données entrantes.
Sans mesures de qualité des données et de gouvernance, les data scientists seront submergés de problèmes de données, ce qui entraînera des modèles infructueux qui entraîneront une lassitude de l'IA.
Cet article met en évidence les deux étapes de l'apparition de la fatigue de l'IA et décrit comment les mesures de gouvernance des données telles que les rapports sur la qualité des données peuvent conduire à la construction de modèles fiables et robustes.
En établissant une base solide grâce à la gouvernance des données, les entreprises peuvent établir une feuille de route pour un développement et une adoption réussis et transparents de l'IA, suscitant ainsi l'enthousiasme.
Pour garantir que cet article donne un aperçu complet des différentes manières de gérer la lassitude de l'IA, je souligne également le rôle de la culture organisationnelle, qui, combinée à d'autres bonnes pratiques telles que la gouvernance des données, permettra aux équipes de science des données de travailler plus rapidement et plus. Construisez rapidement et efficacement des contributions significatives à l’IA.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!