Maison >Périphériques technologiques >IA >L'adoption de systèmes d'IA générative pourrait transformer les architectures cloud des entreprises
De la disponibilité et de la sécurité des données aux grands modèles de langage, en passant par la sélection et la surveillance, l'adoption par les entreprises de l'IA générative signifie la nécessité de réexaminer leur architecture cloud.
Ainsi, de nombreuses entreprises reconstruisent leur architecture cloud et développent des systèmes d’intelligence artificielle générative. Alors, quels changements ces entreprises doivent-elles apporter ?Quelles sont les meilleures pratiques émergentes ?Les experts de l'industrie ont déclaré qu'au cours des 20 dernières années, en particulier au cours des deux dernières années, il a aidé les entreprises à créer de telles plates-formes. entreprises :
Les entreprises doivent définir clairement le but et les objectifs de l'IA générative dans l'architecture cloud. Si vous voyez des faux retours, c'est parce qu'ils ne comprennent pas ce que signifie générer de l'intelligence artificielle dans les systèmes d'entreprise. Les entreprises doivent comprendre quels sont leurs objectifs, qu'il s'agisse de génération de contenu, de systèmes de recommandation ou d'autres applications.
Cela signifie que la direction de haut niveau de l'entreprise doit parvenir à un consensus sur les objectifs fixés et clarifier comment atteindre les objectifs et, plus important encore, comment définir le succès. Ce n’est pas propre à l’IA de production. Et c’est une étape vers le succès pour chaque migration et chaque nouveau système construit dans le cloud.
De nombreux projets intelligents développés par des entreprises sur des plateformes cloud échouent parce qu'elles ne parviennent pas à bien comprendre les cas d'utilisation métier. Bien que le produit développé par l’entreprise soit cool, il n’apporte aucune valeur à son activité. Cette approche ne fonctionnera pas.
Afin de former et d'inférer des modèles intelligents efficaces, l'identification de la formation et de l'inférence de modèles d'IA génératifs nécessite des sources de données efficaces qui doivent être des données accessibles, de haute qualité et soigneusement gérées. Les entreprises doivent également garantir la disponibilité et la tolérance aux pannes des solutions de stockage cloud computing pour garantir la disponibilité et la tolérance aux pannes des solutions de stockage cloud computing.
Le système de fonctions génératrices est un système centré sur les données hautement intelligent, que l'on peut appeler un système orienté données. Les données sont le carburant qui permet aux systèmes fonctionnels de produire des résultats. Toutefois, la qualité des données reste une question de « déchets entrants et sortants ».
À cette fin, il est utile de considérer l’accessibilité des données comme l’un des principaux moteurs de l’architecture cloud. Les entreprises doivent accéder aux données les plus pertinentes sous forme de données de formation, en les conservant généralement là où elles sont stockées plutôt que de les migrer vers une seule entité physique. Sinon, vous vous retrouverez avec des données redondantes et sans source unique de vérité. Envisagez des pipelines de gestion de données efficaces qui prétraitent et nettoient les données avant de les intégrer aux modèles d'IA. Cela garantit la qualité des données et les performances du modèle.
80 % de réussite avec l'architecture cloud utilisant les capacités de génération. Il s’agit du facteur le plus négligé, car les architectes cloud se concentrent davantage sur la génération de fonctionnalités plutôt que sur la fourniture de données de haute qualité à ces systèmes. En fait, les données sont tout.
Tout comme les données sont cruciales, la sécurité et la confidentialité de vos données le sont aussi. Le traitement de l’IA générative peut transformer des données apparemment dénuées de sens en données susceptibles d’exposer des informations sensibles.
Les entreprises doivent mettre en œuvre des mesures robustes de sécurité des données, de cryptage et de contrôle d'accès pour protéger les données sensibles utilisées par l'IA et les nouvelles données pouvant être générées par l'IA. Les entreprises doivent se conformer aux réglementations pertinentes en matière de confidentialité des données. Cela ne signifie pas installer un système de sécurité sur l'architecture de l'entreprise en dernier recours, mais la sécurité doit être appliquée au système à chaque étape.
Les entreprises doivent planifier des ressources cloud évolutives pour s'adapter aux différentes charges de travail et besoins de traitement des données. La plupart des entreprises envisagent des solutions d'autoscaling et d'équilibrage de charge. L’une des erreurs les plus graves que nous constatons est de créer des systèmes bien évolutifs mais très coûteux. Il est préférable d'équilibrer l'évolutivité et les coûts, ce qui est possible mais nécessite de bonnes pratiques d'architecture et d'optimisation des coûts du cloud.
De plus, les entreprises doivent consulter les ressources de raisonnement. Il a été remarqué qu'une grande partie de l'actualité lors des conférences de l'industrie du cloud computing tourne autour de ce sujet, et pour cause. Choisissez l'instance cloud appropriée avec GPU ou TPU pour la formation et l'inférence de modèles. Et optimisez l’allocation des ressources pour atteindre la rentabilité.
Choisissez des exemples d'architectures d'IA génératives (réseaux publicitaires universels, transformateurs, etc.) en fonction des cas d'utilisation et des besoins spécifiques de votre entreprise. Pensez à utiliser des services cloud pour la formation de modèles (tels qu'AWSSageMaker, etc.) et trouvez une solution optimisée. Cela signifie également comprendre qu’une entreprise peut avoir de nombreux modèles connectés et que cela sera la norme.
Les entreprises doivent mettre en œuvre une stratégie de déploiement de modèles robuste, comprenant le contrôle des versions et la conteneurisation, pour rendre les modèles d'IA accessibles aux applications et services dans l'architecture cloud de l'entreprise.
La mise en place d'un système de surveillance et de journalisation pour suivre les performances d'un modèle d'IA, l'utilisation des ressources et les problèmes potentiels n'est pas une option. Établissez des mécanismes d’alerte d’anomalies et des systèmes d’observabilité pour gérer l’intelligence artificielle générée dans le cloud.
Surveillez et optimisez également en permanence les coûts des ressources cloud, car l’IA générative peut être gourmande en ressources. Utiliser des outils et des pratiques de gestion des coûts du cloud signifie laisser l'optimisation des coûts du cloud surveiller tous les aspects de votre déploiement, en minimisant les coûts opérationnels et en améliorant l'efficacité architecturale. La plupart des architectures nécessitent un réglage et une amélioration continue.
Le basculement et la redondance sont nécessaires pour garantir une haute disponibilité, et un plan de reprise après sinistre peut minimiser les temps d'arrêt et la perte de données en cas de panne du système. Mettez en œuvre la redondance si nécessaire. De plus, auditez et évaluez régulièrement la sécurité des systèmes d’IA générative dans votre infrastructure cloud. Corrigez les vulnérabilités et maintenez la conformité.
C'est une bonne idée d'établir des lignes directrices pour l'utilisation éthique de l'IA, en particulier lorsque les systèmes d'IA générative génèrent du contenu ou prennent des décisions qui ont un impact sur les utilisateurs. De plus, les questions de partialité et d’équité doivent être résolues. Des poursuites sont en cours concernant l’intelligence artificielle et l’équité, et les entreprises doivent s’assurer qu’elles font ce qu’il faut. Les entreprises doivent évaluer en permanence l’expérience utilisateur pour s’assurer que le contenu généré par l’IA répond aux attentes des utilisateurs et stimule l’engagement.
Qu'une entreprise utilise ou non un système d'IA générative, les autres aspects de l'architecture cloud sont à peu près les mêmes. La clé est de réaliser qu’il y a des choses bien plus importantes et de continuer à améliorer votre architecture cloud.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!