


Comment déployer une application d'IA (avec de grands déploiements) sur AWS Lambda
J'ai récemment passé deux heures à exécuter une simple application LlamaIndex sur AWS Lambda. Bien que la fonction elle-même ne comporte que quelques lignes de code Python (comme indiqué ci-dessous), la gestion des dépendances et du déploiement peut être délicate.
import json from llama_index.llms.openai import OpenAI llm=OpenAI(model="gpt-4o-mini") def lambda_handler(event, context): response = llm.complete("What public transportation might be available in a city?") return { 'statusCode': 200, 'body': str(response), }
Voici quelques conseils clés qui m'ont aidé :
Tout d’abord, installez les packages pour la bonne plate-forme. Il est important d'installer tous les packages pour la plateforme cible "manylinux2014_x86_64". Sinon, certains packages pourraient être incompatibles avec le runtime AWS Lambda. Pour garantir la compatibilité, installez les dépendances avec la commande suivante :
pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all:
Deuxièmement, Lambda a une limite de 250 Mo pour la taille totale du package de code, ce qui peut rapidement devenir un problème si vous utilisez LlamaIndex ou d'autres dépendances volumineuses. Si votre package dépasse cette limite, vérifiez les fichiers les plus volumineux dans votre dossier de dépendances :
du -h -d 2 | sort -hr | head -n20
Dans mon cas, j'ai constaté que le répertoire pandas/tests occupait environ 35 Mo d'espace, ce qui n'était pas nécessaire pour ma fonction, je l'ai donc supprimé pour ramener la taille du package dans la limite.
rm -r deps/pandas/tests
Ensuite, compressez le tout et téléchargez via S3. Après avoir supprimé les fichiers inutiles, créez une archive zip contenant à la fois votre code et vos dépendances. Étant donné que la console Web de Lambda a une limite de téléchargement de 50 Mo, vous devrez télécharger des fichiers zip plus volumineux dans un compartiment S3 et utiliser l'URI S3 pour déployer la fonction.
zip -r test_lambda.zip data/ lambda_function.py cd deps/ zip -r ../test_lambda.zip .
Enfin, ajustez vos paramètres Lambda avant le déploiement. Par défaut, les fonctions Lambda ne disposent que de 128 Mo de mémoire et d'un délai d'attente de 3 secondes, ce qui est insuffisant pour de nombreuses applications d'IA impliquant de grandes dépendances et appelant des LLM. J'augmenterais la mémoire à 512 Mo et prolongerais le délai d'attente à 30 secondes. De plus, n'oubliez pas de définir des variables d'environnement essentielles comme votre clé API OpenAI.
Il m'a fallu pas mal d'essais pour trouver la bonne façon d'installer les packages et de tout regrouper pour Lambda. AWS Lambda est convivial pour les scripts de base, mais une fois que vous ajoutez des dépendances plus importantes, les choses deviennent plus compliquées.
Voici la séquence finale des étapes :
# Install dependencies pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all: # Create a zip file for code and data zip -r test_lambda.zip data/ lambda_function.py # Include dependencies in the zip file, while removing large unused files cd deps/ rm -r pandas/tests zip -r ../test_lambda.zip .
ps, j'ai également essayé de déployer une fonction similaire sur DBOS Cloud, et cela n'a nécessité qu'une seule commande :
dbos-cloud app deploy
Dans DBOS, la gestion des dépendances était gérée automatiquement via le fichier Requirements.txt et les variables d'environnement étaient définies dans dbos-config.yaml. Je suis peut-être partial, mais j'apprécie la simplicité du processus de déploiement de DBOS Cloud.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Est-ce suffisant pour apprendre Python pendant deux heures par jour? Cela dépend de vos objectifs et de vos méthodes d'apprentissage. 1) Élaborer un plan d'apprentissage clair, 2) Sélectionnez les ressources et méthodes d'apprentissage appropriées, 3) la pratique et l'examen et la consolidation de la pratique pratique et de l'examen et de la consolidation, et vous pouvez progressivement maîtriser les connaissances de base et les fonctions avancées de Python au cours de cette période.

Les applications clés de Python dans le développement Web incluent l'utilisation des cadres Django et Flask, le développement de l'API, l'analyse et la visualisation des données, l'apprentissage automatique et l'IA et l'optimisation des performances. 1. Framework Django et Flask: Django convient au développement rapide d'applications complexes, et Flask convient aux projets petits ou hautement personnalisés. 2. Développement de l'API: Utilisez Flask ou DjangorestFramework pour construire RestulAPI. 3. Analyse et visualisation des données: utilisez Python pour traiter les données et les afficher via l'interface Web. 4. Apprentissage automatique et AI: Python est utilisé pour créer des applications Web intelligentes. 5. Optimisation des performances: optimisée par la programmation, la mise en cache et le code asynchrones

Python est meilleur que C dans l'efficacité du développement, mais C est plus élevé dans les performances d'exécution. 1. La syntaxe concise de Python et les bibliothèques riches améliorent l'efficacité du développement. Les caractéristiques de type compilation et le contrôle du matériel de CC améliorent les performances d'exécution. Lorsque vous faites un choix, vous devez peser la vitesse de développement et l'efficacité de l'exécution en fonction des besoins du projet.

Les applications du monde réel de Python incluent l'analyse des données, le développement Web, l'intelligence artificielle et l'automatisation. 1) Dans l'analyse des données, Python utilise des pandas et du matplotlib pour traiter et visualiser les données. 2) Dans le développement Web, les cadres Django et Flask simplifient la création d'applications Web. 3) Dans le domaine de l'intelligence artificielle, Tensorflow et Pytorch sont utilisés pour construire et former des modèles. 4) En termes d'automatisation, les scripts Python peuvent être utilisés pour des tâches telles que la copie de fichiers.

Python est largement utilisé dans les domaines de la science des données, du développement Web et des scripts d'automatisation. 1) Dans la science des données, Python simplifie le traitement et l'analyse des données à travers des bibliothèques telles que Numpy et Pandas. 2) Dans le développement Web, les cadres Django et Flask permettent aux développeurs de créer rapidement des applications. 3) Dans les scripts automatisés, la simplicité de Python et la bibliothèque standard le rendent idéal.

La flexibilité de Python se reflète dans les systèmes de prise en charge et de type dynamique multi-paradigmes, tandis que la facilité d'utilisation provient d'une syntaxe simple et d'une bibliothèque standard riche. 1. Flexibilité: prend en charge la programmation orientée objet, fonctionnelle et procédurale, et les systèmes de type dynamique améliorent l'efficacité de développement. 2. Facilité d'utilisation: La grammaire est proche du langage naturel, la bibliothèque standard couvre un large éventail de fonctions et simplifie le processus de développement.

Python est très favorisé pour sa simplicité et son pouvoir, adaptés à tous les besoins des débutants aux développeurs avancés. Sa polyvalence se reflète dans: 1) Facile à apprendre et à utiliser, syntaxe simple; 2) Bibliothèques et cadres riches, tels que Numpy, Pandas, etc.; 3) Support multiplateforme, qui peut être exécuté sur une variété de systèmes d'exploitation; 4) Convient aux tâches de script et d'automatisation pour améliorer l'efficacité du travail.

Oui, apprenez Python en deux heures par jour. 1. Élaborer un plan d'étude raisonnable, 2. Sélectionnez les bonnes ressources d'apprentissage, 3. Consolider les connaissances apprises par la pratique. Ces étapes peuvent vous aider à maîtriser Python en peu de temps.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

AI Hentai Generator
Générez AI Hentai gratuitement.

Article chaud

Outils chauds

Version Mac de WebStorm
Outils de développement JavaScript utiles

Dreamweaver CS6
Outils de développement Web visuel

Télécharger la version Mac de l'éditeur Atom
L'éditeur open source le plus populaire

DVWA
Damn Vulnerable Web App (DVWA) est une application Web PHP/MySQL très vulnérable. Ses principaux objectifs sont d'aider les professionnels de la sécurité à tester leurs compétences et leurs outils dans un environnement juridique, d'aider les développeurs Web à mieux comprendre le processus de sécurisation des applications Web et d'aider les enseignants/étudiants à enseigner/apprendre dans un environnement de classe. Application Web sécurité. L'objectif de DVWA est de mettre en pratique certaines des vulnérabilités Web les plus courantes via une interface simple et directe, avec différents degrés de difficulté. Veuillez noter que ce logiciel

Navigateur d'examen sécurisé
Safe Exam Browser est un environnement de navigation sécurisé permettant de passer des examens en ligne en toute sécurité. Ce logiciel transforme n'importe quel ordinateur en poste de travail sécurisé. Il contrôle l'accès à n'importe quel utilitaire et empêche les étudiants d'utiliser des ressources non autorisées.