


Polars Delta Lake : fonction Azure par rapport à un ordinateur portable sur les petites données
Vous êtes-vous déjà demandé comment les performances de Polars Deltalake sur Azure se comparent à celles d'un ordinateur portable grand public ?
Non? Eh bien, je l'ai fait. Si j'ai éveillé votre curiosité, continuez à lire.
Voici les prétendants
- EliteBook 840 G10, AMD Ryzen 7840U, 8 cœurs, 16 threads, 64 Go de RAM
- Azure Function exécuté sur un plan de service d'application Linux B3 SKU (4 cœurs, 7 Go de RAM)
- avec stockage ADLS2 standard
- avec stockage ADLS2 premium
Voir Tarifs pour une liste complète des forfaits de services d'application disponibles.
Configuration des tests
Le test mesure trois scénarios
- créer une table delta
- écrire dans la table delta
- lire à partir de la table delta
Le code est exécuté via les points de terminaison de l'API REST :
- polars_azure_create : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
- polars_azure_read : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
- polars_azure_write : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
- polars_local_create : http://localhost:7071/api/polars/local/create
- polars_local_read : http://localhost:7071/api/polars/local/read
- polars_local_write : http://localhost:7071/api/polars/local/write
Sur le HP EliteBook, j'ai utilisé func start pour lancer https://localhost:7071.
Pour publier sur Azure I, suivez les instructions de https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
mettre en place l’environnement de développement nécessaire. Cela m'a permis de publier la fonction via
func azure functionapp publie function-hekori-learning-002.
J'ai utilisé Terraform pour configurer les ressources Azure dans la région Europe du Nord.
Voici un extrait de code montrant le code exécuté lors de la visite de https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS) def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse: logging.info('Reading from delta table') tic = time.time() df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options ) df = df.sql( "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc" ) toc = time.time() logging.info(f"Elapsed time {toc - tic:.2f} seconds") return func.HttpResponse( "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds", status_code=200 )
Résultats des tests
Comme on peut le constater, le HP EliteBook est environ un ordre de grandeur plus rapide dans tous les scénarios.
Interprétation
C'est mon interprétation personnelle
- Les timings de la fonction Azure sont suffisants pour les tâches synchrones. Par exemple, à utiliser dans les requêtes POST où le client attend une réponse dans
- Si vous disposez de petites données et souhaitez obtenir les meilleures performances, vous devriez envisager d'exécuter Polars sur du métal nu ou une machine virtuelle avec une faible latence d'E/S.
Veuillez noter que la table delta a une petite taille de 3 commits et 2 fichiers parquet. C'est-à-dire que le moteur d'exécution mesure efficacement la surcharge d'accès aux fichiers depuis l'unité de calcul.
Si vous ❤️ cet article et que vous souhaitez voir plus de résultats de référence avec des ensembles de données plus importants pour le traitement hors noyau, donnez à cet article un ?
et t'abonner ? sur ma chaîne ???.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

La syntaxe de base pour le découpage de la liste Python est la liste [Démarrage: arrêt: étape]. 1.Start est le premier index d'élément inclus, 2.STOP est le premier indice d'élément exclu et 3.StEP détermine la taille de l'étape entre les éléments. Les tranches sont non seulement utilisées pour extraire les données, mais aussi pour modifier et inverser les listes.

ListesoutPerformarRaySin: 1) dynamicingizingandfrequentinSertions / Deletions, 2) StoringheteroGeneousData, and3) MemoryEfficiencyForsparsedata, butmayhaveslightperformanceCostSincertorations.

Toconvertapythonarraytoalist, usethelist () Constructororageneratorexpression.1) ImportTheArrayModuleandCreateArray.2) Uselist (Arr) ou [Xforxinarr] à Convertittoalist, considérant la performance et le domaine de l'émie-efficacité pour les étages.

ChooseArraySoverListsInpyThonforBetterperformanceAndmemeMoryEfficacitéInSpecificScenarios.1) LargenumericalDatasets: ArraySreduceDeMemoryUsage.2)

Dans Python, vous pouvez utiliser pour les boucles, énumérer et les compréhensions de liste pour traverser les listes; En Java, vous pouvez utiliser des boucles traditionnelles et améliorées pour les boucles pour traverser les tableaux. 1. Les méthodes de traversée de la liste Python incluent: pour la compréhension de la boucle, de l'énumération et de la liste. 2. Les méthodes de traversée du tableau Java comprennent: traditionnel pour la boucle et amélioré pour la boucle.

L'article traite de la nouvelle instruction "Match" de Python introduite dans la version 3.10, qui constitue un équivalent pour les instructions de commutation dans d'autres langues. Il améliore la lisibilité du code et offre des avantages de performance par rapport aux if-elif-el traditionnels

Les groupes d'exception dans Python 3.11 permettent de gérer plusieurs exceptions simultanément, améliorant la gestion des erreurs dans des scénarios simultanés et des opérations complexes.

Les annotations de fonction dans Python ajoutent des métadonnées aux fonctions pour la vérification de type, la documentation et la prise en charge de l'IDE. Ils améliorent la lisibilité du code, la maintenance et sont cruciaux dans le développement de l'API, la science des données et la création de bibliothèques.


Outils d'IA chauds

Undresser.AI Undress
Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover
Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool
Images de déshabillage gratuites

Clothoff.io
Dissolvant de vêtements AI

Video Face Swap
Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Article chaud

Outils chauds

SublimeText3 version Mac
Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dreamweaver CS6
Outils de développement Web visuel

Version crackée d'EditPlus en chinois
Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

Version Mac de WebStorm
Outils de développement JavaScript utiles

ZendStudio 13.5.1 Mac
Puissant environnement de développement intégré PHP
