recherche
Maisondéveloppement back-endTutoriel PythonPolars Delta Lake : fonction Azure par rapport à un ordinateur portable sur les petites données

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

Vous êtes-vous déjà demandé comment les performances de Polars Deltalake sur Azure se comparent à celles d'un ordinateur portable grand public ?
Non? Eh bien, je l'ai fait. Si j'ai éveillé votre curiosité, continuez à lire.

Voici les prétendants

  1. EliteBook 840 G10, AMD Ryzen 7840U, 8 cœurs, 16 threads, 64 Go de RAM
  2. Azure Function exécuté sur un plan de service d'application Linux B3 SKU (4 cœurs, 7 Go de RAM)
    • avec stockage ADLS2 standard
    • avec stockage ADLS2 premium

Voir Tarifs pour une liste complète des forfaits de services d'application disponibles.

Configuration des tests

Le test mesure trois scénarios

  1. créer une table delta
  2. écrire dans la table delta
  3. lire à partir de la table delta

Le code est exécuté via les points de terminaison de l'API REST :

  1. polars_azure_create : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
  2. polars_azure_read : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
  3. polars_azure_write : https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
  4. polars_local_create : http://localhost:7071/api/polars/local/create
  5. polars_local_read : http://localhost:7071/api/polars/local/read
  6. polars_local_write : http://localhost:7071/api/polars/local/write

Sur le HP EliteBook, j'ai utilisé func start pour lancer https://localhost:7071.
Pour publier sur Azure I, suivez les instructions de https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
mettre en place l’environnement de développement nécessaire. Cela m'a permis de publier la fonction via
func azure functionapp publie function-hekori-learning-002.

J'ai utilisé Terraform pour configurer les ressources Azure dans la région Europe du Nord.

Voici un extrait de code montrant le code exécuté lors de la visite de https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read

@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS)
def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse:
    logging.info('Reading from delta table')

    tic = time.time()
    df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options
                       )

    df = df.sql(
        "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc"
    )

    toc = time.time()

    logging.info(f"Elapsed time {toc - tic:.2f} seconds")

    return func.HttpResponse(
        "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds",
        status_code=200
    )

Résultats des tests

Comme on peut le constater, le HP EliteBook est environ un ordre de grandeur plus rapide dans tous les scénarios.

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

Interprétation

C'est mon interprétation personnelle

  1. Les timings de la fonction Azure sont suffisants pour les tâches synchrones. Par exemple, à utiliser dans les requêtes POST où le client attend une réponse dans
  2. Si vous disposez de petites données et souhaitez obtenir les meilleures performances, vous devriez envisager d'exécuter Polars sur du métal nu ou une machine virtuelle avec une faible latence d'E/S.

Veuillez noter que la table delta a une petite taille de 3 commits et 2 fichiers parquet. C'est-à-dire que le moteur d'exécution mesure efficacement la surcharge d'accès aux fichiers depuis l'unité de calcul.

Si vous ❤️ cet article et que vous souhaitez voir plus de résultats de référence avec des ensembles de données plus importants pour le traitement hors noyau, donnez à cet article un ?
et t'abonner ? sur ma chaîne ???.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Comment trancher un tableau Python?Comment trancher un tableau Python?May 01, 2025 am 12:18 AM

La syntaxe de base pour le découpage de la liste Python est la liste [Démarrage: arrêt: étape]. 1.Start est le premier index d'élément inclus, 2.STOP est le premier indice d'élément exclu et 3.StEP détermine la taille de l'étape entre les éléments. Les tranches sont non seulement utilisées pour extraire les données, mais aussi pour modifier et inverser les listes.

Dans quelles circonstances les listes pourraient-elles mieux fonctionner que les tableaux?Dans quelles circonstances les listes pourraient-elles mieux fonctionner que les tableaux?May 01, 2025 am 12:06 AM

ListesoutPerformarRaySin: 1) dynamicingizingandfrequentinSertions / Deletions, 2) StoringheteroGeneousData, and3) MemoryEfficiencyForsparsedata, butmayhaveslightperformanceCostSincertorations.

Comment pouvez-vous convertir un tableau Python en une liste Python?Comment pouvez-vous convertir un tableau Python en une liste Python?May 01, 2025 am 12:05 AM

Toconvertapythonarraytoalist, usethelist () Constructororageneratorexpression.1) ImportTheArrayModuleandCreateArray.2) Uselist (Arr) ou [Xforxinarr] à Convertittoalist, considérant la performance et le domaine de l'émie-efficacité pour les étages.

Quel est le but d'utiliser des tableaux lorsque des listes existent dans Python?Quel est le but d'utiliser des tableaux lorsque des listes existent dans Python?May 01, 2025 am 12:04 AM

ChooseArraySoverListsInpyThonforBetterperformanceAndmemeMoryEfficacitéInSpecificScenarios.1) LargenumericalDatasets: ArraySreduceDeMemoryUsage.2)

Expliquez comment itérer les éléments d'une liste et un tableau.Expliquez comment itérer les éléments d'une liste et un tableau.May 01, 2025 am 12:01 AM

Dans Python, vous pouvez utiliser pour les boucles, énumérer et les compréhensions de liste pour traverser les listes; En Java, vous pouvez utiliser des boucles traditionnelles et améliorées pour les boucles pour traverser les tableaux. 1. Les méthodes de traversée de la liste Python incluent: pour la compréhension de la boucle, de l'énumération et de la liste. 2. Les méthodes de traversée du tableau Java comprennent: traditionnel pour la boucle et amélioré pour la boucle.

Qu'est-ce que la déclaration de commutation Python?Qu'est-ce que la déclaration de commutation Python?Apr 30, 2025 pm 02:08 PM

L'article traite de la nouvelle instruction "Match" de Python introduite dans la version 3.10, qui constitue un équivalent pour les instructions de commutation dans d'autres langues. Il améliore la lisibilité du code et offre des avantages de performance par rapport aux if-elif-el traditionnels

Que sont les groupes d'exception à Python?Que sont les groupes d'exception à Python?Apr 30, 2025 pm 02:07 PM

Les groupes d'exception dans Python 3.11 permettent de gérer plusieurs exceptions simultanément, améliorant la gestion des erreurs dans des scénarios simultanés et des opérations complexes.

Que sont les annotations de fonction dans Python?Que sont les annotations de fonction dans Python?Apr 30, 2025 pm 02:06 PM

Les annotations de fonction dans Python ajoutent des métadonnées aux fonctions pour la vérification de type, la documentation et la prise en charge de l'IDE. Ils améliorent la lisibilité du code, la maintenance et sont cruciaux dans le développement de l'API, la science des données et la création de bibliothèques.

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

Video Face Swap

Video Face Swap

Échangez les visages dans n'importe quelle vidéo sans effort grâce à notre outil d'échange de visage AI entièrement gratuit !

Outils chauds

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)

Dreamweaver CS6

Dreamweaver CS6

Outils de développement Web visuel

Version crackée d'EditPlus en chinois

Version crackée d'EditPlus en chinois

Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

Version Mac de WebStorm

Version Mac de WebStorm

Outils de développement JavaScript utiles

ZendStudio 13.5.1 Mac

ZendStudio 13.5.1 Mac

Puissant environnement de développement intégré PHP