suchen
HeimBackend-EntwicklungPython-TutorialPolars Delta Lake: Azure-Funktion vs. Laptop bei Small Data

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

Haben Sie sich jemals gefragt, wie die Leistung von Polars Deltalake auf Azure im Vergleich zu einem Laptop der Verbraucherklasse abschneidet?
NEIN? Nun ja, das habe ich. Wenn ich Ihre Neugier geweckt habe, lesen Sie weiter.

Hier sind die Kandidaten

  1. EliteBook 840 G10, AMD Ryzen 7840U, 8 Kerne, 16 Threads, 64 GB RAM
  2. Azure Function läuft auf einem Linux B3 SKU App Service Plan (4 Kerne, 7 GB RAM)
    • mit Standard-ADLS2-Speicher
    • mit Premium-ADLS2-Speicher

Eine vollständige Liste der verfügbaren App-Service-Pläne finden Sie unter „Preise“.

Testaufbau

Der Test misst drei Szenarien

  1. Delta-Tabelle erstellen
  2. In Delta-Tabelle schreiben
  3. Aus Delta-Tabelle lesen

Der Code wird über REST-API-Endpunkte ausgeführt:

  1. polars_azure_create: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
  2. polars_azure_read: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
  3. polars_azure_write: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
  4. polars_local_create: http://localhost:7071/api/polars/local/create
  5. polars_local_read: http://localhost:7071/api/polars/local/read
  6. polars_local_write: http://localhost:7071/api/polars/local/write

Auf dem HP EliteBook habe ich func start verwendet, um https://localhost:7071 zu starten.
Befolgen Sie zum Veröffentlichen in Azure I die Anweisungen von https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
die nötige Entwicklungsumgebung einzurichten. Dadurch konnte ich die Funktion über
veröffentlichen func Azure functionapp veröffentlichen function-hekori-learning-002.

Ich habe Terraform verwendet, um die Azure-Ressourcen in der Region Nordeuropa einzurichten.

Hier ist ein Codeausschnitt, der den Code zeigt, der beim Besuch von https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read ausgeführt wird

@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS)
def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse:
    logging.info('Reading from delta table')

    tic = time.time()
    df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options
                       )

    df = df.sql(
        "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc"
    )

    toc = time.time()

    logging.info(f"Elapsed time {toc - tic:.2f} seconds")

    return func.HttpResponse(
        "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds",
        status_code=200
    )

Testergebnisse

Wie man sieht, ist das HP EliteBook in allen Szenarien etwa eine Größenordnung schneller.

Polars   Delta Lake: Azure Function vs. Laptop on Small Data

Interpretation

Das ist meine persönliche Interpretation

  1. Die Azure-Funktionszeiten reichen für synchrone Aufgaben aus. Z. B. zur Verwendung in POST-Anfragen, bei denen der Client eine Antwort in
  2. Wenn Sie über kleine Datenmengen verfügen und die beste Leistung wünschen, sollten Sie in Betracht ziehen, Polars auf Bare-Metal oder einer virtuellen Maschine mit geringer E/A-Latenz auszuführen.

Bitte beachten Sie, dass die Delta-Tabelle eine kleine Größe von 3 Commits und 2 Parkettdateien hat. Das heißt, die Laufzeit misst effektiv den Overhead des Dateizugriffs von der Recheneinheit.

Wenn Sie diesen Artikel ❤️ und mehr Benchmark-Ergebnisse mit größeren Datensätzen für die Out-of-Core-Verarbeitung sehen möchten, geben Sie diesem Artikel ein ?
und abonnieren? zu meinem Kanal ???.

Das obige ist der detaillierte Inhalt vonPolars Delta Lake: Azure-Funktion vs. Laptop bei Small Data. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Wie schneiden Sie ein Python -Array?Wie schneiden Sie ein Python -Array?May 01, 2025 am 12:18 AM

Die grundlegende Syntax für die Python -Liste ist die Liste [START: STOP: STEP]. 1.Start ist der erste Elementindex, 2.Stop ist der erste Elementindex, und 3.Step bestimmt die Schrittgröße zwischen den Elementen. Scheiben werden nicht nur zum Extrahieren von Daten verwendet, sondern auch zum Ändern und Umkehrlisten.

Unter welchen Umständen könnte Listen besser abschneiden als Arrays?Unter welchen Umständen könnte Listen besser abschneiden als Arrays?May 01, 2025 am 12:06 AM

ListSoutPer -CharakterArraysin: 1) Dynamics und Dynamics und 3), 2) StoringHeterogenData und 3) MemoryefficiencyForSparsedata, ButmayHavesLightPerformanceCostIncustonTectorationOperationen.

Wie können Sie ein Python -Array in eine Python -Liste konvertieren?Wie können Sie ein Python -Array in eine Python -Liste konvertieren?May 01, 2025 am 12:05 AM

Toconvertapythonarraytoalist, Usethelist () constructororageneratorexpression.1) ImportThearrayModuleandCreateanarray.2) Uselist (arr) oder [xForxinarr] Toconvertittoalist in Betracht, überlegt Performance undMoryefficiencyForlargedatasets.

Was ist der Zweck der Verwendung von Arrays, wenn Listen in Python vorhanden sind?Was ist der Zweck der Verwendung von Arrays, wenn Listen in Python vorhanden sind?May 01, 2025 am 12:04 AM

ChoosearraySoverlistsinpythonforbetterperformanceAndMemoryefficienceInspezifizarios.1) largenumericalDatasets: ArraysReDucemoryusage.2) leistungskritische Operationen: ArraysOfferspeedboostsForsforsarching.3) TypeSafety: ArraysStety

Erklären Sie, wie Sie durch die Elemente einer Liste und eines Arrays iterieren können.Erklären Sie, wie Sie durch die Elemente einer Liste und eines Arrays iterieren können.May 01, 2025 am 12:01 AM

In Python können Sie Verständnissen für Schleifen, Aufzählungen und Listen für durchqueren Listen verwenden. In Java können Sie traditionelle für Schleifen verwenden und für Schleifen zu durchqueren Arrays erweitert. 1. Python List Traversal Methods gehören: für Schleifen, Aufzählung und Listenverständnis. 2. Java Array Traversal -Methoden umfassen: traditionell für Schleife und erweitert für die Schleife.

Was ist Python Switch Anweisung?Was ist Python Switch Anweisung?Apr 30, 2025 pm 02:08 PM

In dem Artikel wird die in Version 3.10 eingeführte "Match" -serklärung von Python erörtert, die als Äquivalent zum Wechseln von Aussagen in anderen Sprachen dient. Es verbessert die Code-Lesbarkeit und bietet Leistungsvorteile gegenüber herkömmlichen IF-ELIF-EL

Was sind Ausnahmegruppen in Python?Was sind Ausnahmegruppen in Python?Apr 30, 2025 pm 02:07 PM

Ausnahmegruppen in Python 3.11 ermöglichen die gleichzeitige Behandlung mehrerer Ausnahmen, wodurch die Fehlermanagement in gleichzeitigen Szenarien und komplexen Vorgängen verbessert wird.

Was sind Funktionsanmerkungen in Python?Was sind Funktionsanmerkungen in Python?Apr 30, 2025 pm 02:06 PM

Funktionsanmerkungen in Python Fügen Sie Metadaten zu Funktionen für Typprüfungen, Dokumentation und IDE -Unterstützung hinzu. Sie verbessern die Lesbarkeit, die Wartung der Code und die API -Entwicklung, die Datenwissenschaft und die Erstellung der Bibliothek von entscheidender Bedeutung.

See all articles

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heiße Werkzeuge

PHPStorm Mac-Version

PHPStorm Mac-Version

Das neueste (2018.2.1) professionelle, integrierte PHP-Entwicklungstool

EditPlus chinesische Crack-Version

EditPlus chinesische Crack-Version

Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

Herunterladen der Mac-Version des Atom-Editors

Herunterladen der Mac-Version des Atom-Editors

Der beliebteste Open-Source-Editor

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

MinGW – Minimalistisches GNU für Windows

MinGW – Minimalistisches GNU für Windows

Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.