Haben Sie sich jemals gefragt, wie die Leistung von Polars Deltalake auf Azure im Vergleich zu einem Laptop der Verbraucherklasse abschneidet?
NEIN? Nun ja, das habe ich. Wenn ich Ihre Neugier geweckt habe, lesen Sie weiter.
Hier sind die Kandidaten
- EliteBook 840 G10, AMD Ryzen 7840U, 8 Kerne, 16 Threads, 64 GB RAM
- Azure Function läuft auf einem Linux B3 SKU App Service Plan (4 Kerne, 7 GB RAM)
- mit Standard-ADLS2-Speicher
- mit Premium-ADLS2-Speicher
Eine vollständige Liste der verfügbaren App-Service-Pläne finden Sie unter „Preise“.
Testaufbau
Der Test misst drei Szenarien
- Delta-Tabelle erstellen
- In Delta-Tabelle schreiben
- Aus Delta-Tabelle lesen
Der Code wird über REST-API-Endpunkte ausgeführt:
- polars_azure_create: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/create
- polars_azure_read: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read
- polars_azure_write: https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/write
- polars_local_create: http://localhost:7071/api/polars/local/create
- polars_local_read: http://localhost:7071/api/polars/local/read
- polars_local_write: http://localhost:7071/api/polars/local/write
Auf dem HP EliteBook habe ich func start verwendet, um https://localhost:7071 zu starten.
Befolgen Sie zum Veröffentlichen in Azure I die Anweisungen von https://learn.microsoft.com/en-us/azure/azure-functions/create-first-function-cli-python
die nötige Entwicklungsumgebung einzurichten. Dadurch konnte ich die Funktion über
veröffentlichen
func Azure functionapp veröffentlichen function-hekori-learning-002.
Ich habe Terraform verwendet, um die Azure-Ressourcen in der Region Nordeuropa einzurichten.
Hier ist ein Codeausschnitt, der den Code zeigt, der beim Besuch von https://function-hekori-learning-002.azurewebsites.net/api/polars/azure/read ausgeführt wird
@app.route(route="polars/azure/read", auth_level=func.AuthLevel.ANONYMOUS) def polars_azure_read(req: func.HttpRequest) -> func.HttpResponse: logging.info('Reading from delta table') tic = time.time() df = pl.read_delta(AZURE_STORAGE_PATH, storage_options=storage_options ) df = df.sql( "select sum(value) as sum, avg(value) as mean, count() as count, name from self group by name order by sum asc" ) toc = time.time() logging.info(f"Elapsed time {toc - tic:.2f} seconds") return func.HttpResponse( "Success from polars." + str(df) + '\n' + "Elapsed time " + str(toc - tic) + " seconds", status_code=200 )
Testergebnisse
Wie man sieht, ist das HP EliteBook in allen Szenarien etwa eine Größenordnung schneller.
Interpretation
Das ist meine persönliche Interpretation
- Die Azure-Funktionszeiten reichen für synchrone Aufgaben aus. Z. B. zur Verwendung in POST-Anfragen, bei denen der Client eine Antwort in
- Wenn Sie über kleine Datenmengen verfügen und die beste Leistung wünschen, sollten Sie in Betracht ziehen, Polars auf Bare-Metal oder einer virtuellen Maschine mit geringer E/A-Latenz auszuführen.
Bitte beachten Sie, dass die Delta-Tabelle eine kleine Größe von 3 Commits und 2 Parkettdateien hat. Das heißt, die Laufzeit misst effektiv den Overhead des Dateizugriffs von der Recheneinheit.
Wenn Sie diesen Artikel ❤️ und mehr Benchmark-Ergebnisse mit größeren Datensätzen für die Out-of-Core-Verarbeitung sehen möchten, geben Sie diesem Artikel ein ?
und abonnieren? zu meinem Kanal ???.
Das obige ist der detaillierte Inhalt vonPolars Delta Lake: Azure-Funktion vs. Laptop bei Small Data. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Die grundlegende Syntax für die Python -Liste ist die Liste [START: STOP: STEP]. 1.Start ist der erste Elementindex, 2.Stop ist der erste Elementindex, und 3.Step bestimmt die Schrittgröße zwischen den Elementen. Scheiben werden nicht nur zum Extrahieren von Daten verwendet, sondern auch zum Ändern und Umkehrlisten.

ListSoutPer -CharakterArraysin: 1) Dynamics und Dynamics und 3), 2) StoringHeterogenData und 3) MemoryefficiencyForSparsedata, ButmayHavesLightPerformanceCostIncustonTectorationOperationen.

Toconvertapythonarraytoalist, Usethelist () constructororageneratorexpression.1) ImportThearrayModuleandCreateanarray.2) Uselist (arr) oder [xForxinarr] Toconvertittoalist in Betracht, überlegt Performance undMoryefficiencyForlargedatasets.

ChoosearraySoverlistsinpythonforbetterperformanceAndMemoryefficienceInspezifizarios.1) largenumericalDatasets: ArraysReDucemoryusage.2) leistungskritische Operationen: ArraysOfferspeedboostsForsforsarching.3) TypeSafety: ArraysStety

In Python können Sie Verständnissen für Schleifen, Aufzählungen und Listen für durchqueren Listen verwenden. In Java können Sie traditionelle für Schleifen verwenden und für Schleifen zu durchqueren Arrays erweitert. 1. Python List Traversal Methods gehören: für Schleifen, Aufzählung und Listenverständnis. 2. Java Array Traversal -Methoden umfassen: traditionell für Schleife und erweitert für die Schleife.

In dem Artikel wird die in Version 3.10 eingeführte "Match" -serklärung von Python erörtert, die als Äquivalent zum Wechseln von Aussagen in anderen Sprachen dient. Es verbessert die Code-Lesbarkeit und bietet Leistungsvorteile gegenüber herkömmlichen IF-ELIF-EL

Ausnahmegruppen in Python 3.11 ermöglichen die gleichzeitige Behandlung mehrerer Ausnahmen, wodurch die Fehlermanagement in gleichzeitigen Szenarien und komplexen Vorgängen verbessert wird.

Funktionsanmerkungen in Python Fügen Sie Metadaten zu Funktionen für Typprüfungen, Dokumentation und IDE -Unterstützung hinzu. Sie verbessern die Lesbarkeit, die Wartung der Code und die API -Entwicklung, die Datenwissenschaft und die Erstellung der Bibliothek von entscheidender Bedeutung.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

PHPStorm Mac-Version
Das neueste (2018.2.1) professionelle, integrierte PHP-Entwicklungstool

EditPlus chinesische Crack-Version
Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

Herunterladen der Mac-Version des Atom-Editors
Der beliebteste Open-Source-Editor

Dreamweaver CS6
Visuelle Webentwicklungstools

MinGW – Minimalistisches GNU für Windows
Dieses Projekt wird derzeit auf osdn.net/projects/mingw migriert. Sie können uns dort weiterhin folgen. MinGW: Eine native Windows-Portierung der GNU Compiler Collection (GCC), frei verteilbare Importbibliotheken und Header-Dateien zum Erstellen nativer Windows-Anwendungen, einschließlich Erweiterungen der MSVC-Laufzeit zur Unterstützung der C99-Funktionalität. Die gesamte MinGW-Software kann auf 64-Bit-Windows-Plattformen ausgeführt werden.
