Heim > Artikel > Backend-Entwicklung > So lesen Sie Excel-Dateien mit Pandas
Schritte für Pandas zum Lesen von Excel-Dateien: 1. Stellen Sie sicher, dass die Pandas-Bibliothek installiert ist. 2. Importieren Sie die Pandas-Bibliothek und andere möglicherweise benötigte Bibliotheken. 3. Verwenden Sie die Funktion „read_excel()“ von Pandas, um die Excel-Datei zu lesen 4. Bearbeiten und analysieren Sie Daten, z. B. Anzeigen der ersten Datenzeilen, Anzeigen grundlegender Datenstatistiken, Auswählen bestimmter Spalten, Filtern, Sortieren von Daten, Gruppieren und Aggregieren von Daten, Visualisieren von Daten und mehr.
Das Betriebssystem dieses Tutorials: Windows 10-System, Python-Version 3.11.4, Dell G3-Computer.
Pandas ist eine leistungsstarke Datenverarbeitungsbibliothek, mit der verschiedene Arten von Daten, einschließlich Excel-Dateien, gelesen, analysiert und verarbeitet werden können. In diesem Artikel werde ich beantworten, wie man Excel-Dateien mit Pandas liest, und den entsprechenden Code erläutern.
Zuerst müssen wir sicherstellen, dass die Pandas-Bibliothek installiert ist. Pandas kann mit dem folgenden Befehl in einer Python-Umgebung installiert werden:
pip install pandas
Als nächstes müssen wir die Pandas-Bibliothek und andere möglicherweise benötigte Bibliotheken importieren:
import pandas as pd
Jetzt können wir die Funktion read_excel() von Pandas verwenden, um Excel zu lesen Datei. Das Folgende ist ein Beispielcode:
df = pd.read_excel('example.xlsx')
Im obigen Code akzeptiert die Funktion read_excel() einen Parameter, nämlich den Pfad zur Excel-Datei. Dadurch wird ein Pandas DataFrame-Objekt mit dem Namen df zurückgegeben, das die Daten aus der Excel-Datei enthält.
Zusätzlich zum Dateipfad verfügt die Funktion read_excel() über weitere optionale Parameter, mit denen das spezifische Arbeitsblatt, das gelesen werden soll, die Anzahl der zu überspringenden Zeilen, die zu analysierenden Spalten usw. angegeben werden können. Beispiel:
df = pd.read_excel('example.xlsx', sheet_name='Sheet1', skiprows=2, usecols='A:C')
Im obigen Code gibt der Parameter „sheet_name“ den Namen des zu lesenden Arbeitsblatts an, der Parameter „skiprows“ gibt die Anzahl der zu überspringenden Zeilen an und der Parameter „usecols“ gibt den zu analysierenden Spaltenbereich an.
Nachdem wir die Excel-Datei gelesen haben, können wir verschiedene von Pandas bereitgestellte Funktionen und Methoden verwenden, um die Daten zu bearbeiten und zu analysieren. Hier sind einige gängige Beispiele für Vorgänge:
Sehen Sie sich die ersten paar Zeilen Ihrer Daten an:
df.head()
Sehen Sie grundlegende Statistiken Ihrer Daten an:
df.describe()
Wählen Sie bestimmte Spalten aus:
df['Column1']
Filter:
df[df['Column1'] > 10]
Sortieren Sie die Daten:
df.sort_values('Column1', ascending=False)
Gruppieren und aggregieren Sie die Daten:
df.groupby('Column1').mean()
Visualisieren Sie die Daten:
df.plot(x='Column1', y='Column2', kind='scatter')
Spalte1 und Spalte2 im obigen Code sind die Spaltennamen in der Excel-Datei, die Sie ersetzen können je nach tatsächlicher Situation.
Zusammenfassend umfassen die grundlegenden Schritte für die Verwendung von Pandas zum Lesen von Excel-Dateien das Importieren der Bibliothek, die Verwendung der Funktion read_excel() zum Lesen der Datei sowie das Bearbeiten und Analysieren der Daten. Durch diese Vorgänge können wir Daten in Excel-Dateien einfach lesen und verarbeiten und weitere Analysen und Visualisierung durchführen.
Das obige ist der detaillierte Inhalt vonSo lesen Sie Excel-Dateien mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!