Heim  >  Artikel  >  Backend-Entwicklung  >  Schneller Einstieg in Pandas: Eine schnelle Möglichkeit, diese Bibliothek zum Lesen von Excel-Dateien zu verwenden

Schneller Einstieg in Pandas: Eine schnelle Möglichkeit, diese Bibliothek zum Lesen von Excel-Dateien zu verwenden

WBOY
WBOYOriginal
2024-01-19 11:09:05916Durchsuche

Schneller Einstieg in Pandas: Eine schnelle Möglichkeit, diese Bibliothek zum Lesen von Excel-Dateien zu verwenden

pandas ist eine wichtige Datenanalysebibliothek in Python, die das Lesen, Bereinigen und Verarbeiten von Daten vereinfachen kann. Sie ist mittlerweile zum Standard für Datenanalysearbeiten geworden. Bei der Datenanalyse ist Excel häufig eine der Datenquellen. In diesem Artikel wird daher eine schnelle Methode zum Lesen von Excel-Dateien mithilfe von Pandas vorgestellt.

Mehrere Vorteile der Verwendung von Pandas zum Lesen von Excel-Dateien:

  1. Kann schnell große Mengen an Excel-Dateien lesen und verarbeiten.
  2. Dank der Effizienz und Flexibilität von Pandas unterstützt es verschiedene Arten von Datenoperationen, einschließlich, aber nicht beschränkt auf, Datenfilterung, Datenspleißung, Pivot-Tabellen, Datenvisualisierung usw.
  3. Durch die Verwendung von Pandas können wir die gelesenen Excel-Daten problemlos in verschiedene Arten von Ausgabedateien schreiben, z. B. CSV, SQL-Datenbanken usw.

Also, wie kann man Pandas zum Lesen von Excel-Dateien verwenden? Im Folgenden wird der gesamte Prozess vom Lesen von Excel-Dateien bis zur Datenbereinigung und -bearbeitung im Detail vorgestellt.

Zuerst müssen Sie die Pandas-Bibliothek und die zugehörigen abhängigen Bibliotheken installieren. Zur Installation können Sie die folgende Anweisung verwenden:

pip install pandas openpyxl

Nach der Installation der erforderlichen Bibliotheken können Sie Pandas direkt zum Lesen der Excel-Datei verwenden. Die Methode zum Lesen von Excel-Dateien mit Pandas ist flexibel. Sie können nur ein Blatt oder alle Blätter der Excel-Datei lesen. Gleichzeitig können Sie auch jede Spalte benennen, Datentypen definieren usw .

  1. Ein einzelnes Blatt lesen

Verwenden Sie die Funktion pandas.read_excel, um ein einzelnes Blatt aus einer Excel-Datei zu lesen. Wir haben beispielsweise eine Excel-Datei namens test. Wenn Sie alle Blätter in der Excel-Datei lesen müssen, können Sie den folgenden Code verwenden: pandas.read_excel函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
  1. 读取所有sheet

如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:

import pandas as pd

xls = pd.read_excel('test.xlsx', sheet_name=None)

将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。

可以使用xls.keys()来查看所有sheet的名称,以及使用xls.values()

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.rename(columns={'原列名':'新列名'}, inplace=True)

Setzen Sie den Parameter sheet_name auf „None“ und geben Sie dann ein Wörterbuch mit dem Blattnamen zurück der Schlüssel und DataFrame als Wert.
  1. Sie können xls.keys() verwenden, um die Namen aller Blätter anzuzeigen, und xls.values() verwenden, um den Inhalt aller Blätter anzuzeigen.

Spalten umbenennen

  1. In Pandas können wir den Vorgang vereinfachen, indem wir die Spalten im DataFrame umbenennen. Hier ist ein Beispiel für das Umbenennen einer Spalte in einer Excel-Datei. Der Beispielcode lautet wie folgt:
  2. import pandas as pd
    
    df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
    
    df.to_csv('output.csv')

Daten in eine Datei schreiben

Mit Pandas können Sie Daten in Excel-Dateien ganz einfach in verschiedene Dateitypen schreiben, einschließlich CSV , SQL-Datenbank usw.

Nehmen Sie als Beispiel das Schreiben von Daten aus einer Excel-Datei in eine CSV-Datei. Der Beispielcode lautet wie folgt:

rrreee

Speichern Sie die in Excel gelesenen Daten in einem DataFrame und verwenden Sie dann die to_csv-Funktion des DataFrame, um sie direkt zu schreiben Daten in die CSV-Datei. 🎜🎜Anhand der obigen Beispiele hoffe ich, dass jeder die Überlegenheit von Pandas beim Lesen und Verarbeiten von Excel-Daten verstehen und schnell mit dieser Bibliothek beginnen und diese Fähigkeit bei nachfolgenden Datenanalysearbeiten nutzen kann, um Daten elegant zu verarbeiten. 🎜

Das obige ist der detaillierte Inhalt vonSchneller Einstieg in Pandas: Eine schnelle Möglichkeit, diese Bibliothek zum Lesen von Excel-Dateien zu verwenden. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn