Heim  >  Artikel  >  Backend-Entwicklung  >  Pandas-Methode zum schnellen Lesen von Excel-Dateien

Pandas-Methode zum schnellen Lesen von Excel-Dateien

PHPz
PHPzOriginal
2024-01-24 08:29:131479Durchsuche

Pandas-Methode zum schnellen Lesen von Excel-Dateien

Einfache Möglichkeit, Excel-Dateien mit Pandas zu lesen

Bei der Datenanalyse und -verarbeitung ist es häufig erforderlich, Daten aus Excel-Dateien zu lesen und verschiedene Vorgänge auszuführen. Pandas ist eine leistungsstarke Python-Datenanalysebibliothek, die eine einfache und bequeme Möglichkeit zum Lesen von Excel-Dateien bietet. In diesem Artikel wird erläutert, wie Sie Pandas zum Lesen von Excel-Dateien verwenden, und es werden spezifische Codebeispiele bereitgestellt.

Bevor Sie beginnen, stellen Sie sicher, dass Sie die Pandas-Bibliothek installiert haben. Pandas können mit dem folgenden Code installiert werden:

pip install pandas

Als nächstes gehen wir davon aus, dass es eine Excel-Datei mit dem Namen „example.xlsx“ gibt, die ein Arbeitsblatt mit dem Namen „Sheet1“ enthält. Dieses Arbeitsblatt enthält einige Daten, darunter Name, Alter und Geschlecht. Wir werden Daten aus dieser Excel-Datei lesen.

Zuerst importieren wir die Pandas-Bibliothek und lesen die Excel-Datei:

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

Im obigen Code verwenden wir die Funktion read_excel, um die Excel-Datei zu lesen. Unter diesen ist example.xlsx der Dateiname der zu lesenden Excel-Datei und sheet_name='Sheet1' der Name des zu lesenden Arbeitsblatts. Wenn der Parameter sheet_name nicht angegeben ist, wird standardmäßig das erste Arbeitsblatt gelesen. read_excel函数来读取Excel文件。其中,example.xlsx是要读取的Excel文件的文件名,sheet_name='Sheet1'是要读取的工作表的名称。如果不指定sheet_name参数,则默认读取第一个工作表。

读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。

现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。

  1. 查看前几行的数据:

    print(df.head())
  2. 获取某列的数据:

    name_column = df['姓名']
    print(name_column)
  3. 筛选数据:

    filtered_data = df[df['年龄'] > 30]
    print(filtered_data)

上面的代码中,df.head()将显示DataFrame的前几行数据,默认显示前5行。df['姓名']将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]将根据"年龄"列的条件筛选出符合条件的数据。

除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:

  1. 将DataFrame写入Excel文件:

    df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)

    上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False以不包含行索引。

  2. 添加新的工作表到现有的Excel文件:

    with pd.ExcelWriter('example.xlsx', mode='a') as writer:
     df.to_excel(writer, sheet_name='Sheet2', index=False)

    上面的代码使用pd.ExcelWriter将DataFrame写入到现有的Excel文件中,并设置mode='a'以追加写入。df.to_excel()

    Nach dem Lesen der Excel-Datei speichert Pandas die Daten in der Variablen df in Form eines DataFrame. Ein DataFrame ist ein zweidimensionales Array von Beschriftungen, ähnlich einer Tabelle in Excel. Der Name jeder Spalte wird als Spaltenbezeichnung bezeichnet, und der Index jeder Zeile wird als Zeilenbezeichnung bezeichnet.
Jetzt können wir verschiedene Vorgänge an den gelesenen Daten durchführen, z. B. die Daten der ersten paar Zeilen anzeigen, die Daten einer bestimmten Spalte abrufen, die Daten filtern usw.

  1. Sehen Sie sich die Daten der ersten paar Zeilen an: 🎜rrreee🎜
  2. 🎜Holen Sie sich die Daten einer bestimmten Spalte: 🎜rrreee🎜
  3. 🎜Filtern Sie die Daten: 🎜rrreee🎜🎜🎜Im Im obigen Code zeigt df.head() die ersten paar Zeilen der DataFrame-Daten an, und die ersten 5 Zeilen werden standardmäßig angezeigt. df['Name'] ruft die Daten für die Spalte mit dem Namen „Name“ ab, während df['Age'] > 30] die Daten basierend auf dieser Spalte erhält Bei „Alter“-Spaltenbedingungen werden Daten herausgefiltert, die die Bedingungen erfüllen. 🎜🎜Neben dem Lesen von Excel-Dateien bietet Pandas auch einige andere Methoden zum Verarbeiten von Excel-Dateien, z. B. das Schreiben von Daten in Excel-Dateien, das Hinzufügen neuer Arbeitsblätter usw. Im Folgenden sind einige häufig verwendete Methoden aufgeführt: 🎜
    1. 🎜DataFrame in Excel-Datei schreiben:🎜rrreee🎜Der obige Code schreibt DataFrame in das Arbeitsblatt mit dem Namen „Sheet2“ in der Datei „output.xlsx“ und legt index=False, um den Zeilenindex nicht einzuschließen. 🎜🎜
    2. 🎜Fügen Sie ein neues Arbeitsblatt zu einer vorhandenen Excel-Datei hinzu: 🎜rrreee🎜Der obige Code verwendet pd.ExcelWriter, um einen DataFrame in eine vorhandene Excel-Datei zu schreiben und legt mode=' fest. a' zum Anhängen des Schreibens. Die Methode df.to_excel() schreibt den DataFrame in das Arbeitsblatt „Sheet2“. 🎜🎜🎜🎜Durch die Verwendung von Pandas können wir Excel-Dateien einfach lesen und verarbeiten und verschiedene Vorgänge ausführen, um die Datenanalyse und -verarbeitung effizienter und bequemer zu gestalten. Das Obige ist die Einführung und der Beispielcode einer einfachen Methode zum Lesen von Excel-Dateien mit Pandas. Hoffe das hilft! 🎜

Das obige ist der detaillierte Inhalt vonPandas-Methode zum schnellen Lesen von Excel-Dateien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn