Heim > Artikel > Backend-Entwicklung > Pandas-Methode zum schnellen Lesen von Excel-Dateien
Einfache Möglichkeit, Excel-Dateien mit Pandas zu lesen
Bei der Datenanalyse und -verarbeitung ist es häufig erforderlich, Daten aus Excel-Dateien zu lesen und verschiedene Vorgänge auszuführen. Pandas ist eine leistungsstarke Python-Datenanalysebibliothek, die eine einfache und bequeme Möglichkeit zum Lesen von Excel-Dateien bietet. In diesem Artikel wird erläutert, wie Sie Pandas zum Lesen von Excel-Dateien verwenden, und es werden spezifische Codebeispiele bereitgestellt.
Bevor Sie beginnen, stellen Sie sicher, dass Sie die Pandas-Bibliothek installiert haben. Pandas können mit dem folgenden Code installiert werden:
pip install pandas
Als nächstes gehen wir davon aus, dass es eine Excel-Datei mit dem Namen „example.xlsx“ gibt, die ein Arbeitsblatt mit dem Namen „Sheet1“ enthält. Dieses Arbeitsblatt enthält einige Daten, darunter Name, Alter und Geschlecht. Wir werden Daten aus dieser Excel-Datei lesen.
Zuerst importieren wir die Pandas-Bibliothek und lesen die Excel-Datei:
import pandas as pd df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
Im obigen Code verwenden wir die Funktion read_excel
, um die Excel-Datei zu lesen. Unter diesen ist example.xlsx
der Dateiname der zu lesenden Excel-Datei und sheet_name='Sheet1'
der Name des zu lesenden Arbeitsblatts. Wenn der Parameter sheet_name
nicht angegeben ist, wird standardmäßig das erste Arbeitsblatt gelesen. read_excel
函数来读取Excel文件。其中,example.xlsx
是要读取的Excel文件的文件名,sheet_name='Sheet1'
是要读取的工作表的名称。如果不指定sheet_name
参数,则默认读取第一个工作表。
读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df
中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。
现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。
查看前几行的数据:
print(df.head())
获取某列的数据:
name_column = df['姓名'] print(name_column)
筛选数据:
filtered_data = df[df['年龄'] > 30] print(filtered_data)
上面的代码中,df.head()
将显示DataFrame的前几行数据,默认显示前5行。df['姓名']
将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]
将根据"年龄"列的条件筛选出符合条件的数据。
除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:
将DataFrame写入Excel文件:
df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)
上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False
以不包含行索引。
添加新的工作表到现有的Excel文件:
with pd.ExcelWriter('example.xlsx', mode='a') as writer: df.to_excel(writer, sheet_name='Sheet2', index=False)
上面的代码使用pd.ExcelWriter
将DataFrame写入到现有的Excel文件中,并设置mode='a'
以追加写入。df.to_excel()
df
in Form eines DataFrame. Ein DataFrame ist ein zweidimensionales Array von Beschriftungen, ähnlich einer Tabelle in Excel. Der Name jeder Spalte wird als Spaltenbezeichnung bezeichnet, und der Index jeder Zeile wird als Zeilenbezeichnung bezeichnet. df.head()
die ersten paar Zeilen der DataFrame-Daten an, und die ersten 5 Zeilen werden standardmäßig angezeigt. df['Name']
ruft die Daten für die Spalte mit dem Namen „Name“ ab, während df['Age'] > 30]
die Daten basierend auf dieser Spalte erhält Bei „Alter“-Spaltenbedingungen werden Daten herausgefiltert, die die Bedingungen erfüllen. 🎜🎜Neben dem Lesen von Excel-Dateien bietet Pandas auch einige andere Methoden zum Verarbeiten von Excel-Dateien, z. B. das Schreiben von Daten in Excel-Dateien, das Hinzufügen neuer Arbeitsblätter usw. Im Folgenden sind einige häufig verwendete Methoden aufgeführt: 🎜index=False
, um den Zeilenindex nicht einzuschließen. 🎜🎜pd.ExcelWriter
, um einen DataFrame in eine vorhandene Excel-Datei zu schreiben und legt mode=' fest. a' zum Anhängen des Schreibens. Die Methode df.to_excel()
schreibt den DataFrame in das Arbeitsblatt „Sheet2“. 🎜🎜🎜🎜Durch die Verwendung von Pandas können wir Excel-Dateien einfach lesen und verarbeiten und verschiedene Vorgänge ausführen, um die Datenanalyse und -verarbeitung effizienter und bequemer zu gestalten. Das Obige ist die Einführung und der Beispielcode einer einfachen Methode zum Lesen von Excel-Dateien mit Pandas. Hoffe das hilft! 🎜Das obige ist der detaillierte Inhalt vonPandas-Methode zum schnellen Lesen von Excel-Dateien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!