Heim  >  Artikel  >  Backend-Entwicklung  >  Mit Pandas können Sie problemlos große Mengen an Excel-Daten lesen und verarbeiten

Mit Pandas können Sie problemlos große Mengen an Excel-Daten lesen und verarbeiten

WBOY
WBOYOriginal
2024-01-24 08:42:06641Durchsuche

Mit Pandas können Sie problemlos große Mengen an Excel-Daten lesen und verarbeiten

Titel: Verwenden Sie Pandas, um Excel-Dateien zu lesen und große Datenmengen einfach zu verarbeiten.

Einführung: Pandas ist ein leistungsstarkes Python-Datenverarbeitungstool, das große Datenmengen problemlos lesen und verarbeiten kann. In diesem Artikel wird die Verwendung der Pandas-Bibliothek zum Lesen von Excel-Dateien vorgestellt und spezifische Codebeispiele gegeben.

1. Installieren Sie die Pandas-Bibliothek

Bevor wir beginnen, müssen wir zuerst die Pandas-Bibliothek installieren. Sie können den folgenden Befehl verwenden, um Pandas zu installieren:

pip install pandas

2. Importieren Sie die Pandas-Bibliothek und die Excel-Datei

Bevor wir Pandas verwenden können, müssen wir die Pandas-Bibliothek importieren. Zum Importieren können Sie den folgenden Befehl verwenden:

import pandas as pd

Als nächstes können wir die Funktion read_excel von Pandas verwenden, um die Excel-Datei zu lesen. Das Folgende ist ein konkretes Codebeispiel: read_excel函数来读取Excel文件。以下是具体的代码示例:

df = pd.read_excel('data.xlsx')

其中,data.xlsx是我们要读取的Excel文件名。

三、数据处理示例

在成功读取Excel文件后,我们就可以使用Pandas提供的各种功能来处理数据了。以下是一些常用的数据处理示例:

  1. 查看数据:可以使用head方法来查看前几行的数据,默认显示前5行。
df.head()
  1. 数据筛选:可以使用条件表达式来筛选数据。以下示例筛选出“年龄”大于等于18岁的数据。
adults = df[df['年龄'] >= 18]
  1. 计算统计指标:可以使用describe方法来计算数据的统计指标,如均值、标准差、最小值、最大值等。
statistics = df.describe()
  1. 排序数据:可以使用sort_values方法来对数据进行排序。以下示例按照“年龄”从小到大排序。
sorted_df = df.sort_values(by='年龄')
  1. 数据分组:可以使用groupby方法来对数据进行分组,并进行聚合计算。以下示例按照“性别”分组,并计算每组的平均年龄。
grouped_data = df.groupby('性别')['年龄'].mean()
  1. 数据可视化:Pandas可以结合Matplotlib或其他绘图库进行数据可视化。以下示例使用Matplotlib绘制柱状图。
import matplotlib.pyplot as plt

df['年龄'].plot(kind='hist')
plt.show()

四、保存处理后的数据

在进行数据处理后,我们可以使用Pandas提供的方法将处理后的数据保存到Excel文件中。以下是具体的代码示例,将数据保存到output.xlsx文件中:

df.to_excel('output.xlsx', index=False)

其中,index=Falserrreee

Unter anderem ist data.xlsx der Name der Excel-Datei, die wir lesen möchten.

3. Beispiel für die Datenverarbeitung

Nachdem wir die Excel-Datei erfolgreich gelesen haben, können wir die verschiedenen von Pandas bereitgestellten Funktionen zur Verarbeitung der Daten verwenden. Im Folgenden finden Sie einige gängige Beispiele für die Datenverarbeitung: 🎜
  1. Daten anzeigen: Sie können die Methode head verwenden, um die ersten Datenzeilen anzuzeigen. Die ersten 5 Zeilen werden standardmäßig angezeigt.
rrreee
  1. Datenfilterung: Sie können bedingte Ausdrücke verwenden, um Daten zu filtern. Das folgende Beispiel filtert Daten heraus, deren „Alter“ größer oder gleich 18 Jahre ist.
rrreee
  1. Statistische Indikatoren berechnen: Sie können die Methode describe verwenden, um statistische Indikatoren der Daten zu berechnen, z. B. Mittelwert, Standard Abweichung, Minimalwert, Maximalwert usw.
rrreee
  1. Daten sortieren: Sie können die Methode sort_values verwenden, um die Daten zu sortieren. Die folgenden Beispiele sind nach „Alter“ vom kleinsten zum größten sortiert.
rrreee
  1. Datengruppierung: Sie können die Methode groupby verwenden, um Daten zu gruppieren und Aggregationsberechnungen durchzuführen. Das folgende Beispiel gruppiert nach Geschlecht und berechnet das Durchschnittsalter jeder Gruppe.
rrreee
  1. Datenvisualisierung: Pandas kann mit Matplotlib oder anderen Zeichenbibliotheken zur Datenvisualisierung kombiniert werden. Im folgenden Beispiel wird Matplotlib zum Zeichnen eines Histogramms verwendet.
rrreee🎜4. Speichern Sie die verarbeiteten Daten🎜🎜Nach der Datenverarbeitung können wir die von Pandas bereitgestellte Methode verwenden, um die verarbeiteten Daten in einer Excel-Datei zu speichern. Das Folgende ist ein spezifisches Codebeispiel zum Speichern von Daten in der Datei output.xlsx: 🎜rrreee🎜 Unter anderem bedeutet index=False, dass die Indexspalte nicht gespeichert wird. 🎜🎜Fazit: 🎜🎜In diesem Artikel wird erläutert, wie Sie mit der Pandas-Bibliothek Excel-Dateien lesen und Daten verarbeiten können, und es werden konkrete Codebeispiele aufgeführt. Die leistungsstarken Funktionen von Pandas können uns dabei helfen, große Datenmengen problemlos zu verarbeiten und die Effizienz der Datenanalyse und -verarbeitung zu verbessern. Ich hoffe, dieser Artikel hilft Ihnen beim Erlernen und Verwenden von Pandas. 🎜

Das obige ist der detaillierte Inhalt vonMit Pandas können Sie problemlos große Mengen an Excel-Daten lesen und verarbeiten. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn