Heim >Backend-Entwicklung >Python-Tutorial >Verwenden Sie Pandas, um Excel-Dateien zu lesen und Datenimport und -analyse einfach zu implementieren

Verwenden Sie Pandas, um Excel-Dateien zu lesen und Datenimport und -analyse einfach zu implementieren

PHPz
PHPzOriginal
2024-01-19 10:02:061341Durchsuche

Verwenden Sie Pandas, um Excel-Dateien zu lesen und Datenimport und -analyse einfach zu implementieren

Verwenden Sie Pandas, um Excel-Dateien zu lesen und Datenimport und -analyse einfach zu implementieren.

Pandas ist ein leistungsstarkes Tool zur Datenanalyse in Python. Es kann Daten in verschiedenen Formaten flexibel und effizient verarbeiten. Bei der Datenanalyse ist Excel ein häufig verwendetes Datenformat, und Pandas bietet eine praktische Schnittstelle, mit der wir Excel-Dateien schnell in Daten importieren und die Daten analysieren und verarbeiten können.

In diesem Artikel wird erläutert, wie Sie die Pandas-Bibliothek zum Lesen von Excel-Dateien verwenden und wie Sie Pandas für die Datenanalyse verwenden. Außerdem werden Codebeispiele bereitgestellt.

1. Excel-Dateien lesen
Um Excel-Dateien zu lesen, können Sie die von Pandas bereitgestellte Funktion read_excel verwenden, die Excel-Dateien direkt lesen und in DataFrame-Datentypen konvertieren kann. Das Folgende ist ein Codebeispiel zum Lesen einer Excel-Datei:

import pandas as pd

# 读取Excel文件
filename = 'data.xlsx'
df = pd.read_excel(filename)

# 查看数据前5行
print(df.head())

Im obigen Code haben wir zuerst die Pandas-Bibliothek importiert und den Alias ​​als pd angegeben. Verwenden Sie dann die Funktion pd.read_excel, um die Datei data.xlsx zu lesen und die gelesenen Daten in einem DataFrame namens df zu speichern. Verwenden Sie abschließend die Head-Methode, um die ersten fünf Datenzeilen anzuzeigen.

2. Datenanalyse

  1. Datenvorverarbeitung
    Nach dem Datenimport müssen wir eine Datenvorverarbeitung durchführen. Die Datenvorverarbeitung umfasst Vorgänge wie das Bereinigen von Daten, das Auffüllen fehlender Werte, die Deduplizierung und das Konvertieren von Datentypen. Das Folgende ist ein Beispielcode für die Datenvorverarbeitung:
# 删除含有缺失值的行
df = df.dropna()

# 删除重复行
df = df.drop_duplicates()

# 转换数据类型为float
df['column1'] = df['column1'].astype(float)

# 查看数据信息
print(df.info())

Im obigen Code verwenden wir zunächst die Methode dropna, um alle Zeilen mit fehlenden Werten zu löschen, und verwenden dann die Methode drop_duplicates, um doppelte Zeilen zu löschen. Als nächstes verwenden Sie die Methode astype, um den Datentyp von Spalte1 in den Typ float zu konvertieren. Verwenden Sie abschließend die Info-Methode, um die Dateninformationen anzuzeigen.

  1. Statistische Analyse

Statistische Analyse ist einer der wichtigsten Schritte in der Datenanalyse. Pandas bietet eine Vielzahl von Methoden zur statistischen Analyse von Daten.

Das Folgende ist ein Beispielcode für die Datenanalyse:

# 计算各列的平均值、标准差、最大/最小值
print(df.mean())
print(df.std())
print(df.max())
print(df.min())

# 按照一列的值进行分组,并计算每组中数据的平均值
print(df.groupby('column1').mean())

# 绘制柱状图
df['column1'].plot(kind='bar')

Im obigen Code verwenden wir Mittelwert, Standard, Max und Min, um den Mittelwert, die Standardabweichung und die Maximal-/Minimalwerte jeder Spalte zu berechnen. Verwenden Sie dann die Methode „groupby“, um nach dem Wert von Spalte 1 zu gruppieren und den Durchschnitt der Daten in jeder Gruppe zu berechnen. Verwenden Sie abschließend die Plot-Methode, um ein Histogramm zu zeichnen.

3. Zusammenfassung
In diesem Artikel wird erläutert, wie Sie mit Pandas Excel-Dateien lesen und die Daten verarbeiten und analysieren. Pandas bietet viele praktische Vorgänge, um die Datenanalyse einfacher und effizienter zu gestalten. Für Datenanalyse- und Mining-Arbeiten wird das Erlernen von Pandas sehr nützlich sein.

Das obige ist der detaillierte Inhalt vonVerwenden Sie Pandas, um Excel-Dateien zu lesen und Datenimport und -analyse einfach zu implementieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn