Heim  >  Artikel  >  Backend-Entwicklung  >  Kurzanleitung zu häufig verwendeten Funktionen in der Pandas-Bibliothek

Kurzanleitung zu häufig verwendeten Funktionen in der Pandas-Bibliothek

WBOY
WBOYOriginal
2024-01-24 08:05:05898Durchsuche

Kurzanleitung zu häufig verwendeten Funktionen in der Pandas-Bibliothek

Die Pandas-Bibliothek ist ein häufig verwendetes Datenverarbeitungs- und Analysetool in Python. Sie bietet eine Fülle von Funktionen und Methoden, mit denen sich der Datenimport, die Bereinigung, die Verarbeitung, die Analyse und die Visualisierung problemlos durchführen lassen. In diesem Artikel wird eine Kurzanleitung für häufig verwendete Funktionen in der Pandas-Bibliothek mit spezifischen Codebeispielen vorgestellt.

  1. Datenimport
    Die Pandas-Bibliothek kann problemlos Datendateien in verschiedenen Formaten über read_csv, read_excel und andere Funktionen importieren. Das Folgende ist ein Beispielcode:
import pandas as pd

# 从csv文件中导入数据
data = pd.read_csv('data.csv')

# 从excel文件中导入数据
data = pd.read_excel('data.xlsx')
  1. Datenanzeige
    Die Pandas-Bibliothek bietet Kopf-, Schwanz- und andere Funktionen zum Anzeigen der ersten und letzten Datenzeilen. Das Folgende ist ein Beispielcode:
# 查看数据的前5行
print(data.head())

# 查看数据的后5行
print(data.tail())
  1. Datenbereinigung
    Die Pandas-Bibliothek bietet Funktionen wie „dropna“ und „fillna“ zur Behandlung fehlender Werte sowie Funktionen wie „replace“, um bestimmte Werte zu ersetzen. Das Folgende ist ein Beispielcode:
# 删除含有缺失值的行
data = data.dropna()

# 使用均值填充缺失值
data = data.fillna(data.mean())

# 将特定的值替换为其他值
data['column_name'] = data['column_name'].replace('old_value', 'new_value')
  1. Daten-Slicing und -Filterung
    Die Pandas-Bibliothek implementiert das Daten-Slicing und -Filtern durch Funktionen wie iloc und loc. Das Folgende ist ein Beispielcode:
# 使用位置索引切片
subset = data.iloc[1:10, 2:5]

# 使用标签索引切片
subset = data.loc[data['column_name'] == 'value']

# 使用条件筛选
subset = data[data['column_name'] > 10]
  1. Datensortierung und -ranking
    Die Pandas-Bibliothek bietet Funktionen wie sort_values ​​​​und sort_index, um Datensortierungs- und -rankingoperationen zu implementieren. Das Folgende ist ein Beispielcode:
# 按列进行排序
data = data.sort_values('column_name')

# 按索引进行排序
data = data.sort_index()

# 对列进行排名
data['column_rank'] = data['column_name'].rank()
  1. Datenaggregation und -berechnung
    Die Pandas-Bibliothek bietet Groupby-, Agg- und andere Funktionen zur Implementierung der Datenaggregation und -berechnung. Das Folgende ist ein Beispielcode:
# 对列进行聚合操作
grouped_data = data.groupby('column_name').sum()

# 对多列进行聚合操作
grouped_data = data.groupby(['column_name1', 'column_name2']).mean()

# 对列进行自定义的聚合操作
aggregated_data = data.groupby('column_name').agg({'column_name': 'mean', 'column_name2': 'sum'})
  1. Datenvisualisierung
    Die Pandas-Bibliothek bietet die Plotfunktion zur Visualisierung von Daten. Das Folgende ist ein Beispielcode:
# 绘制折线图
data.plot(x='column_name', y='column_name2', kind='line')

# 绘制散点图
data.plot(x='column_name', y='column_name2', kind='scatter')

# 绘制柱状图
data.plot(x='column_name', y='column_name2', kind='bar')

In diesem Artikel werden einige häufig verwendete Funktionen in der Pandas-Bibliothek sowie die entsprechenden spezifischen Codebeispiele kurz vorgestellt. Indem wir die Verwendung dieser Funktionen erlernen und beherrschen, können wir Daten effizienter verarbeiten und analysieren. Natürlich verfügt die Pandas-Bibliothek über leistungsfähigere Funktionen, die darauf warten, dass jeder sie entdeckt und anwendet. Wenn Sie mehr über die Pandas-Bibliothek erfahren möchten, können Sie sich die offizielle Dokumentation oder zugehörige Tutorials und Beispielcode ansehen.

Das obige ist der detaillierte Inhalt vonKurzanleitung zu häufig verwendeten Funktionen in der Pandas-Bibliothek. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn