Maison  >  Article  >  développement back-end  >  Guide de démarrage rapide des fonctions couramment utilisées dans la bibliothèque pandas

Guide de démarrage rapide des fonctions couramment utilisées dans la bibliothèque pandas

WBOY
WBOYoriginal
2024-01-24 08:05:05852parcourir

Guide de démarrage rapide des fonctions couramment utilisées dans la bibliothèque pandas

La bibliothèque pandas est un outil de traitement et d'analyse de données couramment utilisé en Python. Elle fournit une multitude de fonctions et de méthodes qui peuvent facilement effectuer l'importation, le nettoyage, le traitement, l'analyse et la visualisation des données. Cet article présentera un guide de démarrage rapide des fonctions couramment utilisées dans la bibliothèque pandas, avec des exemples de code spécifiques. La bibliothèque

  1. Importation de données
    pandas peut facilement importer des fichiers de données dans différents formats via read_csv, read_excel et d'autres fonctions. Voici un exemple de code :
import pandas as pd

# 从csv文件中导入数据
data = pd.read_csv('data.csv')

# 从excel文件中导入数据
data = pd.read_excel('data.xlsx')
  1. Visualisation des données
    La bibliothèque pandas fournit des fonctions head, tail et d'autres fonctions pour afficher les première et dernière lignes de données. Voici un exemple de code :
# 查看数据的前5行
print(data.head())

# 查看数据的后5行
print(data.tail())
  1. Data Cleaning
    La bibliothèque pandas fournit des fonctions telles que dropna et fillna pour gérer les valeurs manquantes, ainsi que des fonctions telles que replace pour remplacer des valeurs spécifiques. Voici un exemple de code :
# 删除含有缺失值的行
data = data.dropna()

# 使用均值填充缺失值
data = data.fillna(data.mean())

# 将特定的值替换为其他值
data['column_name'] = data['column_name'].replace('old_value', 'new_value')
  1. Découpage et filtrage des données
    La bibliothèque pandas implémente le découpage et le filtrage des données via des fonctions telles que iloc et loc. Voici un exemple de code :
# 使用位置索引切片
subset = data.iloc[1:10, 2:5]

# 使用标签索引切片
subset = data.loc[data['column_name'] == 'value']

# 使用条件筛选
subset = data[data['column_name'] > 10]
  1. Tri et classement des données
    La bibliothèque pandas fournit des fonctions telles que sort_values ​​​​​​et sort_index pour implémenter des opérations de tri et de classement des données. Voici un exemple de code :
# 按列进行排序
data = data.sort_values('column_name')

# 按索引进行排序
data = data.sort_index()

# 对列进行排名
data['column_rank'] = data['column_name'].rank()
  1. Agrégation et calcul de données
    La bibliothèque pandas fournit des fonctions groupby, agg et autres pour implémenter l'agrégation et le calcul de données. Voici un exemple de code :
# 对列进行聚合操作
grouped_data = data.groupby('column_name').sum()

# 对多列进行聚合操作
grouped_data = data.groupby(['column_name1', 'column_name2']).mean()

# 对列进行自定义的聚合操作
aggregated_data = data.groupby('column_name').agg({'column_name': 'mean', 'column_name2': 'sum'})
  1. Visualisation des données
    La bibliothèque pandas fournit la fonction plot pour visualiser les données. Voici un exemple de code :
# 绘制折线图
data.plot(x='column_name', y='column_name2', kind='line')

# 绘制散点图
data.plot(x='column_name', y='column_name2', kind='scatter')

# 绘制柱状图
data.plot(x='column_name', y='column_name2', kind='bar')

Cet article présente brièvement plusieurs fonctions couramment utilisées dans la bibliothèque pandas, ainsi que les exemples de code spécifiques correspondants. En apprenant et en maîtrisant l'utilisation de ces fonctions, nous pouvons traiter et analyser les données plus efficacement. Bien entendu, la bibliothèque pandas possède des fonctions plus puissantes qui attendent que tout le monde les découvre et les applique. Si vous souhaitez en savoir plus sur la bibliothèque pandas, vous pouvez consulter la documentation officielle ou les didacticiels associés et des exemples de code.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn