Maison >développement back-end >Tutoriel Python >Lisez et traitez facilement de grandes quantités de données Excel avec Pandas

Lisez et traitez facilement de grandes quantités de données Excel avec Pandas

WBOY
WBOYoriginal
2024-01-24 08:42:06657parcourir

Lisez et traitez facilement de grandes quantités de données Excel avec Pandas

Titre : Utilisez Pandas pour lire des fichiers Excel et traiter facilement de grandes quantités de données

Introduction : Pandas est un puissant outil de traitement de données Python qui peut facilement lire et traiter de grandes quantités de données. Cet article explique comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et donne des exemples de code spécifiques.

1. Installez la bibliothèque Pandas

Avant de commencer, nous devons d'abord installer la bibliothèque Pandas. Vous pouvez utiliser la commande suivante pour installer Pandas :

pip install pandas

2. Importez la bibliothèque Pandas et le fichier Excel

Avant de commencer à utiliser Pandas, nous devons importer la bibliothèque Pandas. Vous pouvez utiliser la commande suivante pour importer :

import pandas as pd

Ensuite, nous pouvons utiliser la fonction read_excel de Pandas pour lire le fichier Excel. Voici un exemple de code spécifique : read_excel函数来读取Excel文件。以下是具体的代码示例:

df = pd.read_excel('data.xlsx')

其中,data.xlsx是我们要读取的Excel文件名。

三、数据处理示例

在成功读取Excel文件后,我们就可以使用Pandas提供的各种功能来处理数据了。以下是一些常用的数据处理示例:

  1. 查看数据:可以使用head方法来查看前几行的数据,默认显示前5行。
df.head()
  1. 数据筛选:可以使用条件表达式来筛选数据。以下示例筛选出“年龄”大于等于18岁的数据。
adults = df[df['年龄'] >= 18]
  1. 计算统计指标:可以使用describe方法来计算数据的统计指标,如均值、标准差、最小值、最大值等。
statistics = df.describe()
  1. 排序数据:可以使用sort_values方法来对数据进行排序。以下示例按照“年龄”从小到大排序。
sorted_df = df.sort_values(by='年龄')
  1. 数据分组:可以使用groupby方法来对数据进行分组,并进行聚合计算。以下示例按照“性别”分组,并计算每组的平均年龄。
grouped_data = df.groupby('性别')['年龄'].mean()
  1. 数据可视化:Pandas可以结合Matplotlib或其他绘图库进行数据可视化。以下示例使用Matplotlib绘制柱状图。
import matplotlib.pyplot as plt

df['年龄'].plot(kind='hist')
plt.show()

四、保存处理后的数据

在进行数据处理后,我们可以使用Pandas提供的方法将处理后的数据保存到Excel文件中。以下是具体的代码示例,将数据保存到output.xlsx文件中:

df.to_excel('output.xlsx', index=False)

其中,index=Falserrreee

Parmi eux, data.xlsx est le nom du fichier Excel que nous voulons lire.

3. Exemple de traitement des données

Après avoir lu avec succès le fichier Excel, nous pouvons utiliser les différentes fonctions fournies par Pandas pour traiter les données. Voici quelques exemples courants de traitement de données : 🎜
  1. Afficher les données : vous pouvez utiliser la méthode head pour afficher les premières lignes de données. Les 5 premières lignes sont affichées par défaut.
rrreee
  1. Filtrage des données : vous pouvez utiliser des expressions conditionnelles pour filtrer les données. L'exemple suivant filtre les données dont l'âge est supérieur ou égal à 18 ans.
rrreee
  1. Calculer des indicateurs statistiques : vous pouvez utiliser la méthode describe pour calculer des indicateurs statistiques des données, tels que la moyenne, la norme écart, valeur minimale, valeur maximale, etc.
rrreee
  1. Trier les données : vous pouvez utiliser la méthode sort_values pour trier les données. Les exemples suivants sont triés par « âge » du plus petit au plus grand.
rrreee
  1. Regroupement de données : vous pouvez utiliser la méthode groupby pour regrouper les données et effectuer des calculs d'agrégation. L'exemple suivant regroupe par sexe et calcule l'âge moyen de chaque groupe.
rrreee
  1. Visualisation des données : les pandas peuvent être combinés avec Matplotlib ou d'autres bibliothèques de dessins pour la visualisation des données. L'exemple suivant utilise Matplotlib pour dessiner un histogramme.
rrreee🎜4. Enregistrez les données traitées🎜🎜Après le traitement des données, nous pouvons utiliser la méthode fournie par Pandas pour enregistrer les données traitées dans un fichier Excel. Voici un exemple de code spécifique pour enregistrer les données dans le fichier output.xlsx : 🎜rrreee🎜 Parmi eux, index=False signifie ne pas enregistrer la colonne d'index. 🎜🎜Conclusion : 🎜🎜Cet article explique comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et effectuer un traitement de données, et donne des exemples de code spécifiques. Les fonctions puissantes de Pandas peuvent nous aider à traiter facilement de grandes quantités de données et à améliorer l'efficacité de l'analyse et du traitement des données. J'espère que cet article vous aidera à apprendre et à utiliser Pandas. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn