Maison >développement back-end >Tutoriel Python >Lisez et traitez facilement de grandes quantités de données Excel avec Pandas
Titre : Utilisez Pandas pour lire des fichiers Excel et traiter facilement de grandes quantités de données
Introduction : Pandas est un puissant outil de traitement de données Python qui peut facilement lire et traiter de grandes quantités de données. Cet article explique comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et donne des exemples de code spécifiques.
1. Installez la bibliothèque Pandas
Avant de commencer, nous devons d'abord installer la bibliothèque Pandas. Vous pouvez utiliser la commande suivante pour installer Pandas :
pip install pandas
2. Importez la bibliothèque Pandas et le fichier Excel
Avant de commencer à utiliser Pandas, nous devons importer la bibliothèque Pandas. Vous pouvez utiliser la commande suivante pour importer :
import pandas as pd
Ensuite, nous pouvons utiliser la fonction read_excel
de Pandas pour lire le fichier Excel. Voici un exemple de code spécifique : read_excel
函数来读取Excel文件。以下是具体的代码示例:
df = pd.read_excel('data.xlsx')
其中,data.xlsx
是我们要读取的Excel文件名。
三、数据处理示例
在成功读取Excel文件后,我们就可以使用Pandas提供的各种功能来处理数据了。以下是一些常用的数据处理示例:
head
方法来查看前几行的数据,默认显示前5行。df.head()
adults = df[df['年龄'] >= 18]
describe
方法来计算数据的统计指标,如均值、标准差、最小值、最大值等。statistics = df.describe()
sort_values
方法来对数据进行排序。以下示例按照“年龄”从小到大排序。sorted_df = df.sort_values(by='年龄')
groupby
方法来对数据进行分组,并进行聚合计算。以下示例按照“性别”分组,并计算每组的平均年龄。grouped_data = df.groupby('性别')['年龄'].mean()
import matplotlib.pyplot as plt df['年龄'].plot(kind='hist') plt.show()
四、保存处理后的数据
在进行数据处理后,我们可以使用Pandas提供的方法将处理后的数据保存到Excel文件中。以下是具体的代码示例,将数据保存到output.xlsx
文件中:
df.to_excel('output.xlsx', index=False)
其中,index=False
rrreee
data.xlsx
est le nom du fichier Excel que nous voulons lire. 3. Exemple de traitement des donnéesAprès avoir lu avec succès le fichier Excel, nous pouvons utiliser les différentes fonctions fournies par Pandas pour traiter les données. Voici quelques exemples courants de traitement de données : 🎜head
pour afficher les premières lignes de données. Les 5 premières lignes sont affichées par défaut. describe
pour calculer des indicateurs statistiques des données, tels que la moyenne, la norme écart, valeur minimale, valeur maximale, etc. sort_values
pour trier les données. Les exemples suivants sont triés par « âge » du plus petit au plus grand. groupby
pour regrouper les données et effectuer des calculs d'agrégation. L'exemple suivant regroupe par sexe et calcule l'âge moyen de chaque groupe. output.xlsx
: 🎜rrreee🎜 Parmi eux, index=False
signifie ne pas enregistrer la colonne d'index. 🎜🎜Conclusion : 🎜🎜Cet article explique comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et effectuer un traitement de données, et donne des exemples de code spécifiques. Les fonctions puissantes de Pandas peuvent nous aider à traiter facilement de grandes quantités de données et à améliorer l'efficacité de l'analyse et du traitement des données. J'espère que cet article vous aidera à apprendre et à utiliser Pandas. 🎜Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!