Maison  >  Article  >  développement back-end  >  Méthode Pandas pour lire rapidement les fichiers Excel

Méthode Pandas pour lire rapidement les fichiers Excel

PHPz
PHPzoriginal
2024-01-24 08:29:131428parcourir

Méthode Pandas pour lire rapidement les fichiers Excel

Un moyen facile de lire des fichiers Excel à l'aide de Pandas

Dans l'analyse et le traitement des données, il est souvent nécessaire de lire les données des fichiers Excel et d'effectuer diverses opérations. Pandas est une puissante bibliothèque d'analyse de données Python qui offre un moyen simple et pratique de lire des fichiers Excel. Cet article explique comment utiliser Pandas pour lire des fichiers Excel et fournit des exemples de code spécifiques.

Avant de commencer, assurez-vous que la bibliothèque Pandas est installée. Pandas peut être installé en utilisant le code suivant :

pip install pandas

Ensuite, nous supposons qu'il existe un fichier Excel nommé "example.xlsx" qui contient une feuille de calcul nommée "Sheet1". Dans cette feuille de travail, vous trouverez certaines données, notamment le nom, l'âge et le sexe. Nous lirons les données de ce fichier Excel.

Tout d'abord, importons la bibliothèque Pandas et lisons le fichier Excel :

import pandas as pd

df = pd.read_excel('example.xlsx', sheet_name='Sheet1')

Dans le code ci-dessus, nous utilisons la fonction read_excel pour lire le fichier Excel. Parmi eux, example.xlsx est le nom du fichier Excel à lire, et sheet_name='Sheet1' est le nom de la feuille de calcul à lire. Si le paramètre sheet_name n'est pas spécifié, la première feuille de calcul sera lue par défaut. read_excel函数来读取Excel文件。其中,example.xlsx是要读取的Excel文件的文件名,sheet_name='Sheet1'是要读取的工作表的名称。如果不指定sheet_name参数,则默认读取第一个工作表。

读取Excel文件后,Pandas将数据以DataFrame的形式存储在变量df中。DataFrame是一种二维标签数组,类似于Excel中的表格。每列的名称称为列标签,而每行的索引称为行标签。

现在,我们可以对读取到的数据进行各种操作,比如查看前几行的数据、获取某列的数据、筛选数据等。

  1. 查看前几行的数据:

    print(df.head())
  2. 获取某列的数据:

    name_column = df['姓名']
    print(name_column)
  3. 筛选数据:

    filtered_data = df[df['年龄'] > 30]
    print(filtered_data)

上面的代码中,df.head()将显示DataFrame的前几行数据,默认显示前5行。df['姓名']将获取名为"姓名"的列的数据,而df[df['年龄'] > 30]将根据"年龄"列的条件筛选出符合条件的数据。

除了读取Excel文件,Pandas还提供了其他一些方法来处理Excel文件,例如写入数据到Excel文件、添加新的工作表等。下面是一些常用的方法:

  1. 将DataFrame写入Excel文件:

    df.to_excel('output.xlsx', sheet_name='Sheet2', index=False)

    上面的代码将DataFrame写入到"output.xlsx"文件的名为"Sheet2"的工作表中,并设置index=False以不包含行索引。

  2. 添加新的工作表到现有的Excel文件:

    with pd.ExcelWriter('example.xlsx', mode='a') as writer:
     df.to_excel(writer, sheet_name='Sheet2', index=False)

    上面的代码使用pd.ExcelWriter将DataFrame写入到现有的Excel文件中,并设置mode='a'以追加写入。df.to_excel()

    Après avoir lu le fichier Excel, Pandas stocke les données dans la variable df sous forme de DataFrame. Un DataFrame est un tableau bidimensionnel d’étiquettes, semblable à un tableau dans Excel. Le nom de chaque colonne est appelé étiquette de colonne et l'index de chaque ligne est appelé étiquette de ligne.
Maintenant, nous pouvons effectuer diverses opérations sur les données lues, telles que visualiser les données des premières lignes, obtenir les données d'une certaine colonne, filtrer les données, etc.

  1. Afficher les données des premières lignes : 🎜rrreee🎜
  2. 🎜Obtenir les données d'une certaine colonne : 🎜rrreee🎜
  3. 🎜Filtrer les données : 🎜rrreee🎜🎜🎜Dans le au-dessus du code, df.head() affichera les premières lignes de données DataFrame, et les 5 premières lignes seront affichées par défaut. df['Name'] obtiendra les données de la colonne nommée "Name", tandis que df[df['Age'] > 30] obtiendra les données en fonction sur les conditions de la colonne « Âge » filtrent les données qui répondent aux conditions. 🎜🎜En plus de lire les fichiers Excel, Pandas propose également d'autres méthodes pour traiter les fichiers Excel, telles que l'écriture de données dans des fichiers Excel, l'ajout de nouvelles feuilles de calcul, etc. Voici quelques méthodes couramment utilisées : 🎜
    1. 🎜Écrire DataFrame dans un fichier Excel :🎜rrreee🎜Le code ci-dessus écrit DataFrame dans la feuille de calcul nommée "Sheet2" dans le fichier "output.xlsx", et définit index=False pour ne pas inclure l'index de ligne. 🎜🎜
    2. 🎜Ajoutez une nouvelle feuille de calcul à un fichier Excel existant : 🎜rrreee🎜Le code ci-dessus utilise pd.ExcelWriter pour écrire un DataFrame dans un fichier Excel existant et définit mode=' a' pour ajouter l'écriture. La méthode df.to_excel() écrit le DataFrame dans la feuille de calcul "Sheet2". 🎜🎜🎜🎜En utilisant Pandas, nous pouvons facilement lire et traiter des fichiers Excel, et être en mesure d'effectuer diverses opérations pour rendre l'analyse et le traitement des données plus efficaces et plus pratiques. Ce qui précède est l'introduction et un exemple de code d'une méthode simple pour lire des fichiers Excel à l'aide de Pandas. J'espère que cela t'aides! 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn