Maison  >  Article  >  développement back-end  >  Démarrez rapidement avec pandas : un moyen rapide d'utiliser cette bibliothèque pour lire des fichiers Excel

Démarrez rapidement avec pandas : un moyen rapide d'utiliser cette bibliothèque pour lire des fichiers Excel

WBOY
WBOYoriginal
2024-01-19 11:09:05965parcourir

Démarrez rapidement avec pandas : un moyen rapide dutiliser cette bibliothèque pour lire des fichiers Excel

pandas est une importante bibliothèque d'analyse de données en Python, qui peut simplifier le processus de lecture, de nettoyage et de traitement des données. Elle est désormais devenue la norme pour le travail d'analyse de données. Dans le processus d'analyse des données, Excel est souvent l'une des sources de données. Cet article présentera donc une méthode rapide pour lire des fichiers Excel à l'aide de pandas.

Plusieurs avantages de l'utilisation de pandas pour lire des fichiers Excel :

  1. Peut lire et traiter rapidement de grandes quantités de fichiers Excel.
  2. Grâce à l'efficacité et à la flexibilité fournies par les pandas, il prend en charge différents types d'opérations de données, y compris, mais sans s'y limiter, le filtrage des données, l'épissage des données, les tableaux croisés dynamiques, la visualisation des données, etc.
  3. En utilisant pandas, nous pouvons facilement écrire les données Excel lues dans différents types de fichiers de sortie, tels que CSV, BASES DE DONNÉES SQL, etc.

Alors, comment utiliser les pandas pour lire des fichiers Excel ? Ce qui suit présentera en détail l'ensemble du processus, depuis la lecture des fichiers Excel jusqu'au nettoyage et à la manipulation des données.

Tout d'abord, vous devez installer la bibliothèque pandas et les bibliothèques dépendantes associées. Vous pouvez utiliser l'instruction suivante pour installer :

pip install pandas openpyxl

Après avoir installé les bibliothèques nécessaires, vous pouvez directement utiliser pandas pour lire le fichier Excel. La méthode d'utilisation des pandas pour lire des fichiers Excel est flexible. Lors de la lecture de fichiers Excel, vous pouvez lire une seule feuille ou toutes les feuilles du fichier Excel en même temps, vous pouvez également nommer chaque colonne, définir des types de données, etc. .

  1. Lire une seule feuille

Utilisez la fonction pandas.read_excel pour lire une seule feuille à partir d'un fichier Excel. Par exemple, nous avons un fichier Excel appelé test. Si vous devez lire toutes les feuilles du fichier Excel, vous pouvez utiliser le code suivant : pandas.read_excel函数可以从Excel文件中读取单个sheet。例如,我们有一个名为test.xlsx的Excel文件,其中包含一个名为Sheet1的sheet,可以使用以下代码读取:

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
  1. 读取所有sheet

如果我们需要读取Excel文件中的所有sheet,可以使用如下代码:

import pandas as pd

xls = pd.read_excel('test.xlsx', sheet_name=None)

将sheet_name参数设置为None,则返回一个以sheet名称为键,以DataFrame为值的字典。

可以使用xls.keys()来查看所有sheet的名称,以及使用xls.values()

import pandas as pd

df = pd.read_excel('test.xlsx', sheet_name='Sheet1')

df.rename(columns={'原列名':'新列名'}, inplace=True)

Définissez le paramètre sheet_name sur Aucun, puis renvoyez un dictionnaire avec le nom de la feuille comme suit. la clé et DataFrame comme valeur.
  1. Vous pouvez utiliser xls.keys() pour afficher les noms de toutes les feuilles, et utiliser xls.values() pour afficher le contenu de toutes les feuilles.

Renommer les colonnes

  1. Dans les pandas, on peut simplifier l'opération en renommant les colonnes du DataFrame. Voici un exemple de renommage d'une colonne dans un fichier Excel. L'exemple de code est le suivant :
  2. import pandas as pd
    
    df = pd.read_excel('test.xlsx', sheet_name='Sheet1')
    
    df.to_csv('output.csv')

Écrire des données dans un fichier

À l'aide de pandas, vous pouvez facilement écrire des données dans des fichiers Excel dans différents types de fichiers, y compris CSV. , base de données SQL, etc.

Prenons l'exemple de l'écriture de données d'un fichier Excel dans un fichier CSV. L'exemple de code est le suivant :

rrreee

Enregistrez les données lues dans Excel dans un DataFrame, puis utilisez la fonction to_csv du DataFrame pour écrire directement le données dans le fichier CSV. 🎜🎜Grâce aux exemples ci-dessus, j'espère que tout le monde pourra comprendre la supériorité des pandas dans la lecture et le traitement des données Excel, et pourra rapidement démarrer avec cette bibliothèque et utiliser cette compétence dans les travaux d'analyse de données ultérieurs pour gérer les données avec élégance. 🎜

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn