Maison  >  Article  >  développement back-end  >  Tutoriel pandas : Explication détaillée de la façon d'utiliser cette bibliothèque pour lire des fichiers Excel

Tutoriel pandas : Explication détaillée de la façon d'utiliser cette bibliothèque pour lire des fichiers Excel

WBOY
WBOYoriginal
2024-01-19 09:45:05425parcourir

Tutoriel pandas : Explication détaillée de la façon dutiliser cette bibliothèque pour lire des fichiers Excel

Tutoriel Pandas : Explication détaillée de la façon d'utiliser cette bibliothèque pour lire des fichiers Excel, des exemples de code spécifiques sont requis

Pandas est une bibliothèque de traitement de données couramment utilisée avec de nombreuses fonctions puissantes, notamment en traitement de données. Elle est très pratique. Dans le processus de traitement des données proprement dit, il est souvent nécessaire de lire des fichiers Excel. Cet article expliquera en détail comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et fournira des exemples de code spécifiques.

  1. Importer la bibliothèque Pandas

Pour utiliser la bibliothèque Pandas, vous devez d'abord importer la bibliothèque :

import pandas as pd

Parmi eux, pd est l'alias de la bibliothèque Pandas, ce qui facilite l'utilisation des méthodes liées à Pandas.

  1. Lire les fichiers Excel

Il est très pratique d'utiliser Pandas pour lire des fichiers Excel. Cela ne nécessite qu'une seule ligne de code :

data = pd.read_excel('file_name.xlsx')

Parmi eux, file_name.xlsx est le nom du fichier Excel, qui se trouve dans le fichier Excel. même répertoire que le script Python Down.

Si le fichier Excel ne se trouve pas dans le même répertoire, vous devez spécifier le chemin complet, par exemple :

data = pd.read_excel('C:/Users/username/Desktop/file_name.xlsx')

Après avoir lu le fichier Excel, vous pouvez visualiser les données du fichier via les méthodes suivantes :

print(data.head())

head () méthode pour afficher le fichier Excel Les 5 premières lignes de données. Si vous avez besoin d'afficher plus de lignes, vous pouvez remplacer le nombre entre parenthèses par le nombre de lignes que vous devez afficher, par exemple :

print(data.head(10))
  1. Spécifiez le tableau Excel qui doit être lu

Lorsque le fichier Excel contient plusieurs tables, vous devez spécifier les éléments requis La table à lire, par exemple :

data = pd.read_excel('file_name.xlsx', sheet_name='Sheet1')

Parmi eux, sheet_name est utilisé pour spécifier le nom de la table qui doit être lue. Si vous avez besoin de lire plusieurs feuilles, vous pouvez remplacer sheet_name par une liste, par exemple :

data = pd.read_excel('file_name.xlsx', sheet_name=['Sheet1', 'Sheet2'])

De cette façon, les données de Sheet1 et Sheet2 peuvent être lues en même temps et stockées dans un dictionnaire.

  1. Lire des lignes ou des colonnes spécifiques

Lorsqu'il y a beaucoup de données dans le tableau Excel, nous n'avons parfois besoin de lire que certaines lignes ou colonnes, ce qui peut être réalisé en utilisant les méthodes loc et iloc de Pandas :

La méthode
  • loc peut lire les données de ligne ou de colonne spécifiées, l'exemple est le suivant :

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.loc[2])
    # 读取名称为 'column_name' 的列数据
    print(data.loc[:, 'column_name'])
    # 读取第 3 行、名称为 'column_name' 的数据
    print(data.loc[2, 'column_name'])
  • La méthode iloc peut lire les données de ligne ou de colonne spécifiées, mais elle doit utiliser l'index de position entier, l'exemple est le suivant suit :

    data = pd.read_excel('file_name.xlsx')
    # 读取第 3 行数据
    print(data.iloc[2])
    # 读取第 3 行、第 4 列数据
    print(data.iloc[2, 3])
    # 读取第 2-4 行、第 1-3 列的数据
    print(data.iloc[1:4, 0:3])
  1. Lire les noms de colonnes du fichier Excel dans

Dans le processus de lecture de fichiers Excel, vous devez parfois obtenir les noms de colonnes dans le fichier Excel. Vous pouvez utiliser la méthode suivante :

data = pd.read_excel('file_name.xlsx')
# 读取所有列名
print(data.columns.values)
# 读取第 3 列的列名
print(data.columns.values[2])

Parmi eux. , columns.values ​​​​est utilisé pour renvoyer la liste des noms de colonnes. En Python, les index de liste commencent à 0.

  1. Écrire des données dans des fichiers Excel

En plus de lire des fichiers Excel, Pandas fournit également des méthodes pour écrire des données dans des fichiers Excel. L'exemple est le suivant :

data = pd.DataFrame({'姓名': ['张三', '李四', '王五'], '年龄': [18, 22, 25]})
# 将数据写入名为 'MySheet' 的表格中
data.to_excel('file_name.xlsx', sheet_name='MySheet', index=False)

Parmi elles, la méthode to_excel() est utilisée pour écrire des données dans un fichier Excel. Le premier paramètre est le nom du fichier Excel, et le deuxième paramètre est le nom du tableau à écrire. index=False signifie qu’aucune écriture n’est requise.

  1. Conclusion

Cet article présente principalement comment utiliser la bibliothèque Pandas pour lire des fichiers Excel et fournit des exemples de code spécifiques. Bien entendu, Pandas a de nombreuses autres fonctions, qui peuvent être mieux comprises dans le traitement quotidien des données.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn