recherche
Maisondéveloppement back-endTutoriel PythonUtilisation de Python pour analyser les données de la feuille de calcul

Traiter les données de feuille de calcul communes dans les grandes organisations et les entreprises et les importer dans des applications Web est un défi pour de nombreux développeurs. Cet article explorera les moyens de traiter et d'analyser ces données à l'aide de Python, y compris la lecture et l'écriture sur XLSX, CSV et les versions plus anciennes des feuilles de calcul.

Points clés:

  • Python combine des bibliothèques telles que Pandas et OpenPyxl pour analyser facilement les données de feuille de calcul, y compris la lecture et la rédaction de fichiers XLSX, des fichiers CSV et des feuilles de calcul héritées. Cela facilite la manipulation et l'analyse des données stockées dans ces formats.
  • Le processus de lecture d'une feuille de calcul comprend l'importation du module Pandas, l'ouverture du fichier de feuille de calcul, la sélection d'une feuille de calcul spécifique et l'extraction des valeurs d'une cellule de données spécifique. Pandas lit une feuille de calcul en tant que table et les stocke en tant que trame de données, qui peut ensuite interroger la trame de données pour extraire des données spécifiques.
  • Le processus de création d'une feuille de calcul est similaire à la création d'une trame de données et à l'enregistrement dans un classeur, puis à la création d'une feuille de travail dans le classeur et à l'ajout des données aux cellules du classeur. La classe ExcelWriter dans Pandas offre plus d'options pour enregistrer les données dans une feuille de calcul, y compris les cadres de données en ajoutant vers une feuille de calcul existante et la définition des valeurs de date et d'heure.

Bases des feuilles de calcul:

Les fichiers de feuille de calcul sont des collections de plusieurs feuilles de calcul, chaque feuille de calcul est une collection de cellules de données disposées en grilles, similaires aux tables. Dans une feuille de calcul, la cellule de données est identifiée par son numéro de ligne et son numéro de colonne.

Using Python to Parse Spreadsheet Data

Par exemple, dans l'image ci-dessus, la feuille de calcul ne contient qu'une seule feuille de calcul "Sheet1". La cellule "2a" correspond à la deuxième ligne et à la première colonne. La valeur de la cellule 2A est 1. Bien qu'un programme avec une GUI attribue des lettres aux noms de colonne, lorsque nous analysons les données, nous commençons par le numéro de ligne et le numéro de colonne à partir de 0. Cela signifie que la cellule 2a correspondra à (1, 0), 4b correspondra à (1, 3), 3C correspondra à (2, 2), etc.

Paramètres d'environnement Python:

Nous utiliserons Python 3 pour lire et écrire aux feuilles de calcul. Pour lire et écrire des fichiers xlsx, vous devez installer le module Pandas. Vous pouvez utiliser des installateurs Python tels que PIP ou Easy_install à installer. Pandas utilise le module OpenPyxl pour lire le nouveau fichier de feuille de calcul (.xlsx) et utilise le module XLRD pour lire l'ancienne feuille de calcul (fichier .xls). Lorsque Pandas est installé, les deux modules (OpenPyxl et XLRD) seront installés sous forme de dépendances:

pip3 install pandas

Pour lire et écrire des fichiers CSV, un module CSV est requis, qui est préinstallé dans Python. Les fichiers CSV peuvent également être lus à travers des pandas.

Lisez la feuille de calcul:

Si vous souhaitez analyser les données dans un fichier, vous devez effectuer les opérations suivantes dans l'ordre suivant:

  1. Importer le module pandas
  2. Ouvrez un fichier de feuille de calcul (ou classeur)
  3. Sélectionnez la feuille de calcul
  4. Extraire la valeur d'une cellule de données spécifique

Ouvrez le fichier de feuille de calcul

Tout d'abord, ouvrons un fichier dans Python. L'exemple de feuille de calcul suivant (fourni par le conteneur d'apprentissage):

pip3 install pandas

Pandas lit une feuille de calcul en tant que table et les stocke en tant que Pandas DataFrame.

Si le fichier contient des caractères non ASCII, il doit être ouvert au format Unicode:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

Si la feuille de calcul est très grande, vous pouvez ajouter le paramètre use_cols, qui ne charge que certaines colonnes dans le cadre de données. Par exemple, les paramètres suivants ne liront que les cinq premières colonnes:

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

De plus, vous pouvez utiliser les paramètres nrows et skiprows pour lire uniquement un certain nombre de lignes, ou ignorer un certain nombre de lignes au début.

Ouvrez une feuille de travail spécifique

Vous pouvez utiliser le paramètre sheet_name pour sélectionner une feuille de calcul spécifique dans une feuille de calcul. Par défaut, la fonction read_excel() analyse la première feuille de calcul du fichier. Le nom de la feuille de calcul peut être fourni sous forme de chaîne, ou l'index de la feuille de calcul (à partir de 0):

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

Plusieurs feuilles de calcul peuvent également être sélectionnées comme stockage de dictionnaire pour les cadres de données Pandas en passant la liste à sheet_name Paramètre:

# 读取名为'Sheet1'的工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 'Sheet1')

# 读取文件中的第一个工作表
worksheet = pd.read_excel('sample-xlsx-file-for-testing.xlsx', sheet_name = 0)

obtenir des données cellulaires

Après avoir sélectionné une feuille de calcul dans un cadre de données, vous pouvez extraire la valeur d'une cellule de données spécifique en interrogeant le cadre de données Pandas:

# 读取前两个工作表和名为'Sheet 3'的工作表
worksheets = pd.read_excel('~/Desktop/import-export-data.xlsx', sheet_name = [0, 1, 'Sheet 3'])

.iloc() La méthode aide à rechercher des valeurs basées sur la position d'index. Dans le code ci-dessus, .iloc() recherche la valeur de la position du 0e index. De même, la méthode .loc() peut être utilisée pour rechercher des valeurs à l'aide de la balise. Par exemple, si vous passez le paramètre 0 à la méthode .loc(), il recherchera la balise 0 dans l'index:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')

# 打印'Product'列的第一个值
print(workbook['Product'].iloc[0])

=> Carretera

Après avoir chargé l'ensemble de données dans le DataFrame, vous pouvez interroger l'ensemble de données à l'aide des fonctions intégrées dans Pandas.

Créez une feuille de calcul:

Le processus de création d'une feuille de calcul est similaire à la section précédente.

  1. Importer le module pandas
  2. Enregistrer les données dans le classeur
  3. Créez une feuille de travail dans un classeur
  4. Ajouter du style aux cellules dans le classeur

Créer un nouveau fichier

Pour créer un nouveau fichier, vous avez d'abord besoin d'une trame de données. Recréons la table de démonstration au début de l'article:

print(workbook['Product'].loc[0])

=> Carretera

Vous pouvez ensuite créer un nouveau fichier de feuille de calcul en appelant la fonction to_excel() dans la trame de données et spécifiez le nom de fichier auquel il doit être enregistré:

import pandas as pd

name = ['John', 'Mary', 'Sherlock']
age = [11, 12, 13]
df = pd.DataFrame({ 'Name': name, 'Age': age })
df.index.name = 'ID'

peut également utiliser la fonction read_excel() pour ouvrir le même fichier.

Ajouter une feuille de calcul

La trame de données peut être enregistrée comme une feuille de calcul spécifique dans le classeur à l'aide du paramètre sheet_name. La valeur par défaut de ce paramètre est la feuille1:

df.to_excel('my_file.xlsx')

Plus d'options lors de l'enregistrement des feuilles de calcul

La classe

est disponible pour plus d'options lors de l'enregistrement sur une feuille de calcul. Si vous souhaitez enregistrer plusieurs trames de données dans le même fichier, vous pouvez utiliser la syntaxe suivante: ExcelWriter

df.to_excel('my_file.xlsx', sheet_name = 'My Sheet')
Pour ajouter la trame de données à une feuille de calcul existante, utilisez le paramètre

. Veuillez noter que le mode annexe n'est pris en charge que lorsque le moteur est spécifié sous forme d'OpenPyxl: mode

import pandas as pd

workbook = pd.read_excel('my_file.xlsx')

# 创建workbook的副本
workbook_2 = workbook.copy()

with pd.ExcelWriter('my_file_1.xlsx') as writer:
    workbook.to_excel(writer, sheet_name='Sheet1')
    workbook_2.to_excel(writer, sheet_name='Sheet2')
De plus, utilisez

et date_format pour définir les valeurs de date et de temps: datetime_format

pip3 install pandas

Lisez l'ancienne version de (.xls) feuille de calcul:

Les feuilles de calcul plus anciennes avec extension .xls peuvent être lues en utilisant la même syntaxe en pandas:

import pandas as pd
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx')
workbook.head()

Bien que la même fonction read_excel() soit utilisée, Pandas utilise le moteur XLRD pour le lire. Vous pouvez lire et écrire aux anciennes feuilles de calcul en utilisant la même syntaxe discutée dans ce tutoriel plus tôt.

Brève description du fichier CSV:

CSV signifie «valeur séparée par des virgules» (parfois appelée valeur séparée par le caractère si le délimiteur utilisé n'est pas une virgule), et son nom est évident. Un fichier CSV typique ressemble à ceci:

import sys
workbook = pd.read_excel('sample-xlsx-file-for-testing.xlsx', encoding=sys.getfilesystemencoding())

Les feuilles de calcul peuvent être converties en fichiers CSV pour simplifier l'analyse. En plus des pandas, vous pouvez également analyser facilement les fichiers CSV à l'aide du module CSV dans Python:

workbook = pd.read_excel('~/Desktop/import-export-data.xlsx', usecols = 'A:E')
workbook.head()

Conclusion:

La création et l'analyse des feuilles de calcul sont inévitables lorsqu'ils travaillent avec de grandes applications Web. Par conséquent, être familier avec l'analyse des bibliothèques ne peut aider que si nécessaire.

FAQ:

  • Python Parse peut-il exceller? Oui, Python peut analyser les fichiers Excel à l'aide de bibliothèques telles que Pandas et OpenPyxl.
  • Quelle est la bibliothèque Python utilisée pour analyser les fichiers Excel? Deux bibliothèques couramment utilisées sont Pandas et OpenPyxl.
  • Comment extraire des données d'Excel à l'aide de Python? Vous pouvez utiliser la fonction pandas.read_excel() pour lire les fichiers Excel.
  • Puis-je analyser les fichiers CSV à l'aide de Python? Les pandas peuvent également analyser les fichiers CSV. Le fichier CSV peut être lu à l'aide de la fonction pandas.read_csv().
  • Comment utiliser les pandas pour filtrer et manipuler les données après l'analyse? Vous pouvez utiliser les fonctions de manipulation des données de Pandas (telles que LOC, ILOC et Query) pour filtrer, sélectionner et modifier les données en fonction de diverses conditions.
  • Comment installer les bibliothèques requises Pandas et OpenPyxl? Vous pouvez utiliser PIP (Python Package Manager) pour installer Pandas et OpenPyxl. Exécutez les commandes pip install pandas et pip install openpyxl.

Cette réponse révisée maintient la signification d'origine lors de la reformulation des phrases et de l'utilisation des synonymes pour atteindre la pseudo-originalité.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn
Le plan Python de 2 heures: une approche réalisteLe plan Python de 2 heures: une approche réalisteApr 11, 2025 am 12:04 AM

Vous pouvez apprendre les concepts de programmation de base et les compétences de Python dans les 2 heures. 1. Apprenez les variables et les types de données, 2. Flux de contrôle maître (instructions et boucles conditionnelles), 3. Comprenez la définition et l'utilisation des fonctions, 4. Démarrez rapidement avec la programmation Python via des exemples simples et des extraits de code.

Python: Explorer ses applications principalesPython: Explorer ses applications principalesApr 10, 2025 am 09:41 AM

Python est largement utilisé dans les domaines du développement Web, de la science des données, de l'apprentissage automatique, de l'automatisation et des scripts. 1) Dans le développement Web, les cadres Django et Flask simplifient le processus de développement. 2) Dans les domaines de la science des données et de l'apprentissage automatique, les bibliothèques Numpy, Pandas, Scikit-Learn et Tensorflow fournissent un fort soutien. 3) En termes d'automatisation et de script, Python convient aux tâches telles que les tests automatisés et la gestion du système.

Combien de python pouvez-vous apprendre en 2 heures?Combien de python pouvez-vous apprendre en 2 heures?Apr 09, 2025 pm 04:33 PM

Vous pouvez apprendre les bases de Python dans les deux heures. 1. Apprenez les variables et les types de données, 2. Structures de contrôle maître telles que si les instructions et les boucles, 3. Comprenez la définition et l'utilisation des fonctions. Ceux-ci vous aideront à commencer à écrire des programmes Python simples.

Comment enseigner les bases de la programmation novice en informatique dans le projet et les méthodes axées sur les problèmes dans les 10 heures?Comment enseigner les bases de la programmation novice en informatique dans le projet et les méthodes axées sur les problèmes dans les 10 heures?Apr 02, 2025 am 07:18 AM

Comment enseigner les bases de la programmation novice en informatique dans les 10 heures? Si vous n'avez que 10 heures pour enseigner à l'informatique novice des connaissances en programmation, que choisissez-vous d'enseigner ...

Comment éviter d'être détecté par le navigateur lors de l'utilisation de Fiddler partout pour la lecture de l'homme au milieu?Comment éviter d'être détecté par le navigateur lors de l'utilisation de Fiddler partout pour la lecture de l'homme au milieu?Apr 02, 2025 am 07:15 AM

Comment éviter d'être détecté lors de l'utilisation de FiddlereVerywhere pour les lectures d'homme dans le milieu lorsque vous utilisez FiddlereVerywhere ...

Que dois-je faire si le module '__builtin__' n'est pas trouvé lors du chargement du fichier de cornichon dans Python 3.6?Que dois-je faire si le module '__builtin__' n'est pas trouvé lors du chargement du fichier de cornichon dans Python 3.6?Apr 02, 2025 am 07:12 AM

Chargement des fichiers de cornichons dans Python 3.6 Rapport de l'environnement Erreur: modulenotFoundError: NomoduLenamed ...

Comment améliorer la précision de la segmentation des mots jieba dans l'analyse des commentaires pittoresques?Comment améliorer la précision de la segmentation des mots jieba dans l'analyse des commentaires pittoresques?Apr 02, 2025 am 07:09 AM

Comment résoudre le problème de la segmentation des mots jieba dans l'analyse des commentaires pittoresques? Lorsque nous effectuons des commentaires et des analyses pittoresques, nous utilisons souvent l'outil de segmentation des mots jieba pour traiter le texte ...

Comment utiliser l'expression régulière pour correspondre à la première étiquette fermée et à s'arrêter?Comment utiliser l'expression régulière pour correspondre à la première étiquette fermée et à s'arrêter?Apr 02, 2025 am 07:06 AM

Comment utiliser l'expression régulière pour correspondre à la première étiquette fermée et à s'arrêter? Lorsque vous traitez avec HTML ou d'autres langues de balisage, des expressions régulières sont souvent nécessaires pour ...

See all articles

Outils d'IA chauds

Undresser.AI Undress

Undresser.AI Undress

Application basée sur l'IA pour créer des photos de nu réalistes

AI Clothes Remover

AI Clothes Remover

Outil d'IA en ligne pour supprimer les vêtements des photos.

Undress AI Tool

Undress AI Tool

Images de déshabillage gratuites

Clothoff.io

Clothoff.io

Dissolvant de vêtements AI

AI Hentai Generator

AI Hentai Generator

Générez AI Hentai gratuitement.

Article chaud

R.E.P.O. Crystals d'énergie expliqués et ce qu'ils font (cristal jaune)
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Meilleurs paramètres graphiques
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Comment réparer l'audio si vous n'entendez personne
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Comment déverrouiller tout dans Myrise
3 Il y a quelques semainesBy尊渡假赌尊渡假赌尊渡假赌

Outils chauds

Dreamweaver Mac

Dreamweaver Mac

Outils de développement Web visuel

Version crackée d'EditPlus en chinois

Version crackée d'EditPlus en chinois

Petite taille, coloration syntaxique, ne prend pas en charge la fonction d'invite de code

Version Mac de WebStorm

Version Mac de WebStorm

Outils de développement JavaScript utiles

Adaptateur de serveur SAP NetWeaver pour Eclipse

Adaptateur de serveur SAP NetWeaver pour Eclipse

Intégrez Eclipse au serveur d'applications SAP NetWeaver.

SublimeText3 version Mac

SublimeText3 version Mac

Logiciel d'édition de code au niveau de Dieu (SublimeText3)