Maison  >  Article  >  développement back-end  >  Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV à l'aide de Pandas ?

Comment ignorer des lignes spécifiques lors de l'importation de fichiers CSV à l'aide de Pandas ?

Linda Hamilton
Linda Hamiltonoriginal
2024-11-02 18:05:29517parcourir

How to Skip Specific Rows When Importing CSV Files Using Pandas?

Comment importer des fichiers CSV avec des lignes ignorées à l'aide de Pandas

L'importation de fichiers CSV dans Python est une tâche courante, et Pandas est une bibliothèque populaire pour manipuler et analyser des données. Cependant, vous pouvez rencontrer des situations dans lesquelles vous devez ignorer des lignes spécifiques pendant le processus d'importation.

Pour y parvenir, Pandas fournit le paramètre skiprows dans sa fonction read_csv(). Cependant, la documentation peut paraître ambiguë, vous laissant vous demander comment spécifier correctement les lignes à ignorer.

Comprendre le paramètre skiprows

Le paramètre skiprows accepte soit une liste de numéros de ligne (indexés à 0) ou un nombre entier représentant le nombre de lignes à ignorer depuis le début du fichier. La confusion survient car Pandas autorise les deux interprétations, selon le format de la valeur que vous fournissez.

  • Liste des numéros de ligne (par exemple, skiprows=[1]) : Ignore le lignes avec les indices spécifiés. Dans ce cas, skiprows=[1] sauterait la ligne avec l'index 1 (la deuxième ligne).
  • Entier (par exemple, skiprows=1) : Ignore les n premières lignes du fichier, où n est la valeur entière. Ainsi, skiprows=1 ignorerait la première ligne.

Exemple

Pour illustrer la différence, considérons le fichier CSV suivant :

<code class="csv">1, 2
3, 4
5, 6</code>

Pour ignorer la deuxième ligne (avec l'index 1) :

<code class="python">import pandas as pd

# Skip row with index 1
data = pd.read_csv("data.csv", skiprows=[1])

# Print the data
print(data)</code>

Cela afficherait :

   0  1
0  1  2
1  5  6

Pour ignorer la première ligne :

<code class="python">import pandas as pd

# Skip first row
data = pd.read_csv("data.csv", skiprows=1)

# Print the data
print(data)</code>

Cela afficherait :

   0  1
0  3  4
1  5  6

En comprenant les différentes manières de spécifier les lignes ignorées dans Pandas.read_csv(), vous pouvez importer efficacement des données et gérer des scénarios spécifiques dans lesquels l'exclusion de certaines lignes est requise.

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn