Heim  >  Artikel  >  Backend-Entwicklung  >  Wie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?

Wie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?

Susan Sarandon
Susan SarandonOriginal
2024-11-02 13:57:03125Durchsuche

How to Skip Specific Rows When Importing CSV Files with Pandas?

Interpretation des Arguments „Zeilen überspringen“ von Pandas für CSV-Importe

Beim Importieren einer CSV-Datei in einen DataFrame mit pandas.read_csv() können Sie Folgendes tun: Es kommt zu Situationen, in denen Sie bestimmte Zeilen vom Importvorgang ausschließen möchten. Das Argument „skiprows“ bietet diese Funktionalität, aber seine Syntax kann mehrdeutig sein.

Die Mehrdeutigkeit verstehen

In der Pandas-Dokumentation heißt es, dass „skiprows“ entweder eine Liste von Zeilennummern ( 0-indiziert) oder eine Ganzzahl, die die Anzahl der Zeilen darstellt, die vom Anfang der Datei übersprungen werden sollen. Diese Mehrdeutigkeit kann zu Verwirrung führen, wenn Sie eine bestimmte Zeile überspringen möchten, beispielsweise die mit Index 1.

Bestimmen des Verhaltens

Um das Verhalten von Skiprows zu klären Betrachten Sie die folgenden Szenarien:

  • skiprows=1: Dieses Argument überspringt die erste Zeile der CSV-Datei, nicht die Zeile mit Index 1.
  • skiprows=[1]: Dieses Argument überspringt speziell die Zeile mit Index 1.

Beispieldemonstration

Lassen Sie uns das Verhalten veranschaulichen unter Verwendung eines StringIO-Objekts:

<code class="python">import pandas as pd
from io import StringIO

s = "1, 2\n3, 4\n5, 6"

# Skipping the first row
df1 = pd.read_csv(StringIO(s), skiprows=[1], header=None)

# Skipping the row with index 1
df2 = pd.read_csv(StringIO(s), skiprows=1, header=None)

print(df1)
print(df2)</code>

Ausgabe:

   0  1
0  1  2
1  5  6

   0  1
0  3  4
1  5  6

Wie Sie sehen können, überspringt „skiprows=[1]“ die zweite Zeile (Index 1), während „skiprows=1“ die zweite Zeile überspringt erste Zeile.

Fazit

Um eine bestimmte Zeile während CSV-Importen mit pandas.read_csv() zu überspringen, verwenden Sie die Syntax „skiprows=[row_index]“. Diese Syntax gibt eindeutig die Zeile an, die vom Importvorgang ausgeschlossen werden soll, wodurch jegliche Verwirrung über das Verhalten des Arguments vermieden wird.

Das obige ist der detaillierte Inhalt vonWie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn