Heim  >  Artikel  >  Backend-Entwicklung  >  Wie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?

Wie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?

Linda Hamilton
Linda HamiltonOriginal
2024-11-02 18:05:29517Durchsuche

How to Skip Specific Rows When Importing CSV Files Using Pandas?

So importieren Sie CSV-Dateien mit übersprungenen Zeilen mit Pandas

Das Importieren von CSV-Dateien in Python ist eine häufige Aufgabe, und Pandas ist eine beliebte Bibliothek zum Bearbeiten und Analysieren von Daten. Es kann jedoch vorkommen, dass Sie während des Importvorgangs bestimmte Zeilen überspringen müssen.

Um dies zu erreichen, stellt Pandas in seiner Funktion read_csv() den Parameter „skiprows“ bereit. Die Dokumentation erscheint jedoch möglicherweise mehrdeutig, sodass Sie sich fragen, wie Sie die zu überspringenden Zeilen richtig angeben können.

Den Skiprows-Parameter verstehen

Der Skiprows-Parameter akzeptiert eine Liste von Zeilennummern (0-indiziert) oder eine Ganzzahl, die die Anzahl der Zeilen darstellt, die vom Anfang der Datei übersprungen werden sollen. Die Verwirrung entsteht, weil Pandas je nach Format des von Ihnen bereitgestellten Werts beide Interpretationen zulässt.

  • Liste der Zeilennummern (z. B. skiprows=[1]): Überspringt die Zeilen mit den angegebenen Indizes. In diesem Fall würde „skiprows=[1]“ die Zeile mit Index 1 (die zweite Zeile) überspringen.
  • Ganzzahl (z. B. „skiprows=1“): Überspringt die ersten n Zeilen von Datei, wobei n der ganzzahlige Wert ist. Skirows=1 würde also die erste Zeile überspringen.

Beispiel

Um den Unterschied zu veranschaulichen, betrachten Sie die folgende CSV-Datei:

<code class="csv">1, 2
3, 4
5, 6</code>

Um die zweite Zeile (mit Index 1) zu überspringen:

<code class="python">import pandas as pd

# Skip row with index 1
data = pd.read_csv("data.csv", skiprows=[1])

# Print the data
print(data)</code>

Dies würde Folgendes ausgeben:

   0  1
0  1  2
1  5  6

Um die erste Zeile zu überspringen:

<code class="python">import pandas as pd

# Skip first row
data = pd.read_csv("data.csv", skiprows=1)

# Print the data
print(data)</code>

Dies würde Folgendes ausgeben:

   0  1
0  3  4
1  5  6

Wenn Sie die verschiedenen Möglichkeiten zur Angabe übersprungener Zeilen in Pandas.read_csv() verstehen, können Sie Daten effizient importieren und bestimmte Szenarien bewältigen, in denen der Ausschluss bestimmter Zeilen erforderlich ist.

Das obige ist der detaillierte Inhalt vonWie überspringe ich bestimmte Zeilen beim Importieren von CSV-Dateien mit Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn