Heim  >  Artikel  >  Backend-Entwicklung  >  So lesen Sie eine CSV-Datei mit Pandas

So lesen Sie eine CSV-Datei mit Pandas

小老鼠
小老鼠Original
2023-12-01 16:18:082721Durchsuche

Zu den Methoden zum Lesen von CSV-Dateien gehören die Verwendung der Funktion read_csv(), die Angabe von Trennzeichen, die Angabe von Spaltennamen, das Überspringen von Zeilen, die Behandlung fehlender Werte, benutzerdefinierte Datentypen usw. Ausführliche Einführung: 1. Die Funktion read_csv() ist die am häufigsten verwendete Methode zum Lesen von CSV-Dateien in Pandas. Es kann CSV-Daten aus dem lokalen Dateisystem oder einer Remote-URL laden und ein DataFrame-Objekt zurückgeben. 2. Geben Sie das Trennzeichen an. Standardmäßig verwendet die Funktion read_csv() Kommas als Trennzeichen für CSV-Dateien usw.

So lesen Sie eine CSV-Datei mit Pandas

Das Betriebssystem dieses Tutorials: Windows 10-System, Python-Version 3.11.4, Dell G3-Computer.

Pandas ist ein leistungsstarkes Datenverarbeitungs- und Analysetool, das in den Bereichen Datenwissenschaft und maschinelles Lernen weit verbreitet ist. Es bietet viele leistungsstarke und dennoch benutzerfreundliche Methoden zum Lesen und Verarbeiten verschiedener Arten von Datendateien. Unter anderem ist das Lesen und Verarbeiten von CSV-Dateien eine wichtige Funktion von Pandas.

Gemeinsame Lesemethoden und -techniken

Zuerst müssen wir die Pandas-Bibliothek installieren. Pandas kann installiert werden, indem der folgende Befehl im Terminal oder in der Eingabeaufforderung mit dem Befehl pip ausgeführt wird:

pip install pandas

Nachdem die Installation abgeschlossen ist, können wir die Pandas-Bibliothek in das Python-Skript importieren und mit dem Lesen der CSV-Datei beginnen.

import pandas as pd

Pandas bietet mehrere Methoden zum Lesen von CSV-Dateien. Hier sind einige häufig verwendete Methoden.

1. Verwenden Sie die Funktion read_csv()

Die Funktion read_csv() ist die am häufigsten verwendete Methode zum Lesen von CSV-Dateien in Pandas. Es kann CSV-Daten aus dem lokalen Dateisystem oder einer Remote-URL laden und ein DataFrame-Objekt zurückgeben.

df = pd.read_csv('data.csv')

Der obige Code liest die Daten aus der Datei data.csv im aktuellen Arbeitsverzeichnis und speichert sie in einem DataFrame-Objekt namens df. Wenn sich die CSV-Datei in einem anderen Verzeichnis befindet, kann der vollständige Dateipfad angegeben werden.

2. Geben Sie das Trennzeichen an

Standardmäßig verwendet die Funktion read_csv() Komma als Trennzeichen für CSV-Dateien. Falls die CSV-Datei andere Trennzeichen verwendet, kann dies über den Parameter sep angegeben werden.

df = pd.read_csv('data.csv', sep=';')

Der obige Code liest die CSV-Datei mit Semikolon als Trennzeichen.

3. Geben Sie Spaltennamen an

Wenn die CSV-Datei keine Spaltennamen enthält oder die Spaltennamen nicht den Anforderungen entsprechen, können Sie über den Namensparameter benutzerdefinierte Spaltennamen angeben.

df = pd.read_csv('data.csv', names=['column1', 'column2', 'column3'])

Der obige Code liest die CSV-Datei unter Verwendung benutzerdefinierter Spaltennamen.

4. Zeilen überspringen

Manchmal sind die erste Zeile oder die ersten paar Zeilen der CSV-Datei irrelevante Informationen und diese Zeilen können über den Skiprows-Parameter übersprungen werden.

df = pd.read_csv('data.csv', skiprows=3)

Der obige Code überspringt die ersten drei Zeilen der CSV-Datei und liest die nachfolgenden Daten.

5. Verarbeitung fehlender Werte

Möglicherweise fehlen Werte in der CSV-Datei. Sie können die Darstellung fehlender Werte über den Parameter na_values ​​angeben.

df = pd.read_csv('data.csv', na_values=['NA', 'NaN'])

Der obige Code identifiziert alle „NA“ und „NaN“ als fehlende Werte.

6. Benutzerdefinierter Datentyp

Manchmal müssen einige Spalten in der CSV-Datei mit bestimmten Datentypen verarbeitet werden. Sie können den Datentyp jeder Spalte über den Parameter dtype angeben.

df = pd.read_csv('data.csv', dtype={'column1': int, 'column2': float})

Der obige Code setzt den Datentyp von Spalte1 auf Ganzzahl und den Datentyp von Spalte2 auf Gleitkomma.

Die oben genannten sind einige häufig verwendete Methoden und Techniken zum Lesen von CSV-Dateien mit Pandas. Durch die flexible Anwendung dieser Methoden können verschiedene Arten von CSV-Dateien einfach gelesen und verarbeitet sowie eine weitere Datenanalyse und -verarbeitung durchgeführt werden.

Das obige ist der detaillierte Inhalt vonSo lesen Sie eine CSV-Datei mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn