Heim >Backend-Entwicklung >Python-Tutorial >Kurzanleitung zum Lesen von TXT-Dateien mit Pandas

Kurzanleitung zum Lesen von TXT-Dateien mit Pandas

WBOY
WBOYOriginal
2024-01-19 08:46:141471Durchsuche

Kurzanleitung zum Lesen von TXT-Dateien mit Pandas

Pandas ist eine Datenverarbeitungsbibliothek, die zum Lesen, Bearbeiten und Analysieren von Daten verwendet werden kann. In diesem Artikel stellen wir vor, wie man TXT-Dateien mit Pandas liest. Dieser Artikel richtet sich an Anfänger, die Pandas lernen möchten.

  1. Importieren Sie die Pandas-Bibliothek

Importieren Sie zunächst die Pandas-Bibliothek in Python.

import pandas as pd
  1. Textdateien lesen

Bevor wir TXT-Dateien lesen, müssen wir einige allgemeine Parameter von TXT-Dateien verstehen: Sie können den Spaltennamen manuell angeben.

    index_col: Legen Sie eine bestimmte Spalte als Indexspalte fest, nicht standardmäßig festgelegt.
  • skiprows: Überspringen Sie die vorherige Anzahl von Zeilen.
  • sep: Geben Sie das Trennzeichen an.
  • Beispiel: Angenommen, wir haben eine Datei mit dem Namen „data.txt“. Zuerst müssen wir die TXT-Datei mit der Funktion read_table() lesen. read_table() bietet eine sehr flexible Möglichkeit, Textdaten zu lesen.
  • data = pd.read_table('data.txt', delimiter=',', header=0)
  • Sehen Sie sich die gelesenen Daten an
Sie können die Funktion

verwenden, um die ersten Zeilen der gelesenen Daten anzuzeigen. Standardmäßig werden die ersten 5 Datenzeilen angezeigt.

print(data.head())
  1. Datenbereinigung

Nachdem wir die Daten gelesen haben, müssen wir die notwendige Bereinigung und Transformation durchführen. Dazu gehört normalerweise das Entfernen nutzloser Spalten, das Entfernen fehlender Werte, das Umbenennen von Spaltennamen, das Konvertieren von Datentypen usw. Hier sind einige gängige Datenbereinigungsmethoden. .head()

    Unnötige Spalten entfernen:
  1. data = data.drop(columns=['ID'])

Fehlende Werte entfernen:

    data.dropna(inplace=True)
  • Spaltennamen umbenennen:
    data = data.rename(columns={'OldName': 'NewName'})
  • Datentypen konvertieren:
    data['ColumnName'] = data['ColumnName'].astype(str)
    data['ColumnName'] = data['ColumnName'].astype(int)
  • Datenanalyse
  • Nach der Datenbereinigung können wir Datenanalyse starten. Pandas bietet umfangreiche Methoden zur Datenverarbeitung.
Zum Beispiel, um die Summe einer bestimmten Spalte zu berechnen:
    total = data['ColumnName'].sum()
    print(total)
  1. In Pandas können Sie Ihre Daten mit der Funktion groupby() gruppieren. Nehmen wir zum Beispiel an, wir möchten Daten nach Namen gruppieren und nach der Gruppierung den Durchschnitt berechnen:
  2. grouped_data = data.groupby(['Name']).mean()
    print(grouped_data.head())

Datenvisualisierung

Durch die Datenvisualisierung können wir schließlich Trends und Muster in den Daten klarer verstehen.

import matplotlib.pyplot as plt

plt.bar(data['ColumnName'], data['Count'])
plt.xlabel('ColumnName')
plt.ylabel('Count')
plt.title('ColumnName vs Count')
plt.show()

Zusammenfassend lässt sich sagen, dass Pandas eine bequeme und schnelle Möglichkeit bietet, Daten zu lesen, zu bereinigen und zu analysieren. In diesem Artikel können Leser lernen, wie man Pandas zum Lesen von TXT-Dateien verwendet und wie man Daten bereinigt, analysiert und visualisiert.

    Das obige ist der detaillierte Inhalt vonKurzanleitung zum Lesen von TXT-Dateien mit Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

    Stellungnahme:
    Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn