Heim >Backend-Entwicklung >Python-Tutorial >So verwenden Sie reguläre Python-Ausdrücke zur Datenvisualisierung
Python-reguläre Ausdrücke sind ein leistungsstarkes Werkzeug zur Verarbeitung von Textdaten. Mit regulären Ausdrücken können Sie Daten aus Text extrahieren, transformieren und visualisieren. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke zur Datenvisualisierung verwenden.
Bevor Sie beginnen, müssen Sie die erforderlichen Python-Bibliotheken installieren: Pandas, Matplotlib und Re. Sie können es mit pip installieren.
pip install pandas matplotlib re
Sie müssen diese Bibliotheken dann in Ihre Python-Datei importieren.
import pandas as pd import matplotlib.pyplot as plt import re
In diesem Artikel verwenden wir eine Tabellenkalkulationsdatei, die Daten über Einnahmen und Ausgaben während der Pandemie enthält. Zunächst müssen Sie die Funktion read_excel aus der Pandas-Bibliothek verwenden, um die Daten in der Tabellenkalkulationsdatei zu lesen.
df = pd.read_excel('data.xlsx')
Bevor Sie reguläre Ausdrücke zur Visualisierung von Daten verwenden, müssen Sie einige Datenvorverarbeitungsvorgänge durchführen. In diesem Artikel werden die folgenden zwei Vorverarbeitungsschritte beschrieben:
Die folgenden Funktionen können Daten entformatieren:
def strip_currency(val): return re.sub(r'[^d.]', '', val)
Die folgenden Funktionen können bestimmte Daten extrahieren:
def extract_number(val): return re.findall(r'd+.?d*', val)[0]
Sie können sie mit der Anwenden-Funktion auf jede Zelle Ihrer Tabelle anwenden. Hier ist der Code, der die obige Funktion anwendet:
df['income'] = df['income'].apply(strip_currency).apply(extract_number).astype(float) df['expenses'] = df['expenses'].apply(strip_currency).apply(extract_number).astype(float)
Sobald Sie die Daten aus jeder Zelle entformatiert und extrahiert haben, können Sie sie jetzt mithilfe der Matplotlib-Bibliothek visualisieren. In diesem Artikel verwenden wir ein Streudiagramm, um die Beziehung zwischen Einnahmen und Ausgaben darzustellen.
plt.scatter(df['income'], df['expenses']) plt.xlabel('Income') plt.ylabel('Expenses') plt.show()
Dieser Code erstellt ein Streudiagramm mit Einnahmen auf der horizontalen Achse und Ausgaben auf der vertikalen Achse.
Das sind die grundlegenden Schritte zur Verwendung regulärer Python-Ausdrücke zur Datenvisualisierung. Sie können die Daten nach Bedarf weiter verarbeiten und visualisieren, um sie besser zu verstehen.
Das obige ist der detaillierte Inhalt vonSo verwenden Sie reguläre Python-Ausdrücke zur Datenvisualisierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!