Heim  >  Artikel  >  Backend-Entwicklung  >  So verwenden Sie reguläre Python-Ausdrücke zur Datenvisualisierung

So verwenden Sie reguläre Python-Ausdrücke zur Datenvisualisierung

WBOY
WBOYOriginal
2023-06-23 12:22:50951Durchsuche

Python-reguläre Ausdrücke sind ein leistungsstarkes Werkzeug zur Verarbeitung von Textdaten. Mit regulären Ausdrücken können Sie Daten aus Text extrahieren, transformieren und visualisieren. In diesem Artikel wird erläutert, wie Sie reguläre Python-Ausdrücke zur Datenvisualisierung verwenden.

  1. Zugehörige Bibliotheken importieren

Bevor Sie beginnen, müssen Sie die erforderlichen Python-Bibliotheken installieren: Pandas, Matplotlib und Re. Sie können es mit pip installieren.

pip install pandas matplotlib re

Sie müssen diese Bibliotheken dann in Ihre Python-Datei importieren.

import pandas as pd
import matplotlib.pyplot as plt
import re
  1. Daten lesen

In diesem Artikel verwenden wir eine Tabellenkalkulationsdatei, die Daten über Einnahmen und Ausgaben während der Pandemie enthält. Zunächst müssen Sie die Funktion read_excel aus der Pandas-Bibliothek verwenden, um die Daten in der Tabellenkalkulationsdatei zu lesen.

df = pd.read_excel('data.xlsx')
  1. Datenvorverarbeitung

Bevor Sie reguläre Ausdrücke zur Visualisierung von Daten verwenden, müssen Sie einige Datenvorverarbeitungsvorgänge durchführen. In diesem Artikel werden die folgenden zwei Vorverarbeitungsschritte beschrieben:

  • Daten unformatieren: Jede Zelle in einer Tabellenkalkulationsdatei kann formatierte Daten wie Währungswerte, Prozentsätze usw. enthalten. Sie müssen diese formatierten Daten deformatieren, um mit dem nächsten Schritt fortfahren zu können.
  • Daten extrahieren: Sie müssen Daten aus jeder Zelle extrahieren, um sie zu visualisieren. Sie können reguläre Ausdrücke verwenden, um bestimmte Daten zu extrahieren.

Die folgenden Funktionen können Daten entformatieren:

def strip_currency(val):
    return re.sub(r'[^d.]', '', val)

Die folgenden Funktionen können bestimmte Daten extrahieren:

def extract_number(val):
    return re.findall(r'd+.?d*', val)[0]

Sie können sie mit der Anwenden-Funktion auf jede Zelle Ihrer Tabelle anwenden. Hier ist der Code, der die obige Funktion anwendet:

df['income'] = df['income'].apply(strip_currency).apply(extract_number).astype(float)
df['expenses'] = df['expenses'].apply(strip_currency).apply(extract_number).astype(float)
  1. Daten visualisieren

Sobald Sie die Daten aus jeder Zelle entformatiert und extrahiert haben, können Sie sie jetzt mithilfe der Matplotlib-Bibliothek visualisieren. In diesem Artikel verwenden wir ein Streudiagramm, um die Beziehung zwischen Einnahmen und Ausgaben darzustellen.

plt.scatter(df['income'], df['expenses'])
plt.xlabel('Income')
plt.ylabel('Expenses')
plt.show()

Dieser Code erstellt ein Streudiagramm mit Einnahmen auf der horizontalen Achse und Ausgaben auf der vertikalen Achse.

Das sind die grundlegenden Schritte zur Verwendung regulärer Python-Ausdrücke zur Datenvisualisierung. Sie können die Daten nach Bedarf weiter verarbeiten und visualisieren, um sie besser zu verstehen.

Das obige ist der detaillierte Inhalt vonSo verwenden Sie reguläre Python-Ausdrücke zur Datenvisualisierung. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn