Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Cara menggunakan ungkapan biasa Python untuk visualisasi data

Cara menggunakan ungkapan biasa Python untuk visualisasi data

WBOY
WBOYasal
2023-06-23 12:22:50951semak imbas

Ekspresi biasa Python ialah alat yang berkuasa untuk memproses data teks. Ungkapan biasa membantu anda mengekstrak, mengubah dan menggambarkan data daripada teks. Artikel ini akan memperkenalkan cara menggunakan ungkapan biasa Python untuk visualisasi data.

  1. Import perpustakaan berkaitan

Sebelum anda bermula, anda perlu memasang perpustakaan Python yang diperlukan: Pandas, Matplotlib dan Re. Anda boleh memasangnya menggunakan pip.

pip install pandas matplotlib re

Anda kemudiannya perlu mengimport perpustakaan ini ke dalam fail Python anda.

import pandas as pd
import matplotlib.pyplot as plt
import re
  1. Baca data

Dalam artikel ini, kami akan menggunakan fail hamparan yang mengandungi data tentang pendapatan dan perbelanjaan semasa wabak influenza. Pertama, anda perlu menggunakan fungsi read_excel daripada perpustakaan panda untuk membaca data dalam fail hamparan.

df = pd.read_excel('data.xlsx')
  1. Prapemprosesan Data

Sebelum anda boleh menggunakan ungkapan biasa untuk menggambarkan data, anda perlu melakukan beberapa operasi prapemprosesan data. Artikel ini akan menerangkan dua langkah prapemprosesan berikut:

  • Nyahformat data: Setiap sel dalam fail hamparan mungkin mengandungi data berformat, seperti nilai mata wang, peratusan, dsb. Anda perlu menyahformat data berformat ini untuk meneruskan ke langkah seterusnya.
  • Ekstrak data: Anda perlu mengekstrak data daripada setiap sel untuk menggambarkannya. Anda boleh menggunakan ungkapan biasa untuk mengekstrak data tertentu.

Fungsi berikut boleh menyahformat data:

rreee

Fungsi berikut boleh mengekstrak data tertentu:

def strip_currency(val):
    return re.sub(r'[^d.]', '', val)

Anda boleh menggunakannya pada hamparan anda menggunakan fungsi guna setiap sel. Berikut ialah kod untuk menggunakan fungsi di atas:

def extract_number(val):
    return re.findall(r'd+.?d*', val)[0]
  1. Memvisualisasikan data

Setelah anda tidak memformat dan mengekstrak data daripada setiap sel, anda kini boleh menggunakan perpustakaan Matplotlib memvisualisasikannya. Dalam artikel ini, kami akan menggunakan plot berselerak untuk mewakili hubungan antara pendapatan dan perbelanjaan.

df['income'] = df['income'].apply(strip_currency).apply(extract_number).astype(float)
df['expenses'] = df['expenses'].apply(strip_currency).apply(extract_number).astype(float)

Kod ini akan mencipta plot berselerak dengan pendapatan pada paksi mendatar dan perbelanjaan pada paksi menegak.

Itulah langkah asas tentang cara menggunakan ungkapan biasa Python untuk visualisasi data. Anda boleh terus memproses dan menggambarkan data seperti yang diperlukan untuk memahaminya dengan lebih baik.

Atas ialah kandungan terperinci Cara menggunakan ungkapan biasa Python untuk visualisasi data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn