Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?

Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?

Barbara Streisand
Barbara Streisandasal
2024-10-30 07:38:27635semak imbas

How can I reshape long data into a wide format with multiple variables using Pandas?

Bentuk Semula Data Panjang ke dalam Format Luas dengan Panda

Apabila bekerja dengan data dalam format panjang, anda mungkin perlu membentuk semula data itu menjadi format yang luas untuk analisis dan visualisasi yang lebih baik. Satu cabaran biasa ialah untuk membentuk semula data berdasarkan berbilang pembolehubah.

Pertimbangkan kerangka data berikut:

salesman  height  product  price
Knut      6        bat          5
Knut      6        ball         1
Knut      6        wand         3
Steve     5        pen          2

Matlamatnya adalah untuk membentuk semula data ini ke dalam format yang luas:

salesman  height    product_1  price_1  product_2 price_2 product_3 price_3  
Knut      6        bat          5       ball      1        wand      3
Steve     5        pen          2        NA       NA        NA       NA

Walaupun cair/tindan/nyahtindan biasanya digunakan untuk membentuk semula data, data tersebut mungkin tidak sesuai untuk senario khusus ini.

Penyelesaian kepada masalah ini boleh didapati menggunakan kod berikut:

<code class="python">import pandas as pd

# Create sample data
raw_data = {
    'salesman': ['Knut', 'Knut', 'Knut', 'Steve'],
    'height': [6, 6, 6, 5],
    'product': ['bat', 'ball', 'wand', 'pen'],
    'price': [5, 1, 3, 2]
}

df = pd.DataFrame(raw_data)

# Reshape data
df_wide = df.pivot_table(index=['salesman', 'height'], columns='product', values='price')

# Reset index to get it in the desired format
df_wide = df_wide.reset_index(level=[0, 1])

# Rename columns
new_columns = ['salesman', 'height'] + [f'product_{i}' for i in range(1, df_wide.shape[1] - 1)] + [f'price_{i}' for i in range(1, df_wide.shape[1] - 1)]
df_wide.columns = new_columns

# Handle missing values
df_wide.fillna("NA", inplace=True)</code>

Bingkai data yang terhasil df_wide akan berada dalam format lebar yang diingini.

Atas ialah kandungan terperinci Bagaimanakah saya boleh membentuk semula data yang panjang ke dalam format yang luas dengan berbilang pembolehubah menggunakan Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn