Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Memisahkan Sel kepada Berbilang Baris dalam Bingkai Data Pandas Berdasarkan Nilai Dipisahkan Koma?

Bagaimana untuk Memisahkan Sel kepada Berbilang Baris dalam Bingkai Data Pandas Berdasarkan Nilai Dipisahkan Koma?

Patricia Arquette
Patricia Arquetteasal
2024-10-28 06:41:30754semak imbas

How to Split a Cell into Multiple Rows in a Pandas Dataframe Based on Comma-Separated Values?

Pisah Sel kepada Berbilang Baris dalam Bingkai Data Pandas

Masalah:

Anda mempunyai Panda kerangka data dengan data pesanan di mana setiap pesanan mengandungi berbilang pakej yang disimpan sebagai rentetan dipisahkan koma dalam lajur 'pakej' dan 'kod_pakej'. Anda berhasrat untuk memisahkan data pakej dan membuat baris baharu untuk setiap pakej dengan butiran pesanan yang sepadan.

Penyelesaian:

Untuk Versi Pandas >= 0.25:

<code class="python">df.set_index(['order_id', 'order_date']) \
    .apply(lambda x: x.str.split(',').explode()) \
    .reset_index()</code>

Untuk versi Panda <= 0.24:

<code class="python">df.set_index(['order_date', 'order_id']) \
    .stack() \
    .str.split(',', expand=True) \
    .stack() \
    .unstack(-2) \
    .reset_index(-1, drop=True) \
    .reset_index()

Penjelasan:

1. Tetapkan Indeks: Tetapkan lajur yang sepatutnya kekal utuh ('order_id' dan 'order_date') sebagai indeks bingkai data.

2. Pisah dan Tindanan:

  • Untuk Panda >= 0.25: Gunakan apply(lambda x: x.str.split(',').explode()) untuk membelah dipisahkan koma lajur 'package' dan 'package_code' dan kembangkannya menjadi berbilang baris.
  • Untuk Panda <= 0.24: Gunakan stack(), str.split(), dan stack() sekali lagi untuk membahagi dan menyusun data .
  • 3. Nyahtindan dan Tetapkan Semula Indeks:

    • Nyahtindan pada tahap kedua terakhir (-2) untuk mencipta lajur baharu bagi data pakej pisah dan kod pakej.
    • Tetapkan semula indeks kepada kembalikan perubahan indeks dan dapatkan bingkai data akhir.

    Atas ialah kandungan terperinci Bagaimana untuk Memisahkan Sel kepada Berbilang Baris dalam Bingkai Data Pandas Berdasarkan Nilai Dipisahkan Koma?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn