Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Memisahkan DataFrame Panda Besar kepada Berbilang Kumpulan dengan Pembahagian Tidak Sekata Menggunakan np.array_split?

Bagaimana untuk Memisahkan DataFrame Panda Besar kepada Berbilang Kumpulan dengan Pembahagian Tidak Sekata Menggunakan np.array_split?

Susan Sarandon
Susan Sarandonasal
2024-10-27 02:26:30483semak imbas

How to Split a Large Pandas DataFrame into Multiple Groups with Uneven Divisions Using np.array_split?

Cara Memisahkan Bingkai Data Panda Besar kepada Berbilang Kumpulan dengan np.array_split

Apabila berurusan dengan bingkai data yang besar, mungkin perlu untuk berpecah mereka menjadi bahagian yang lebih kecil dan lebih mudah diurus. Ini membolehkan pemprosesan dan analisis yang lebih cekap. Satu kaedah untuk memisahkan bingkai data ialah menggunakan fungsi np.split(). Walau bagaimanapun, fungsi ini boleh menghadapi masalah apabila bingkai data tidak boleh dibahagikan sama rata dengan bilangan pecahan yang diingini.

Alternatif yang lebih sesuai untuk situasi ini ialah menggunakan fungsi np.array_split(). Fungsi ini membenarkan parameter indeks_or_sections menjadi integer yang tidak membahagikan paksi sama rata.

<code class="python">import pandas as pd
import numpy as np

# Create a large dataframe
df = pd.DataFrame(...)

# Define the number of groups to split the dataframe into
n_groups = 4

# Split the dataframe using np.array_split()
dataframe_chunks = np.array_split(df, n_groups)

# Iterate over the dataframe chunks and print their contents
for item in dataframe_chunks:
    print(item)</code>

Nota Tambahan:

  • NP.array_split( ) fungsi mengambil dua argumen: bingkai data untuk dipecahkan dan bilangan kumpulan yang dikehendaki.
  • Tidak seperti np.split(), np.array_split() membenarkan pembahagian bingkai data yang tidak sekata.
  • Nilai yang dikembalikan bagi np.array_split() ialah senarai bingkai data, setiap satu mewakili bahagian pecahan bingkai data asal.

Atas ialah kandungan terperinci Bagaimana untuk Memisahkan DataFrame Panda Besar kepada Berbilang Kumpulan dengan Pembahagian Tidak Sekata Menggunakan np.array_split?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn