Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk menambahkan berbilang lajur pada Pandas DataFrame dengan cekap dalam satu tugasan?

Bagaimana untuk menambahkan berbilang lajur pada Pandas DataFrame dengan cekap dalam satu tugasan?

Susan Sarandon
Susan Sarandonasal
2024-10-25 13:06:02950semak imbas

How to efficiently add multiple columns to a Pandas DataFrame in a single assignment?

Menambah Berbilang Lajur pada Bingkai Data Pandas dalam Satu Tugasan

Dalam Pandas, menambah berbilang lajur secara serentak boleh dicapai dalam pelbagai cara. Satu pendekatan adalah untuk memberikan nilai kepada setiap lajur secara individu, tetapi ini boleh menjadi membosankan untuk berbilang lajur. Kaedah yang lebih cekap ialah menambah lajur dalam satu langkah.

Sepintas lalu, menetapkan senarai atau tatasusunan kepada berbilang lajur baharu menggunakan sintaks senarai lajur (cth., df[['new1', 'new2 ]] = [skalar, skalar]) mungkin kelihatan intuitif. Walau bagaimanapun, tugasan ini hanya berfungsi untuk lajur sedia ada.

Untuk menambah lajur baharu dan menetapkan nilai dalam satu operasi, anda boleh menggunakan beberapa pendekatan:

1. Pembongkaran Lelaran:

<code class="python">df['new1'], df['new2'], df['new3'] = np.nan, 'dogs', 3</code>

Pendekatan ini memberikan nilai secara berulang kepada setiap lajur baharu.

2. Pengembangan DataFrame:

<code class="python">df[['new1', 'new2', 'new3']] = pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index)</code>

Kaedah ini mencipta DataFrame dengan satu baris yang sepadan dengan indeks DataFrame asal, kemudian menggunakan fungsi concat Pandas untuk menggabungkan lajur baharu kepada yang asal.

3. Temporary DataFrame Join:

<code class="python">df = pd.concat([df, pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index, columns=['new1', 'new2', 'new3'])], axis=1)</code>

Pendekatan ini mencipta DataFrame sementara dengan lajur dan nilai baharu, kemudian bergabung dengan DataFrame asal.

4. Tugasan Kamus:

<code class="python">df = df.join(pd.DataFrame({'new1': np.nan, 'new2': 'dogs', 'new3': 3}, index=df.index))</code>

Kaedah ini menggunakan kamus untuk mencipta DataFrame sementara yang kemudiannya digabungkan dengan DataFrame asal.

5. Kaedah .assign():

<code class="python">df = df.assign(new1=np.nan, new2='dogs', new3=3)</code>

Kaedah .assign() membenarkan penugasan berbilang lajur sekaligus.

6. Cipta Lajur dan Berikan Nilai:

<code class="python">new_cols = ['new1', 'new2', 'new3']
new_vals = [np.nan, 'dogs', 3]
df = df.reindex(columns=df.columns.tolist() + new_cols)
df[new_cols] = new_vals</code>

Teknik ini mencipta lajur kosong dan memberikan nilai secara berasingan.

Berbilang Tugasan Individu:

<code class="python">df['new1'] = np.nan
df['new2'] = 'dogs'
df['new3'] = 3</code>

Walaupun tidak secekap kaedah lain, tugasan individu adalah mudah dan boleh digunakan untuk sebilangan kecil lajur baharu.

Pilihan terbaik bergantung pada keperluan khusus dan pertimbangan prestasi. Untuk menambah berbilang lajur secara serentak, pengembangan DataFrame atau pendekatan gabungan DataFrame sementara menyediakan penyelesaian yang ringkas dan cekap.

Atas ialah kandungan terperinci Bagaimana untuk menambahkan berbilang lajur pada Pandas DataFrame dengan cekap dalam satu tugasan?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn