Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menambah Berbilang Lajur dengan Cekap pada Pandas DataFrame Serentak?
Dalam manipulasi data Pandas, menambahkan berbilang lajur baharu pada DataFrame dengan cekap boleh menjadi tugas yang memerlukan penyelesaian yang elegan. Walaupun pendekatan intuitif menggunakan sintaks senarai lajur dengan tanda yang sama kelihatan mudah, ia boleh membawa kepada hasil yang tidak dijangka.
Seperti yang digambarkan dalam contoh yang disediakan, sintaks berikut gagal mencipta lajur baharu seperti yang dimaksudkan:
<code class="python">df[['column_new_1', 'column_new_2', 'column_new_3']] = [np.nan, 'dogs', 3]</code>
Ini kerana Pandas memerlukan bahagian kanan tugasan untuk menjadi DataFrame apabila menggunakan sintaks senarai lajur. Nilai atau senarai skalar tidak serasi dengan pendekatan ini.
Beberapa kaedah alternatif menawarkan penyelesaian yang berdaya maju untuk menambah berbilang lajur serentak:
Kaedah 1: Tugasan Individu Menggunakan Iterator Unpacking
<code class="python">df['column_new_1'], df['column_new_2'], df['column_new_3'] = np.nan, 'dogs', 3</code>
Kaedah 2: Kembangkan Baris Tunggal untuk Memadankan Indeks
<code class="python">df[['column_new_1', 'column_new_2', 'column_new_3']] = pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index)</code>
Kaedah 3: Gabungkan dengan Bingkai Data Sementara Menggunakan pd.concat
<code class="python">df = pd.concat( [ df, pd.DataFrame( [[np.nan, 'dogs', 3]], index=df.index, columns=['column_new_1', 'column_new_2', 'column_new_3'] ) ], axis=1 )</code>
Kaedah 4: Gabungkan dengan Temporary DataFrame Menggunakan .join
<code class="python">df = df.join(pd.DataFrame( [[np.nan, 'dogs', 3]], index=df.index, columns=['column_new_1', 'column_new_2', 'column_new_3'] ))</code>
Kaedah 5: Gunakan Kamus untuk Sementara DataFrame
<code class="python">df = df.join(pd.DataFrame( { 'column_new_1': np.nan, 'column_new_2': 'dogs', 'column_new_3': 3 }, index=df.index ))</code>
Kaedah 6: Gunakan .assign() dengan Argumen Berbilang Lajur
<code class="python">df = df.assign(column_new_1=np.nan, column_new_2='dogs', column_new_3=3)</code>
Kaedah 7: Buat Lajur, Kemudian Berikan Nilai
<code class="python">new_cols = ['column_new_1', 'column_new_2', 'column_new_3'] new_vals = [np.nan, 'dogs', 3] df = df.reindex(columns=df.columns.tolist() + new_cols) # add empty cols df[new_cols] = new_vals # multi-column assignment works for existing cols</code>
Kaedah 8: Tugasan Berbilang Berurutan
<code class="python">df['column_new_1'] = np.nan df['column_new_2'] = 'dogs' df['column_new_3'] = 3</code>
Memilih kaedah yang paling sesuai akan bergantung pada faktor seperti saiz DataFrame, bilangan lajur baharu yang akan ditambah, dan keperluan prestasi tugasan. Namun begitu, teknik ini memperkasakan pengguna Pandas dengan pelbagai pilihan untuk menambahkan berbilang lajur secara cekap pada DataFrames mereka.
Atas ialah kandungan terperinci Bagaimana untuk Menambah Berbilang Lajur dengan Cekap pada Pandas DataFrame Serentak?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!