Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menambah Berbilang Lajur dengan Cekap pada Pandas DataFrame Serentak?

Bagaimana untuk Menambah Berbilang Lajur dengan Cekap pada Pandas DataFrame Serentak?

Linda Hamilton
Linda Hamiltonasal
2024-10-25 12:36:02331semak imbas

How to Efficiently Add Multiple Columns to a Pandas DataFrame Simultaneously?

Menambah Berbilang Lajur pada Pandas DataFrame Serentak

Dalam manipulasi data Pandas, menambahkan berbilang lajur baharu pada DataFrame dengan cekap boleh menjadi tugas yang memerlukan penyelesaian yang elegan. Walaupun pendekatan intuitif menggunakan sintaks senarai lajur dengan tanda yang sama kelihatan mudah, ia boleh membawa kepada hasil yang tidak dijangka.

Cabaran

Seperti yang digambarkan dalam contoh yang disediakan, sintaks berikut gagal mencipta lajur baharu seperti yang dimaksudkan:

<code class="python">df[['column_new_1', 'column_new_2', 'column_new_3']] = [np.nan, 'dogs', 3]</code>

Ini kerana Pandas memerlukan bahagian kanan tugasan untuk menjadi DataFrame apabila menggunakan sintaks senarai lajur. Nilai atau senarai skalar tidak serasi dengan pendekatan ini.

Penyelesaian

Beberapa kaedah alternatif menawarkan penyelesaian yang berdaya maju untuk menambah berbilang lajur serentak:

Kaedah 1: Tugasan Individu Menggunakan Iterator Unpacking

<code class="python">df['column_new_1'], df['column_new_2'], df['column_new_3'] = np.nan, 'dogs', 3</code>

Kaedah 2: Kembangkan Baris Tunggal untuk Memadankan Indeks

<code class="python">df[['column_new_1', 'column_new_2', 'column_new_3']] = pd.DataFrame([[np.nan, 'dogs', 3]], index=df.index)</code>

Kaedah 3: Gabungkan dengan Bingkai Data Sementara Menggunakan pd.concat

<code class="python">df = pd.concat(
    [
        df,
        pd.DataFrame(
            [[np.nan, 'dogs', 3]], 
            index=df.index, 
            columns=['column_new_1', 'column_new_2', 'column_new_3']
        )
    ], axis=1
)</code>

Kaedah 4: Gabungkan dengan Temporary DataFrame Menggunakan .join

<code class="python">df = df.join(pd.DataFrame(
    [[np.nan, 'dogs', 3]], 
    index=df.index, 
    columns=['column_new_1', 'column_new_2', 'column_new_3']
))</code>

Kaedah 5: Gunakan Kamus untuk Sementara DataFrame

<code class="python">df = df.join(pd.DataFrame(
    {
        'column_new_1': np.nan,
        'column_new_2': 'dogs',
        'column_new_3': 3
    }, index=df.index
))</code>

Kaedah 6: Gunakan .assign() dengan Argumen Berbilang Lajur

<code class="python">df = df.assign(column_new_1=np.nan, column_new_2='dogs', column_new_3=3)</code>

Kaedah 7: Buat Lajur, Kemudian Berikan Nilai

<code class="python">new_cols = ['column_new_1', 'column_new_2', 'column_new_3']
new_vals = [np.nan, 'dogs', 3]
df = df.reindex(columns=df.columns.tolist() + new_cols)    # add empty cols
df[new_cols] = new_vals        # multi-column assignment works for existing cols</code>

Kaedah 8: Tugasan Berbilang Berurutan

<code class="python">df['column_new_1'] = np.nan
df['column_new_2'] = 'dogs'
df['column_new_3'] = 3</code>

Memilih kaedah yang paling sesuai akan bergantung pada faktor seperti saiz DataFrame, bilangan lajur baharu yang akan ditambah, dan keperluan prestasi tugasan. Namun begitu, teknik ini memperkasakan pengguna Pandas dengan pelbagai pilihan untuk menambahkan berbilang lajur secara cekap pada DataFrames mereka.

Atas ialah kandungan terperinci Bagaimana untuk Menambah Berbilang Lajur dengan Cekap pada Pandas DataFrame Serentak?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn