Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Menggabungkan DataFrames pada Lajur Sambil Memelihara Maklumat Awal dalam Satu DataFrame?
Menggabungkan DataFrames pada Lajur Sambil Memelihara Maklumat Awal
Walaupun menggunakan fungsi gabungan Pandas, anda mengalami kesukaran dengan menggabungkan bingkai data df1 dan df2 pada lajur 'Nama' sambil mengekalkan maklumat df1.
Isu:
Dalam operasi cantum anda:
df1 = pd.merge(df1, df2, on = 'Nama', bagaimana = 'luar')
Anda sedang melakukan gabungan luar, yang merangkumi individu daripada kedua-dua bingkai data. Ini menyebabkan kemasukan individu daripada df2 dalam df1, walaupun mereka tidak muncul dalam df1 pada asalnya.
Penyelesaian:
Untuk menangani isu ini, anda boleh menggunakan satu daripada kaedah berikut:
Kaedah 1: Menggunakan peta mengikut Siri yang dicipta oleh set_index:
df1['Sex'] = df1['Name'].map(df2.set_index('Name')['Sex'])
Pendekatan ini mewujudkan Siri dengan 'Nama' sebagai indeks daripada lajur 'Sex' df2. Kemudian, lajur 'Nama' df1 dipetakan ke Siri ini untuk menetapkan nilai 'Sex' yang sepadan. Nilai yang hilang diselesaikan dengan menetapkannya kepada NaN.
Kaedah 2: Melakukan sambung kiri:
df = df1.merge(df2[['Name','Sex']], on='Name', how='left')
Sambung kiri memastikan individu daripada df1 diutamakan, dengan nilai yang tiada diisi dengan NaN jika ia tidak terdapat dalam df2.
Pertimbangan:
Atas ialah kandungan terperinci Bagaimana untuk Menggabungkan DataFrames pada Lajur Sambil Memelihara Maklumat Awal dalam Satu DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!