Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana Mengenalpasti Baris Hadir dalam Satu Pandas DataFrame tetapi Tidak Hadir dalam Satu Lagi?
Memandangkan dua bingkai data Pandas (df1 dan df2) dengan baris bersilang, tugasnya adalah untuk mengasingkan baris dalam df1 yang tiada dalam df2.
Untuk menyelesaikan masalah ini, kami boleh melakukan gabungan kiri dari df1 ke df2, memastikan kami menghapuskan pendua dalam df2 untuk memastikan setiap baris df1 bercantum dengan hanya satu baris df2.
df_all = df1.merge(df2.drop_duplicates(), on=['col1', 'col2'], how='left', indicator=True)
Cantum kiri ini mencipta lajur tambahan _cantum yang menunjukkan asal setiap baris.
Untuk menapis baris eksklusif kepada df1, kami menggunakan syarat boolean:
df_filtered = df_all[df_all['_merge'] == 'left_only']
Sesetengah penyelesaian tersilap dalam menyemak setiap nilai dalam setiap lajur secara bebas dan bukannya mempertimbangkan kehadiran mengikut baris. Sebagai contoh, penyelesaian ini:
(~df1.col1.isin(common.col1)) & (~df1.col2.isin(common.col2))
mengembalikan hasil yang salah kerana ia gagal menangkap baris dengan nilai [3, 10], yang tiada persamaan:
0 False 1 False 2 False 3 True 4 True 5 False dtype: bool
Atas ialah kandungan terperinci Bagaimana Mengenalpasti Baris Hadir dalam Satu Pandas DataFrame tetapi Tidak Hadir dalam Satu Lagi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!