Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana Mengenalpasti Baris Hadir dalam Satu Pandas DataFrame tetapi Tidak Hadir dalam Satu Lagi?

Bagaimana Mengenalpasti Baris Hadir dalam Satu Pandas DataFrame tetapi Tidak Hadir dalam Satu Lagi?

DDD
DDDasal
2024-12-14 08:20:15393semak imbas

How to Identify Rows Present in One Pandas DataFrame but Absent in Another?

Mengenalpasti Baris Berbeza antara DataFrames

Pernyataan Masalah

Memandangkan dua bingkai data Pandas (df1 dan df2) dengan baris bersilang, tugasnya adalah untuk mengasingkan baris dalam df1 yang tiada dalam df2.

Penyelesaian

Untuk menyelesaikan masalah ini, kami boleh melakukan gabungan kiri dari df1 ke df2, memastikan kami menghapuskan pendua dalam df2 untuk memastikan setiap baris df1 bercantum dengan hanya satu baris df2.

df_all = df1.merge(df2.drop_duplicates(), on=['col1', 'col2'], how='left', indicator=True)

Cantum kiri ini mencipta lajur tambahan _cantum yang menunjukkan asal setiap baris.

Untuk menapis baris eksklusif kepada df1, kami menggunakan syarat boolean:

df_filtered = df_all[df_all['_merge'] == 'left_only']

Penyelesaian Salah

Sesetengah penyelesaian tersilap dalam menyemak setiap nilai dalam setiap lajur secara bebas dan bukannya mempertimbangkan kehadiran mengikut baris. Sebagai contoh, penyelesaian ini:

(~df1.col1.isin(common.col1)) & (~df1.col2.isin(common.col2))

mengembalikan hasil yang salah kerana ia gagal menangkap baris dengan nilai [3, 10], yang tiada persamaan:

0    False
1    False
2    False
3     True
4     True
5    False
dtype: bool

Atas ialah kandungan terperinci Bagaimana Mengenalpasti Baris Hadir dalam Satu Pandas DataFrame tetapi Tidak Hadir dalam Satu Lagi?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn