Rumah >pembangunan bahagian belakang >Tutorial Python >Cara Mudah Mengenalpasti dan Memaparkan Perbezaan Antara DataFrames
Bandingkan DataFrames dan Perbezaan Paparan Bersebelahan
Dalam usaha mengenal pasti percanggahan data, keperluan sering timbul untuk membandingkan dua bingkai data dan menyerlahkan perubahan di antara mereka. Pertimbangkan contoh berikut:
"StudentRoster Jan-1": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.11 False Graduated 113 Zoe 4.12 True "StudentRoster Jan-2": id Name score isEnrolled Comment 111 Jack 2.17 True He was late to class 112 Nick 1.21 False Graduated 113 Zoe 4.12 False On vacation
Untuk mencapai output yang diingini, mula-mula tentukan baris yang telah mengalami sebarang perubahan:
ne = (df1 != df2).any(1)
Seterusnya, kenal pasti entri khusus yang telah berubah:
ne_stacked = (df1 != df2).stack() changed = ne_stacked[ne_stacked] changed.index.names = ['id', 'col']
Teruskan untuk mengekstrak nilai asal dan dikemas kini untuk entri yang diubah:
difference_locations = np.where(df1 != df2) changed_from = df1.values[difference_locations] changed_to = df2.values[difference_locations]
Akhir sekali, tunjukkan perbezaan dalam format jadual yang mesra pengguna:
pd.DataFrame({'from': changed_from, 'to': changed_to}, index=changed.index)
Pendekatan ini menyediakan ringkasan menyeluruh tentang perbezaan antara dua bingkai data, menyerlahkan kedua-dua nilai yang diubah dan lokasinya, membolehkan analisis percanggahan data yang cepat dan cekap.
Atas ialah kandungan terperinci Cara Mudah Mengenalpasti dan Memaparkan Perbezaan Antara DataFrames. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!