Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengubah Jenis Data Lajur dengan Cekap dalam Pandas DataFrames?
Tukar Jenis Lajur dalam Panda
Apabila bekerja dengan DataFrame panda, anda mungkin perlu menukar jenis data lajur tertentu. Terdapat berbilang kaedah yang tersedia untuk melaksanakan operasi ini, setiap satu dengan kelebihan dan hadnya sendiri.
Menggunakan to_numeric()
Fungsi to_numeric() boleh digunakan untuk menukar lajur kepada jenis angka (cth., integer atau terapung). Ia boleh mengendalikan nilai yang hilang (NaNs) dan mempunyai pilihan untuk menurunkan kepada jenis d yang lebih padat. Walau bagaimanapun, ia mungkin tidak sesuai jika nilai mengandungi aksara bukan angka.
Menggunakan astype()
Kaedah astype() menyediakan pilihan yang lebih luas untuk penukaran jenis data. Ia boleh menukar lajur kepada mana-mana jenis yang disokong oleh NumPy atau panda, termasuk jenis kategori. Walau bagaimanapun, ia juga boleh menyebabkan kehilangan data atau penukaran yang salah jika nilai tidak boleh ditukar kepada jenis yang diingini.
Menggunakan infer_objects()
Kaedah infer_objects() telah diperkenalkan dalam panda 0.21.0 dan boleh melakukan penukaran "lembut". Ia cuba membuat kesimpulan jenis angka yang paling sesuai untuk lajur objek berdasarkan nilainya. Walaupun ia boleh menjadi mudah, ia mungkin tidak selalu menghasilkan hasil yang diingini.
Menggunakan convert_dtypes()
Kaedah convert_dtypes() yang diperkenalkan dalam panda 1.0, bertujuan untuk tukar lajur kepada jenis d "terbaik mungkin" yang menyokong nilai yang tiada. Ia mengimbangi fleksibiliti dengan ketepatan, menyediakan cara yang mudah untuk menukar lajur tanpa menyatakan jenis sasaran.
Apabila memilih kaedah yang sesuai untuk penukaran jenis, pertimbangkan faktor berikut:
Atas ialah kandungan terperinci Bagaimana untuk Mengubah Jenis Data Lajur dengan Cekap dalam Pandas DataFrames?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!