Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengeluarkan Aksara Tidak Diingini dengan Cekap daripada Lajur Rentetan dalam DataFrame?

Bagaimana untuk Mengeluarkan Aksara Tidak Diingini dengan Cekap daripada Lajur Rentetan dalam DataFrame?

DDD
DDDasal
2024-11-10 16:37:02541semak imbas

How to Efficiently Remove Unwanted Characters from a String Column in a DataFrame?

Manipulasi Rentetan yang Cekap dalam DataFrames

Memanipulasi rentetan dalam DataFrame ialah tugas biasa dalam analisis data. Dalam kes ini, kami berusaha untuk mengalih keluar aksara yang tidak diingini daripada lajur yang mengandungi rentetan.

Untuk mencapai ini, kami boleh menggunakan pengakses .str. Walau bagaimanapun, seperti yang anda temui, penggunaan terus .str.lstrip(' -').rstrip('aAbBcC') mengakibatkan ralat. Ini kerana kaedah .str mengharapkan satu fungsi sebagai hujah.

Untuk menyelesaikannya, kita boleh menggunakan fungsi .map untuk menggunakan fungsi lambda berikut pada setiap elemen dalam lajur:

lambda x: x.lstrip('+-').rstrip('aAbBcC')

Fungsi ini mengalih keluar aksara ' ' atau '-' di hadapan dan aksara 'a', 'A', 'b', 'B' atau 'c' di belakang daripada setiap rentetan. Dengan menggunakan fungsi ini pada lajur hasil, kami memperoleh nilai dipangkas yang diingini.

Coretan kod berikut menunjukkan penyelesaian:

data['result'] = data['result'].map(lambda x: x.lstrip('+-').rstrip('aAbBcC'))

Atas ialah kandungan terperinci Bagaimana untuk Mengeluarkan Aksara Tidak Diingini dengan Cekap daripada Lajur Rentetan dalam DataFrame?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn