Rumah > Artikel > pembangunan bahagian belakang > Bagaimana untuk Mengekstrak Nombor daripada Rentetan dalam Panda Menggunakan str.extract()?
Mengekstrak Nombor daripada Rentetan dalam Panda
Untuk mengekstrak nombor daripada rentetan dalam bingkai data Pandas, pertimbangkan untuk menggunakan kaedah str.extract. Kaedah ini membolehkan penggunaan ungkapan biasa untuk mengekstrak corak tertentu daripada nilai rentetan bingkai data.
Dalam contoh yang diberikan, bingkai data df mengandungi lajur 'A' dengan jenis data bercampur, termasuk rentetan yang mengandungi nombor. Untuk mengekstrak nombor sahaja, kumpulan tangkapan regex boleh digunakan:
<code class="python">df.A.str.extract('(\d+)')</code>
Corak ungkapan biasa (d ) menentukan kumpulan tangkapan yang sepadan dengan satu atau lebih digit (d). Ini akan mengasingkan nombor dalam setiap rentetan.
Hasilnya ialah lajur bingkai data baharu yang mengandungi nombor yang diekstrak:
A 0 1 1 NaN 2 10 3 100 4 0
Perhatikan bahawa kaedah ini hanya berfungsi untuk nombor bulat dan bukan terapung . Untuk corak atau kes yang lebih kompleks di mana nombor dipisahkan oleh bukan digit, sintaks ungkapan biasa tambahan mungkin diperlukan.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Nombor daripada Rentetan dalam Panda Menggunakan str.extract()?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!