Rumah >pembangunan bahagian belakang >Tutorial Python >Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?
Manipulasi Data Pandas: Mengekstrak Nombor daripada Lajur Rentetan
Apabila bekerja dengan bingkai data dalam Pandas, ia menjadi perlu untuk melakukan pelbagai manipulasi untuk mengekstrak maklumat yang bermakna. Satu tugas sedemikian mungkin melibatkan mengekstrak nilai berangka daripada rentetan yang terkandung dalam lajur bingkai data. Di sini, kami meneroka senario khusus untuk menangani keperluan ini.
Pertimbangkan bingkai data berikut dengan lajur bernama 'A' yang mengandungi nilai rentetan:
<code class="python">import pandas as pd import numpy as np df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], }) print(df)</code>
Objektifnya adalah untuk ekstrak hanya nombor daripada setiap sel dalam lajur 'A', menghasilkan bingkai data baharu dengan lajur 'A' hanya mengandungi nilai angka.
Untuk mencapainya, seseorang boleh memanfaatkan str yang berkuasa .fungsi ekstrak dalam Panda. Dengan menggunakan kumpulan tangkapan regex dalam ungkapan str.extract, ia menjadi mungkin untuk mengasingkan dan mengekstrak digit daripada setiap rentetan dalam bingkai data:
<code class="python">df.A.str.extract('(\d+)')</code>
Corak regex '(d )' sepadan dengan satu atau lebih banyak digit (d) dan menangkapnya sebagai satu kumpulan (tanda kurungan ( dan )). Menjalankan kod di atas menghasilkan hasil berikut:
<code class="python"> A 0 1 1 NaN 2 10 3 100 4 0 Name: A, dtype: object</code>
Rentetan asal dalam lajur 'A' berjaya ditukar kepada nilai angka, manakala NaN dikekalkan untuk sel yang tiada nilai. Kaedah ini terbukti amat berkesan untuk mengekstrak nombor bulat daripada rentetan, menjadikannya alat yang berharga dalam analisis data dan senario manipulasi.
Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!