Rumah  >  Artikel  >  pembangunan bahagian belakang  >  Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?

Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?

Linda Hamilton
Linda Hamiltonasal
2024-10-24 13:28:31958semak imbas

How to Extract Numeric Values from String Columns in Pandas?

Manipulasi Data Pandas: Mengekstrak Nombor daripada Lajur Rentetan

Apabila bekerja dengan bingkai data dalam Pandas, ia menjadi perlu untuk melakukan pelbagai manipulasi untuk mengekstrak maklumat yang bermakna. Satu tugas sedemikian mungkin melibatkan mengekstrak nilai berangka daripada rentetan yang terkandung dalam lajur bingkai data. Di sini, kami meneroka senario khusus untuk menangani keperluan ini.

Pertimbangkan bingkai data berikut dengan lajur bernama 'A' yang mengandungi nilai rentetan:

<code class="python">import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)</code>

Objektifnya adalah untuk ekstrak hanya nombor daripada setiap sel dalam lajur 'A', menghasilkan bingkai data baharu dengan lajur 'A' hanya mengandungi nilai angka.

Untuk mencapainya, seseorang boleh memanfaatkan str yang berkuasa .fungsi ekstrak dalam Panda. Dengan menggunakan kumpulan tangkapan regex dalam ungkapan str.extract, ia menjadi mungkin untuk mengasingkan dan mengekstrak digit daripada setiap rentetan dalam bingkai data:

<code class="python">df.A.str.extract('(\d+)')</code>

Corak regex '(d )' sepadan dengan satu atau lebih banyak digit (d) dan menangkapnya sebagai satu kumpulan (tanda kurungan ( dan )). Menjalankan kod di atas menghasilkan hasil berikut:

<code class="python">    A
0   1
1   NaN
2   10
3   100
4   0
Name: A, dtype: object</code>

Rentetan asal dalam lajur 'A' berjaya ditukar kepada nilai angka, manakala NaN dikekalkan untuk sel yang tiada nilai. Kaedah ini terbukti amat berkesan untuk mengekstrak nombor bulat daripada rentetan, menjadikannya alat yang berharga dalam analisis data dan senario manipulasi.

Atas ialah kandungan terperinci Bagaimana untuk Mengekstrak Nilai Berangka daripada Lajur Rentetan dalam Panda?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan:
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn