首頁  >  文章  >  後端開發  >  如何從 Pandas 中的非數字字串中提取數字?

如何從 Pandas 中的非數字字串中提取數字?

Mary-Kate Olsen
Mary-Kate Olsen原創
2024-10-24 14:15:02648瀏覽

How to Extract Numbers from Non-Numeric Strings in Pandas?

Pandas:從字串中提取數字

在 Pandas 中處理資料框時,通常需要從包含非-數字字元。這可能具有挑戰性,但 Pandas 提供了多種方法來幫助您實現這一目標。

使用 str.extract() 進行數位擷取

一種從字串是str.extract()。此方法可讓您指定定義要擷取的數字資料的正規表示式模式。

考慮以下資料框:

<code class="python">import pandas as pd
import numpy as np
df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'],
                   })
print(df)</code>

輸出:

    A
0   1a
1   NaN
2   10a
3   100b
4   0b

要從每個單元格中提取數字,您可以使用以下正規表示式:

<code class="python">df.A.str.extract('(\d+)')</code>

正規表示式模式(d ) 擷取一個或多個數字的任何序列。模式兩邊的括號會建立一個捕獲組,用於傳回字串的匹配部分。

輸出:

0      1
1    NaN
2     10
3    100
4      0
Name: A, dtype: object

如您所見,所需的數字已成功獲取從每個單元格中提取,即使是那些包含非數字字符的單元格。請注意,此方法僅適用於整數,不適用於浮點數。

以上是如何從 Pandas 中的非數字字串中提取數字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn