Pandas:從字串中提取數字
在 Pandas 中處理資料框時,通常需要從包含非-數字字元。這可能具有挑戰性,但 Pandas 提供了多種方法來幫助您實現這一目標。
使用 str.extract() 進行數位擷取
一種從字串是str.extract()。此方法可讓您指定定義要擷取的數字資料的正規表示式模式。
考慮以下資料框:
<code class="python">import pandas as pd import numpy as np df = pd.DataFrame({'A':['1a',np.nan,'10a','100b','0b'], }) print(df)</code>
輸出:
A 0 1a 1 NaN 2 10a 3 100b 4 0b
要從每個單元格中提取數字,您可以使用以下正規表示式:
<code class="python">df.A.str.extract('(\d+)')</code>
正規表示式模式(d ) 擷取一個或多個數字的任何序列。模式兩邊的括號會建立一個捕獲組,用於傳回字串的匹配部分。
輸出:
0 1 1 NaN 2 10 3 100 4 0 Name: A, dtype: object
如您所見,所需的數字已成功獲取從每個單元格中提取,即使是那些包含非數字字符的單元格。請注意,此方法僅適用於整數,不適用於浮點數。
以上是如何從 Pandas 中的非數字字串中提取數字?的詳細內容。更多資訊請關注PHP中文網其他相關文章!