ホームページ  >  記事  >  バックエンド開発  >  str.extract() を使用してパンダの文字列から数値を抽出する方法

str.extract() を使用してパンダの文字列から数値を抽出する方法

Mary-Kate Olsen
Mary-Kate Olsenオリジナル
2024-10-24 13:06:31430ブラウズ

How to Extract Numbers from Strings in Pandas Using str.extract()?

Pandas の文字列から数値を抽出する

Pandas データ フレーム内の文字列から数値を抽出するには、str.extract メソッドの利用を検討してください。このメソッドでは、正規表現を使用して、データ フレームの文字列値から特定のパターンを抽出できます。

この例では、df データ フレームには、数値を含む文字列など、データ型が混在した列 'A' が含まれています。数値のみを抽出するには、正規表現キャプチャ グループを使用できます。

<code class="python">df.A.str.extract('(\d+)')</code>

正規表現パターン (d ) は、1 つ以上の数字 (d) に一致するキャプチャ グループを指定します。これにより、各文字列内の数値が分離されます。

結果は、抽出された数値を含む新しいデータ フレーム列です。

    A
0   1
1   NaN
2   10
3   100
4   0

このメソッドは整数に対してのみ機能し、浮動小数点数には機能しないことに注意してください。 。より複雑なパターンや、数字が数字以外で区切られている場合には、追加の正規表現構文が必要になる場合があります。

以上がstr.extract() を使用してパンダの文字列から数値を抽出する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。