ホームページ >バックエンド開発 >Python チュートリアル >部分文字列の一致に基づいて Pandas DataFrame をフィルターするにはどうすればよいですか?

部分文字列の一致に基づいて Pandas DataFrame をフィルターするにはどうすればよいですか?

Susan Sarandon
Susan Sarandonオリジナル
2024-12-21 01:29:18123ブラウズ

How Can I Filter a Pandas DataFrame Based on Substring Matches?

部分文字列基準による Pandas DataFrame のフィルタリング

文字列値を含む列を持つ DataFrame があるとします。正規表現で re.search(pattern, cell_in_question) というイディオムを使用するのと同様に、文字列の部分一致に基づいて行を選択する必要が生じる場合があります。構文 df[df['A'] == "hello world"] には慣れていますが、「hello」などの部分文字列一致でこれを実現する方法を見つけるのは難しい場合があります。

解決策ベクトル化された文字列メソッド、特に Series.str を利用することにあります。このアプローチを採用すると、次の操作を実行できます。

df[df['A'].str.contains("hello")]

このコード行は、「A」列に部分文字列「hello」を含む DataFrame 内の行のサブセットを返します。この機能は Pandas バージョン 0.8.1 以降のバージョンで利用可能であることに注意することが重要です。

以上が部分文字列の一致に基づいて Pandas DataFrame をフィルターするにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。