ホームページ >バックエンド開発 >Python チュートリアル >Pandas DataFrame 列内の部分文字列を効率的に見つけるにはどうすればよいですか?

Pandas DataFrame 列内の部分文字列を効率的に見つけるにはどうすればよいですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-12-17 20:27:15364ブラウズ

How Can I Efficiently Find Substrings Within Pandas DataFrame Columns?

Pandas DataFrame での部分文字列の検索

文字列値の列を含む pandas DataFrame を操作する場合、文字列の部分一致に基づいて行をフィルタリングする必要があります。たとえば、特定のエンティティまたはトピックに関連するデータを含む行を分離します。

この要件を満たすために、pandas は Series.str 属性を通じて強力なソリューションを提供します。この属性により、ベクトル化された文字列メソッドの利用が可能になります。次に例を示します。

df[df['A'].str.contains("hello")]

このコード行は、列「A」の値に部分文字列「hello」が含まれているかどうかをチェックして、DataFrame df をフィルターします。この条件を満たす行のみを含む新しい DataFrame が返されます。

この機能は、部分文字列一致操作を実行するための高度に最適化された効率的な方法を提供するため、大規模な DataFrame を扱う場合に特に役立ちます。

以上がPandas DataFrame 列内の部分文字列を効率的に見つけるにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。