ホームページ >バックエンド開発 >Python チュートリアル >pandas DataFrame で一致する部分文字列を持つ列を反復的に抽出し、正規表現を使用する方法
特定の部分文字列を含む列の識別
完全一致を必要とせずに名前に指定された部分文字列が含まれる列を見つけるには、反復アプローチを使用できます。 。これには、各列名を調べて、検索基準を満たすものを特定することが含まれます。
「spike-2」、「heyspike」、「spiked-in」などの列名を持つ DataFrame を考えてみましょう。部分文字列「spike」を含む列名を抽出するには、次の Python コードを利用できます:
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
このコードでは:
または、次の方法で DataFrame を取得します。一致する列のみ:
<code class="python">df2 = df.filter(regex='spike')</code>
これにより、名前に「spike」が含まれる列のみを含む df2 が作成されます。
以上がpandas DataFrame で一致する部分文字列を持つ列を反復的に抽出し、正規表現を使用する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。