ホームページ  >  記事  >  バックエンド開発  >  データフレーム内の文字列が部分的に一致する列を抽出するにはどうすればよいですか?

データフレーム内の文字列が部分的に一致する列を抽出するにはどうすればよいですか?

Barbara Streisand
Barbara Streisandオリジナル
2024-10-20 14:00:03841ブラウズ

How to Extract Columns With Partial String Matches in a DataFrame?

部分文字列が一致する列の検索

特定の文字列を含む列を DataFrame にクエリすることは、便利な操作です。しかし、一致が正確ではなく、特定の部分文字列が含まれている場合はどうなるでしょうか?ここで正規表現フィルターが役に立ちます。

特定の文字列、特に連続した部分文字列を含む名前を持つ列を見つけるには、次の解決策を検討してください。

<code class="python">import pandas as pd

# Create a DataFrame to demonstrate
data = {'spike-2': [1, 2, 3], 'hey spke': [4, 5, 6], 'spiked-in': [7, 8, 9], 'no': [10, 11, 12]}
df = pd.DataFrame(data)

# Use regex filter to select columns with 'spike' substring
spike_cols = df.filter(regex='spike').columns.tolist()

# Print the column names with the matching substring
print(spike_cols)</code>

このコードは、 DataFrame の列はリスト内包表記を使用し、正規表現フィルターを適用して「spike」部分文字列を持つ列を検索します。結果の列名のリストは、spike_cols 変数に保存され、必要に応じて対応する列にアクセスするために使用できます。

もう 1 つのアプローチは、列名をリストに変換し、それらを反復処理してそれぞれをテストすることです。 for ループと if ステートメントを使用した部分文字列一致の名前:

<code class="python"># Column names converted to a list
col_list = list(df.columns)

# Iterate over the column names
for col in col_list:
    if 'spike' in col:
        # Column name with matching substring found
        print(col)</code>

これらのメソッドを使用すると、名前に特定の文字列が含まれるデータフレーム内の列を効率的に識別し、アクセスできます。完全一致。

以上がデータフレーム内の文字列が部分的に一致する列を抽出するにはどうすればよいですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。