識別包含特定子字串的列
要定位名稱包含指定子字串而不需要精確匹配的列,可以採用迭代方法。這涉及檢查每個列名稱並識別那些滿足搜尋條件的列名稱。
考慮一個具有列名稱(例如「spike-2」、「hey spike」和「spiked-in」)的 DataFrame。要擷取包含子字串「spike」的欄位名稱,可以使用下列Python程式碼:
<code class="python">import pandas as pd # Initialize data data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]} df = pd.DataFrame(data) # Iterate over column names and filter based on substring spike_cols = [col for col in df.columns if 'spike' in col] # Print resulting column names print(spike_cols)</code>
在此程式碼中:
或者,透過以下方式取得 DataFrame僅符合資料列:
<code class="python">df2 = df.filter(regex='spike')</code>
這將建立僅包含名稱包含「spike」的資料列的 df2。
以上是如何使用正規表示式迭代提取 pandas DataFrame 中匹配子字串的列?的詳細內容。更多資訊請關注PHP中文網其他相關文章!