如何使用正規表示式迭代提取 pandas DataFrame 中匹配子字串的列？-Python教學-PHP中文網

首頁

後端開發

Python教學

如何使用正規表示式迭代提取 pandas DataFrame 中匹配子字串的列？

Susan Sarandon

Oct 20, 2024 pm 01:58 PM

How to Extract Columns with Matching Substrings in pandas DataFrame Iteratively and Using Regular Expressions?

識別包含特定子字串的列

要定位名稱包含指定子字串而不需要精確匹配的列，可以採用迭代方法。這涉及檢查每個列名稱並識別那些滿足搜尋條件的列名稱。

考慮一個具有列名稱（例如「spike-2」、「hey spike」和「spiked-in」）的 DataFrame。要擷取包含子字串「spike」的欄位名稱，可以使用下列Python程式碼：

<code class="python">import pandas as pd

# Initialize data
data = {'spike-2': [1,2,3], 'hey spke': [4,5,6], 'spiked-in': [7,8,9], 'no': [10,11,12]}
df = pd.DataFrame(data)

# Iterate over column names and filter based on substring
spike_cols = [col for col in df.columns if 'spike' in col]

# Print resulting column names
print(spike_cols)</code>

在此程式碼中：

df.columns 傳回列的清單
列表理解[col for col in df.columns if 'spike' in col] 使用變數col 迭代每個列名稱，並建構一個僅包含包含子字串'spike' 的名稱的新列表.
產生的spike_cols 包含所需的欄位名稱，稍後可以使用df['col_name'] 或df[col_name] 存取。

或者，透過以下方式取得 DataFrame僅符合資料列：

<code class="python">df2 = df.filter(regex='spike')</code>

這將建立僅包含名稱包含「spike」的資料列的 df2。

以上是如何使用正規表示式迭代提取 pandas DataFrame 中匹配子字串的列？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

了解差異：用於循環和python中的循環May 16, 2025 am 12:17 AM

theDifferenceBetweewneaforoopandawhileLoopInpythonisthataThataThataThataThataThataThataNumberoFiterationSiskNownInAdvance，而leleawhileLoopisusedWhenaconDitionNeedneedneedneedNeedStobeCheckedStobeCheckedStobeCheckedStobeCheckedStobeceDrepeTysepectients.peatsiveSectlyStheStobeCeptellyWithnumberofiterations.1）forloopsareAceareIdealForitoringercortersence

Python循環控制：對於vs -a -a比較May 16, 2025 am 12:16 AM

在Python中，for循環適用於已知迭代次數的情況，而while循環適合未知迭代次數且需要更多控制的情況。 1）for循環適用於遍歷序列，如列表、字符串等，代碼簡潔且Pythonic。 2）while循環在需要根據條件控制循環或等待用戶輸入時更合適，但需注意避免無限循環。 3）性能上，for循環略快，但差異通常不大。選擇合適的循環類型可以提高代碼的效率和可讀性。

如何在Python中結合兩個列表：5種簡單的方法May 16, 2025 am 12:16 AM

在Python中，可以通過五種方法合併列表：1)使用運算符，簡單直觀，適用於小列表；2)使用extend()方法，直接修改原列表，適用於需要頻繁更新的列表；3)使用列表解析式，簡潔且可對元素進行操作；4)使用itertools.chain()函數，內存高效，適合大數據集；5)使用*運算符和zip()函數，適用於需要配對元素的場景。每種方法都有其特定用途和優缺點，選擇時應考慮項目需求和性能。

循環時循環：python語法，用例和示例May 16, 2025 am 12:14 AM

foroopsare whenthenemberofiterationsisknown，而whileLoopsareUseduntilacTitionismet.1）ForloopSareIdealForeSequencesLikeLists，UsingSyntaxLike'forfruitinFruitinFruitinFruitIts：print（fruit）'。 2）'

python串聯列表列表May 16, 2025 am 12:08 AM

toConcateNateAlistofListsInpython，useextend，listComprehensions，itertools.Chain，orrecursiveFunctions.1）ExtendMethodStraightForwardButverBose.2）listComprechencomprechensionsareconconconciseandemandeconeandefforlargerdatasets.3）