首頁 >後端開發 >Python教學 >如何根據列值有效率地選擇 Pandas DataFrame 中的行?

如何根據列值有效率地選擇 Pandas DataFrame 中的行?

Patricia Arquette
Patricia Arquette原創
2024-12-25 16:02:15693瀏覽

How Can I Efficiently Select Rows in a Pandas DataFrame Based on Column Values?

根據 Pandas 中的列值選擇行

與任何關聯式資料庫一樣,您可能需要根據特定列中的值從 DataFrame 中選擇某些行。要在 Pandas 中無縫實現此目的,您可以使用多種方法。

使用== 和isin 進行過濾

要檢索列值與特定值匹配的行,請利用== 運算符:

df.loc[df['column_name'] == some_value]

相反,如果您希望選擇列值屬於值集合的行,請使用isin:

df.loc[df['column_name'].isin(some_values)]

用 &組合條件

要組合您選擇的多個條件,請用& 連接它們:

df.loc[(df['column_name'] >= A) & (df['column_name'] <= B)]

注意: 此處的括號對於確保正確評估至關重要。

排除帶有!= 和的值~

要排除具有特定列值的行,請使用!=:

df.loc[df['column_name'] != some_value]

或者,對於特定範圍之外的值,使用~:

df = df.loc[~df['column_name'].isin(some_values)] # .loc is not in-place replacement
否定isin結果

範例應用程式

考慮以下內容DataFrame:

import pandas as pd
import numpy as np
df = pd.DataFrame({'A': 'foo bar foo bar foo bar foo foo'.split(),
                   'B': 'one one two three two two one three'.split(),
                   'C': np.arange(8), 'D': np.arange(8) * 2})
print(df)

選擇「A」值為「foo」的行:

print(df.loc[df['A'] == 'foo'])

選擇「foo」的行:

print(df.loc[df['B'].isin(['one','three'])])

選擇「 B」值為「一」或「三」的行:

透過索引增強性能
df = df.set_index(['B'])
print(df.loc['one'])

對於頻繁的過濾操作,它更首先創建索引是高效的:

df.loc[df.index.isin(['one','two'])]
或者,使用df.index.isin:

以上是如何根據列值有效率地選擇 Pandas DataFrame 中的行?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn