Pandas 資料分組過濾:等效於 SQL 的 GROUP BY HAVING
在資料分析中,經常需要根據應用於資料組的條件來過濾資料。在 SQL 中,HAVING 子句允許進行這種類型的條件過濾。在 Pandas 中,可以使用 groupby 和 filter 操作的組合來實現類似的功能。
為了對 Pandas 中的分組資料套用篩選器,您可以使用 groupby 物件中提供的 filter 方法。此方法接受一個函數作為輸入,並將其應用於每個群組。如果函數對某個組傳回 True,則保留該組;否則,將其排除。
考慮以下範例:
import pandas as pd df = pd.DataFrame([[1, 2], [1, 3], [5, 6]], columns=['A', 'B']) # 按列 A 分组数据框 g = df.groupby('A') # 过滤以包含超过 1 行的组 filtered_df = g.filter(lambda x: len(x) > 1) print(filtered_df)
輸出:
<code> A B 0 1 2 1 1 3</code>
在此範例中,groupby 操作為列 A 中的每個不同值建立群組物件。然後將 filter 方法應用於每個群組對象,並使用函數 len(x) 來確定是否應保留或排除群組。在本例中,保留了超過 1 行的群組,從而得到過濾後的資料框。
您也可以建立更複雜的篩選函數,只要它們傳回布林值即可。例如,要根據 B 列值的總和篩選組,您可以使用:
filtered_df = g.filter(lambda x: x['B'].sum() == 5)
請注意,可能存在一個潛在的錯誤,即您無法在篩選函數中存取用於分組的列。一種解決方法是使用列名手動分組資料框。
以上是如何透過Pandas條件過濾實現SQL的GROUP BY HAVING功能?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本文討論了使用MySQL的Alter Table語句修改表,包括添加/刪除列,重命名表/列以及更改列數據類型。

文章討論了為MySQL配置SSL/TLS加密,包括證書生成和驗證。主要問題是使用自簽名證書的安全含義。[角色計數:159]

文章討論了流行的MySQL GUI工具,例如MySQL Workbench和PhpMyAdmin,比較了它們對初學者和高級用戶的功能和適合性。[159個字符]

本文討論了使用Drop Table語句在MySQL中放下表,並強調了預防措施和風險。它強調,沒有備份,該動作是不可逆轉的,詳細介紹了恢復方法和潛在的生產環境危害。

本文討論了在PostgreSQL,MySQL和MongoDB等各個數據庫中的JSON列上創建索引,以增強查詢性能。它解釋了索引特定的JSON路徑的語法和好處,並列出了支持的數據庫系統。

文章討論了使用準備好的語句,輸入驗證和強密碼策略確保針對SQL注入和蠻力攻擊的MySQL。(159個字符)


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SecLists
SecLists是最終安全測試人員的伙伴。它是一個包含各種類型清單的集合,這些清單在安全評估過程中經常使用,而且都在一個地方。 SecLists透過方便地提供安全測試人員可能需要的所有列表,幫助提高安全測試的效率和生產力。清單類型包括使用者名稱、密碼、URL、模糊測試有效載荷、敏感資料模式、Web shell等等。測試人員只需將此儲存庫拉到新的測試機上,他就可以存取所需的每種類型的清單。

MinGW - Minimalist GNU for Windows
這個專案正在遷移到osdn.net/projects/mingw的過程中,你可以繼續在那裡關注我們。 MinGW:GNU編譯器集合(GCC)的本機Windows移植版本,可自由分發的導入函式庫和用於建置本機Windows應用程式的頭檔;包括對MSVC執行時間的擴展,以支援C99功能。 MinGW的所有軟體都可以在64位元Windows平台上運作。

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

SAP NetWeaver Server Adapter for Eclipse
將Eclipse與SAP NetWeaver應用伺服器整合。

禪工作室 13.0.1
強大的PHP整合開發環境