如何有效率地取得 Pandas DataFrame 中每組的前幾筆記錄？-Python教學-PHP中文網

首頁

後端開發

Python教學

如何有效率地取得 Pandas DataFrame 中每組的前幾筆記錄？

Barbara Streisand

Nov 25, 2024 pm 06:03 PM

How Can I Efficiently Get the Top Records from Each Group in a Pandas DataFrame?

Pandas：高效獲取組內最靠前的記錄

使用Pandas DataFrame 時，經常需要從每個組中提取前導記錄。常見的方法是利用 'groupby' 和 'apply' 函數來列舉每個群組內的記錄。

dfN = df.groupby('id').apply(lambda x:x['value'].reset_index()).reset_index()

但是，有一個更簡化的方法：

df.groupby('id').head(2)

這方法直接取得最上面的記錄，無需中間計算。此外，產生的 DataFrame 保留其原始索引。

要展平產生的MultiIndex，請使用：

df.groupby('id').head(2).reset_index(drop=True)

這將產生以下DataFrame：

id	value
1	1
1	2
2	1
2	2
3	1
4	1

或者，您可以使用SQL 的「row_number( )」視窗函數來有效率地列舉組內的記錄。然而，此功能目前在 Pandas 中不可用。

以上是如何有效率地取得 Pandas DataFrame 中每組的前幾筆記錄？的詳細內容。更多資訊請關注PHP中文網其他相關文章！

陳述

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

學習Python：2小時的每日學習是否足夠？Apr 18, 2025 am 12:22 AM

每天學習Python兩個小時是否足夠？這取決於你的目標和學習方法。 1)制定清晰的學習計劃，2)選擇合適的學習資源和方法，3)動手實踐和復習鞏固，可以在這段時間內逐步掌握Python的基本知識和高級功能。

Web開發的Python：關鍵應用程序Apr 18, 2025 am 12:20 AM

Python在Web開發中的關鍵應用包括使用Django和Flask框架、API開發、數據分析與可視化、機器學習與AI、以及性能優化。 1.Django和Flask框架：Django適合快速開發複雜應用，Flask適用於小型或高度自定義項目。 2.API開發：使用Flask或DjangoRESTFramework構建RESTfulAPI。 3.數據分析與可視化：利用Python處理數據並通過Web界面展示。 4.機器學習與AI：Python用於構建智能Web應用。 5.性能優化：通過異步編程、緩存和代碼優

Python vs.C：探索性能和效率Apr 18, 2025 am 12:20 AM

Python在開發效率上優於C ，但C 在執行性能上更高。 1.Python的簡潔語法和豐富庫提高開發效率。 2.C 的編譯型特性和硬件控制提升執行性能。選擇時需根據項目需求權衡開發速度與執行效率。

python在行動中：現實世界中的例子Apr 18, 2025 am 12:18 AM

Python在現實世界中的應用包括數據分析、Web開發、人工智能和自動化。 1)在數據分析中，Python使用Pandas和Matplotlib處理和可視化數據。 2)Web開發中，Django和Flask框架簡化了Web應用的創建。 3)人工智能領域，TensorFlow和PyTorch用於構建和訓練模型。 4)自動化方面，Python腳本可用於復製文件等任務。