首頁 >後端開發 >Python教學 >如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?

如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?

Linda Hamilton
Linda Hamilton原創
2024-12-06 15:23:13583瀏覽

How to Efficiently Count Term Occurrences within ID-Group Combinations in a Pandas DataFrame?

如何對 pandas 資料框執行 groupby 值計數?

您需要按'id' 和'group' 列對資料框進行分組,併計算每個資料框的計數「term」列中每個唯一的「id」和「group」值對的唯一值。換句話說,您需要確定每個術語在每個 id-group 組合中出現的頻率。

您可以使用 pandas 的 groupby 和 size 函數來實現此目的:

這將產生一個以 id 和 group 作為索引、term 作為列的表。

計時

這種方法效率很高,甚至對於大型資料集。對於具有 1,000,000 行的資料幀,執行上述程式碼只需要大約 6 秒。

以上是如何有效計算 Pandas DataFrame 中 ID 組組合中的術語出現次數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn