給定一個包含ID (id)、group (group ) 和術語(term),目標是針對ID 和ID的每個唯一組合有效地計算每個術語的出現次數
利用Pandas強大的groupby和size函數,我們可以在不使用循環的情況下實現這一點:
df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)
這個操作產生一個分層的MultiIndex DataFrame,表示該術語計數:
<pre class="brush:php;toolbar:false"> term
組term1 term2 term3
id
1 3 2 02 2 1 1
以上是如何在 Pandas 中按 ID 和群組高效統計術語出現次數?的詳細內容。更多資訊請關注PHP中文網其他相關文章!