Heim >Backend-Entwicklung >Python-Tutorial >Wie kann man Termvorkommen in Pandas effizient nach ID und Gruppe zählen?

Wie kann man Termvorkommen in Pandas effizient nach ID und Gruppe zählen?

Barbara Streisand
Barbara StreisandOriginal
2024-12-25 19:27:14935Durchsuche

How to Efficiently Count Term Occurrences by ID and Group in Pandas?

Abrufen von Begriffszahlen nach ID und Gruppe mit Pandas' Groupby

Problem

Angenommen, ein DataFrame enthält Spalten für ID (id), Gruppe (group ) und Begriff (Begriff) besteht das Ziel darin, die Vorkommen jedes Begriffs für jede eindeutige Kombination aus ID und effizient zu zählen Gruppe.

Lösung

Durch die Nutzung der leistungsstarken Groupby- und Size-Funktionen von Pandas können wir dies erreichen, ohne auf Schleifen zurückgreifen zu müssen:

df.groupby(['id', 'group', 'term']).size().unstack(fill_value=0)

Ergebnisse

Dies Die Operation erzeugt einen hierarchischen MultiIndex-DataFrame, der den Begriff darstellt zählt:

</p>
<pre class="brush:php;toolbar:false">         term

Gruppe term1 term2 term3
id
1 3 2 0
2 2 1 1

Leistungsanalyse

Auch für Bei riesigen Datensätzen mit Millionen von Zeilen zeigt dieser vektorisierte Ansatz eine außergewöhnliche Leistung:

1,000,000 rows
----------------
Elapsed time: 1.2 seconds

Das obige ist der detaillierte Inhalt vonWie kann man Termvorkommen in Pandas effizient nach ID und Gruppe zählen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn