Heim >Backend-Entwicklung >Python-Tutorial >Wie dividiere ich einen Pandas-DataFrame durch einen Spaltenwert?

Wie dividiere ich einen Pandas-DataFrame durch einen Spaltenwert?

Patricia Arquette
Patricia ArquetteOriginal
2024-10-19 22:28:29448Durchsuche

How to Divide a Pandas DataFrame by a Column Value?

So teilen Sie einen Pandas DataFrame durch einen Spaltenwert

Das Teilen eines Pandas DataFrame basierend auf einem Spaltenwert kann nützlich sein, um separate Teilmengen zu erstellen von Daten. Angenommen, Sie haben einen DataFrame mit einer Spalte namens „Sales“ und möchten ihn in zwei DataFrames aufteilen: einen mit Zeilen, in denen „Sales“ kleiner als ein angegebener Wert ist, und einen anderen mit Zeilen, in denen „Sales“ größer oder gleich ist diesen Wert.

Um dies zu erreichen, können Sie die boolesche Indizierung mit den folgenden Schritten verwenden:

  1. Definieren Sie den Aufteilungswert: Weisen Sie den gewünschten Wert einer Variablen zu , s.
  2. Boolesche Masken erstellen: Verwenden Sie die boolesche Indizierung, um zwei Masken zu erstellen: df['Sales'] < s (für Werte kleiner als s) und df['Sales'] >= s (für Werte größer oder gleich s).
  3. Datenrahmen aufteilen: Anwenden die booleschen Masken zum ursprünglichen DataFrame, um zwei neue DataFrames zu erstellen:

    • df1 = df[df['Sales'] >= s] (DataFrame mit 'Sales' >= s)
    • df2 = df[df['Sales'] < s] (DataFrame mit 'Sales' < s)

Alternativ können Sie die erste Maske mit dem ~-Operator umkehren:

mask = df['Sales'] >= s
df1 = df[mask]
df2 = df[~mask]<p>Hier ist Ein Beispiel zur Veranschaulichung des Prozesses:</p>
<pre class="brush:php;toolbar:false"><code class="python">df = pd.DataFrame({'Sales': [10, 20, 30, 40, 50], 'A': [3, 4, 7, 6, 1]})
print(df)

s = 30

df1 = df[df['Sales'] >= s]
print(df1)

df2 = df[df['Sales'] < s]
print(df2)</code>

Die Ausgabe lautet:

   A  Sales
0  3     10
1  4     20
2  7     30
3  6     40
4  1     50

   A  Sales
2  7     30
3  6     40
4  1     50

   A  Sales
0  3     10
1  4     20

Dies zeigt, wie ein Pandas-DataFrame basierend auf einem angegebenen Spaltenwert mithilfe einer booleschen Indizierung in zwei Teile geteilt wird.

Das obige ist der detaillierte Inhalt vonWie dividiere ich einen Pandas-DataFrame durch einen Spaltenwert?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn