Heim >Backend-Entwicklung >Python-Tutorial >Wie schwenke ich einen Datenrahmen mithilfe von Pandas?

Wie schwenke ich einen Datenrahmen mithilfe von Pandas?

Patricia Arquette
Patricia ArquetteOriginal
2024-11-21 02:10:14201Durchsuche

How to Pivot a Dataframe Using Pandas?

So drehen Sie einen Datenrahmen mithilfe von Pandas

Das Umformen tabellarischer Daten ist eine wesentliche Aufgabe bei der Datenanalyse. Pivoting, eine Technik zum Transponieren von Zeilen und Spalten in einem Datenrahmen, ist häufig nützlich, um Pivot-Tabellen zu erstellen und Daten aus verschiedenen Perspektiven zu untersuchen. Lassen Sie uns untersuchen, wie dieser Vorgang in Pandas, einer leistungsstarken Datenbearbeitungsbibliothek, ausgeführt wird.

Um einen Datenrahmen zu drehen, verwenden Sie hauptsächlich die .pivot-Methode. Diese Methode benötigt mehrere Argumente:

  1. index: Gibt die Spalte(n) an, die zum Index des geschwenkten Datenrahmens werden sollen.
  2. Spalten: Gibt die Spalte(n) an, die als Spaltenüberschriften des Pivot-Datenrahmens dienen sollen.
  3. Werte: Bezeichnet die Spalte(n), deren Werte zum Auffüllen der Pivot-Tabelle verwendet werden sollen.

Betrachten Sie beispielsweise den folgenden Datenrahmen:

Indicator  Country  Year  Value
1          Angola   2005  6
2          Angola   2005  13
3          Angola   2005  10
4          Angola   2005  11
5          Angola   2005  5
1          Angola   2006  3
2          Angola   2006  2
3          Angola   2006  7
4          Angola   2006  3
5          Angola   2006  6

Um diesen Datenrahmen so zu drehen, dass die Werte in der Spalte „Indikator“ zu neuen Spalten werden, verwenden Sie den folgenden Code:

out = df.pivot(index=['Country', 'Year'], columns='Indicator', values='Value')
print(out)

Dieser Vorgang erzeugt den folgenden geschwenkten Datenrahmen:

Indicator     1   2   3   4  5
Country Year
Angola  2005  6  13  10  11  5
        2006  3   2   7   3  6

Um den geschwenkten Datenrahmen wieder in eine flache Tabelle umzuwandeln, verwenden Sie .rename_axis, um die Indikatorachse zu entfernen, und .reset_index, um Land und zu konvertieren Jahr zurück zu den normalen Spalten.

print(out.rename_axis(columns=None).reset_index())

Dies führt zur ursprünglichen Datenrahmenstruktur:

  Country  Year  1   2   3   4  5
0  Angola  2005  6  13  10  11  5
1  Angola  2006  3   2   7   3  6

Wenn Ihre Daten doppelte Kombinationen von Beschriftungen enthalten (z. B. Land, Jahr, Indikator) , verwenden Sie .pivot_table. Diese Methode verwendet standardmäßig den Mittelwert.

out = df.pivot_table(
    index=['Country', 'Year'],
    columns='Indicator',
    values='Value')
print(out.rename_axis(columns=None).reset_index())

Dadurch wird ein ähnlicher Pivot-Datenrahmen ausgegeben, jedoch mit Mittelwerten für doppelte Kombinationen.

Eine detailliertere Übersicht finden Sie im Pandas-Benutzer Anleitung zum Umformen und Pivot-Tabellen.

Das obige ist der detaillierte Inhalt vonWie schwenke ich einen Datenrahmen mithilfe von Pandas?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Stellungnahme:
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn