


GroupBy pandas DataFrame und Select Most Common Value
Sie haben die Aufgabe, einen Datenrahmen mit drei Zeichenfolgenspalten zu bereinigen, um dies sicherzustellen Die dritte Spalte enthält den korrekten Wert für die angegebene Kombination der ersten beiden Spalten. Der von Ihnen bereitgestellte Codeausschnitt versucht, den Datenrahmen nach den ersten beiden Spalten zu gruppieren und für jede Kombination den häufigsten Wert der dritten Spalte auszuwählen. Beim Versuch, die agg-Funktion auszuführen, tritt jedoch ein Problem auf.
Using Pandas >= 0.16
Die Syntax, die Sie in Ihrem Code verwendet haben, ist veraltet . Verwenden Sie stattdessen die Funktion pd.Series.mode, die in Pandas-Versionen 0.16 und höher verfügbar ist. Diese Funktion gibt den häufigsten Wert in einer Reihe von Zeichenfolgen zurück. So wenden Sie es an:
source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode)
Diese Syntax gruppiert den Datenrahmen nach „Land“ und „Stadt“, wendet die pd.Series.mode-Funktion auf die Spalte „Kurzname“ jeder Gruppe an und zeigt die an Ergebnisse.
Wenn Sie die Ausgabe als DataFrame benötigen, verwenden Sie dies line:
source.groupby(['Country','City'])['Short name'].agg(pd.Series.mode).to_frame()
Umgang mit mehreren Modi
Die pd.Series.mode-Funktion bewältigt auch effektiv Situationen, in denen mehrere Modi vorhanden sind. Wenn beispielsweise mehrere Werte mit der gleichen Häufigkeit wie der häufigste Wert auftreten, werden sie als Liste von Modi zurückgegeben.
Alternativen (nicht empfohlen)
Sie können die Funktion „statistics.mode“ aus der Python-Standardbibliothek verwenden. Dieser Ansatz funktioniert jedoch nicht gut, wenn mehrere Modi verarbeitet werden. Es löst einen StatisticsError aus, wenn es keinen einzelnen, häufigsten Wert gibt.
Das obige ist der detaillierte Inhalt vonWie finde ich nach der Gruppierung den häufigsten Wert in einer Pandas-DataFrame-Spalte?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Lösung für Erlaubnisprobleme beim Betrachten der Python -Version in Linux Terminal Wenn Sie versuchen, die Python -Version in Linux Terminal anzuzeigen, geben Sie Python ein ...

In diesem Artikel wird erklärt, wie man schöne Suppe, eine Python -Bibliothek, verwendet, um HTML zu analysieren. Es beschreibt gemeinsame Methoden wie find (), find_all (), select () und get_text () für die Datenextraktion, die Behandlung verschiedener HTML -Strukturen und -Anternativen (SEL)

Das Statistikmodul von Python bietet leistungsstarke Datenstatistikanalysefunktionen, mit denen wir die allgemeinen Merkmale von Daten wie Biostatistik und Geschäftsanalyse schnell verstehen können. Anstatt Datenpunkte nacheinander zu betrachten, schauen Sie sich nur Statistiken wie Mittelwert oder Varianz an, um Trends und Merkmale in den ursprünglichen Daten zu ermitteln, die möglicherweise ignoriert werden, und vergleichen Sie große Datensätze einfacher und effektiv. In diesem Tutorial wird erläutert, wie der Mittelwert berechnet und den Grad der Dispersion des Datensatzes gemessen wird. Sofern nicht anders angegeben, unterstützen alle Funktionen in diesem Modul die Berechnung der Mittelwert () -Funktion, anstatt einfach den Durchschnitt zu summieren. Es können auch schwimmende Punktzahlen verwendet werden. zufällig importieren Statistiken importieren Aus Fracti

Dieser Artikel vergleicht TensorFlow und Pytorch für Deep Learning. Es beschreibt die beteiligten Schritte: Datenvorbereitung, Modellbildung, Schulung, Bewertung und Bereitstellung. Wichtige Unterschiede zwischen den Frameworks, insbesondere bezüglich des rechnerischen Graps

In dem Artikel werden beliebte Python-Bibliotheken wie Numpy, Pandas, Matplotlib, Scikit-Learn, TensorFlow, Django, Flask und Anfragen erörtert, die ihre Verwendung in wissenschaftlichen Computing, Datenanalyse, Visualisierung, maschinellem Lernen, Webentwicklung und h beschreiben

Dieser Artikel führt die Python-Entwickler in den Bauen von CLIS-Zeilen-Schnittstellen (CLIS). Es werden mit Bibliotheken wie Typer, Click und ArgParse beschrieben, die Eingabe-/Ausgabemedelung betonen und benutzerfreundliche Designmuster für eine verbesserte CLI-Usabilität fördern.

Bei der Verwendung von Pythons Pandas -Bibliothek ist das Kopieren von ganzen Spalten zwischen zwei Datenrahmen mit unterschiedlichen Strukturen ein häufiges Problem. Angenommen, wir haben zwei Daten ...

Der Artikel erörtert die Rolle virtueller Umgebungen in Python und konzentriert sich auf die Verwaltung von Projektabhängigkeiten und die Vermeidung von Konflikten. Es beschreibt ihre Erstellung, Aktivierung und Vorteile bei der Verbesserung des Projektmanagements und zur Verringerung der Abhängigkeitsprobleme.


Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

PHPStorm Mac-Version
Das neueste (2018.2.1) professionelle, integrierte PHP-Entwicklungstool

EditPlus chinesische Crack-Version
Geringe Größe, Syntaxhervorhebung, unterstützt keine Code-Eingabeaufforderungsfunktion

MantisBT
Mantis ist ein einfach zu implementierendes webbasiertes Tool zur Fehlerverfolgung, das die Fehlerverfolgung von Produkten unterstützen soll. Es erfordert PHP, MySQL und einen Webserver. Schauen Sie sich unsere Demo- und Hosting-Services an.

SAP NetWeaver Server-Adapter für Eclipse
Integrieren Sie Eclipse mit dem SAP NetWeaver-Anwendungsserver.