Heim >Backend-Entwicklung >Python-Tutorial >Arbeiten mit DataFrames in Pandas
Hallo!?
Heute melde ich mich mit einem neuen Notizbuch zurück, das eine Möglichkeit demonstriert, mit Daten in Jupyter zu arbeiten.
Ich habe den Datensatz von
heruntergeladen
Kaggle ist eine Plattform, um reale Daten zu finden und sich mit anderen Datenbegeisterten zu vernetzen.
Dort finden Sie eine unglaubliche Sammlung an Datensätzen und Projekten und können auch an Wettbewerben teilnehmen.
Nachdem ich eine kurze Zusammenfassung des Datenrahmens zurückgegeben hatte, führte ich die Bereinigung der Daten durch, um meine Daten in ein verwendbares und konsistentes Format für die Analyse zu bringen
Die Methode astype() wird verwendet, um ein Pandas-Objekt in einen angegebenen Datentyp zu konvertieren.
Ich habe fillna(0) verwendet, um den ursprünglich aufgetretenen Fehler zu beheben. Probieren Sie es selbst aus!
Weitere Informationen finden Sie in meinem GitHub-Repository. Hier habe ich das Notizbuch und natürlich den Datensatz hochgeladen. In kurzen Worten erfahren Sie, wie es geht
Laden Sie einen Datenrahmen,
Untersuchen Sie die Metadaten,
Datentypen konvertieren
Erkunden Sie den Datenrahmen mithilfe der iloc-Indizierung.
Darüber hinaus erfahren Sie mehr über die Boolesche Maskierung und ... wie Sie den Medianwert berechnen. ?
Sind Sie bereit, die Daten zu erkunden?
Das obige ist der detaillierte Inhalt vonArbeiten mit DataFrames in Pandas. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!