Heim >Backend-Entwicklung >Python-Tutorial >Wie kann ich komplexe Datenrahmen einfach für reproduzierbare Codebeispiele freigeben?
Einfaches Teilen von Datenbeispielen mit df.to_dict()
Trotz klarer Richtlinien für gute Fragen und der Einbeziehung reproduzierbarer Datenbeispiele gibt es viele Benutzer versäumen es oft, ausreichend Daten für die Analyse bereitzustellen. In diesem Artikel wird die Verwendung der Funktion df.to_dict() als praktische Möglichkeit zum Teilen von Beispieldatenrahmen untersucht, die komplexer als Zufallszahlen sind.
Fall 1: Datenrahmen aus lokalen Quellen
Für Datenrahmen, die aus lokalen Quellen stammen, ist dieser Ansatz unkompliziert:
Fall 2: Tabellen von Anderen Anwendungen
Wenn sich Ihre Tabelle in einer Anwendung wie Excel befindet, können Sie die folgenden Schritte ausführen:
Umgang mit größeren Datenrahmen
Bedenken Sie bei größeren Datenrahmen Folgendes Ansätze:
Beispiel mit Iris Datensatz
Betrachten Sie den Iris-Datensatz, der dafür bekannt ist, in Plotly Express verfügbar zu sein.
import plotly.express as px import pandas as pd df = px.data.iris().head(10) sample = df.to_dict('split')
Dadurch wird ein Wörterbuch mit Index, Spalten und Datenschlüsseln erstellt, das eine einfache Wiederherstellung ermöglicht des Datenrahmens mit:
df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
Bearbeiten
Beachten Sie das df.to_dict() kann keine Zeitstempel lesen, ohne den erforderlichen Import explizit einzubeziehen (z. B. von Pandas Import Timestamp).
Das obige ist der detaillierte Inhalt vonWie kann ich komplexe Datenrahmen einfach für reproduzierbare Codebeispiele freigeben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!