Maison >développement back-end >Tutoriel Python >Comment puis-je partager facilement des DataFrames complexes pour des exemples de code reproductibles ?
Partage facile d'échantillons de données avec df.to_dict()
Malgré des directives claires pour les bonnes questions et l'inclusion d'échantillons de données reproductibles, de nombreux les utilisateurs négligent souvent de fournir suffisamment de données pour l’analyse. Cet article explore l'utilisation de la fonction df.to_dict() comme moyen pratique de partager des exemples de trames de données plus complexes que des nombres aléatoires.
Cas 1 : trames de données provenant de sources locales
Pour les dataframes obtenues à partir de sources locales, cette approche est simple :
Cas 2 : Tables provenant d'autres Applications
Si votre tableau se trouve dans une application comme Excel, vous pouvez utiliser les étapes suivantes :
Gestion de trames de données plus volumineuses
Pour les dataframes plus volumineuses, considérez ce qui suit approches :
Exemple d'utilisation d'Iris Ensemble de données
Considérons l'ensemble de données iris, connu pour être disponible dans plotly express.
import plotly.express as px import pandas as pd df = px.data.iris().head(10) sample = df.to_dict('split')
Cela produira un dictionnaire avec un index, des colonnes et des clés de données, permettant une recréation facile du dataframe en utilisant :
df = pd.DataFrame(index=sample['index'], columns=sample['columns'], data=sample['data'])
Modifier
Notez que df.to_dict() ne peut pas lire les horodatages sans inclure explicitement l'importation nécessaire (par exemple, depuis pandas import Timestamp).
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!