Maison >développement back-end >Tutoriel Python >Pourquoi mon modèle Keras s'entraîne-t-il uniquement sur une partie de mon ensemble de données ?
Différence des données de formation Keras
En suivant le guide officiel TensorFlow pour créer un réseau neuronal avec Keras, vous avez remarqué que le modèle utilise uniquement un partie de l'ensemble de données disponible pendant l'entraînement, malgré 60 000 entrées.
Comprendre la taille du lot
Le nombre 1875 affiché lors de l'ajustement du modèle n'est pas une indication des échantillons d'entraînement mais plutôt le nombre de lots. La méthode model.fit a un argument facultatif, batch_size, qui détermine le nombre de points de données traités simultanément pendant l'entraînement.
Si vous ne spécifiez pas de batch_size, la valeur par défaut est 32. Dans ce cas, avec un ensemble de données total de 60 000 images, le nombre de lots devient :
60000 / 32 = 1875
Par conséquent, bien que vous disposiez de 60 000 points de données, le modèle s'entraîne en réalité sur 1 875 lots, chaque lot contenant 32 points de données. Il s'agit d'une pratique courante pour réduire l'empreinte mémoire et améliorer la vitesse d'entraînement.
Ajustement de la taille du lot
Pour utiliser l'intégralité de l'ensemble de données pendant l'entraînement sans traitement par lots, vous pouvez spécifier un batch_size de 60000 dans la méthode model.fit. Cependant, cela peut potentiellement ralentir l'entraînement et nécessiter plus de mémoire.
Vous pouvez également ajuster batch_size pour trouver un compromis entre l'efficacité de l'entraînement et l'utilisation de la mémoire. Par exemple, vous pouvez le définir sur 1024 ou 2048, ce qui réduirait quand même considérablement le nombre de lots sans trop sacrifier les performances.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!