ホームページ >バックエンド開発 >Python チュートリアル >60,000 個のサンプルがあるにもかかわらず、Keras はデータセットの一部でしかトレーニングしないのはなぜですか?

60,000 個のサンプルがあるにもかかわらず、Keras はデータセットの一部でしかトレーニングしないのはなぜですか?

Patricia Arquette
Patricia Arquetteオリジナル
2024-10-29 10:37:30919ブラウズ

Why is Keras only training on a portion of my dataset, even though I have 60,000 samples?

限られたデータセットを使用した Keras トレーニング

Keras を使用してニューラル ネットワークをトレーニングしようとすると、利用可能なデータセットの一部しか利用していないことに気づきました。 60,000 個のサンプルにアクセスできるにもかかわらず、データセットは不十分です。公式 TensorFlow ガイドに従っているにもかかわらず、トレーニング プロセスに矛盾が見られます。この記事は、Keras がこのように動作する理由を説明し、解決策を提供することを目的としています。

部分的なデータセット使用の背後にある理由

モデル フィッティング中に発生した数字「1875」は、トレーニングサンプルの数を表すものではありません。むしろ、バッチの数を示します。デフォルトでは、Keras はトレーニング中にバッチ サイズ 32 を使用します。 60,000 サンプルのデータセットの場合、これは次と同等です。

60,000 / 32 = 1875

したがって、Keras はデータセットを 1875 のバッチに分割し、それぞれに 32 のサンプルが含まれます。その結果、各エポックは、データセット全体ではなく、これらの 1875 バッチを反復処理します。

解決策

データセット全体を利用するには、バッチ サイズを明示的に次のように設定できます。サンプルの総数:

<code class="python">model.fit(train_images, train_labels, epochs=10, batch_size=60000)</code>

これにより、Keras はデータセット全体でモデルをトレーニングし、パフォーマンスが向上する可能性があります。

以上が60,000 個のサンプルがあるにもかかわらず、Keras はデータセットの一部でしかトレーニングしないのはなぜですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。