ホームページ >バックエンド開発 >Python チュートリアル >コンピューター ビジョン用のデータセット (2)

コンピューター ビジョン用のデータセット (2)

DDD
DDDオリジナル
2024-11-24 13:55:14436ブラウズ

コーヒー買ってきて☕

*私の投稿では、MNIST、EMNIST、QMNIST、ETLCDB、くずし字、Moving MNIST について説明しています。

(1) ファッション-MNIST(2017):

  • には、10 クラスの 10 クラスのラベルにそれぞれ接続された 70,000 のファッション画像があります。 *メモ:
    • 電車で 60,000、テストで 10,000。
    • 各画像は 28x28 ピクセルです。
  • は PyTorch の FashionMNIST() です。

Datasets for Computer Vision (2)

(2) カリフォルニア工科大学 101(2003):

  • には、8,677 個のオブジェクト画像があり、それぞれが 101 のカテゴリ (クラス) のラベルに関連付けられています。 *各画像は約 300x200 ピクセルです。
  • は PyTorch の Caltech101() です。

Datasets for Computer Vision (2)

(3) カリフォルニア工科大学 256(2007):

  • には、257 のカテゴリ (クラス) のラベルに接続された 30,607 個のオブジェクト画像があります。 ※実際にはCaltech 256という名前に対して257のカテゴリー(クラス)があります。
  • は PyTorch の Caltech256() です。

Datasets for Computer Vision (2)

Datasets for Computer Vision (2)

(4) CelebA(大規模なCelebFaces属性)(2015):

  • には、それぞれ 40 の属性に関連付けられた 202,599 人の有名人の顔画像があります。 *メモ:
    • トレイン用に 162,770、検証用に 19,867、テスト用に 19,962 です。
    • Google DriveからGoogle Drive APIでダウンロードすると混雑しすぎるため、Google Driveから直接ダウンロードすることをお勧めします。
  • は PyTorch の CelebA() です。

Datasets for Computer Vision (2)

(5) CIFAR-10(カナダ高等研究所-10)(2009):

  • には、10 クラスのラベルにそれぞれ接続された 60,000 の乗り物と動物の画像があります。 *メモ:
    • 電車で 50,000、テストで 10,000。
    • 各画像は 32x32 ピクセルです。
  • は PyTorch の CIFAR10() です。

Datasets for Computer Vision (2)

(6) CIFAR-100(カナダ高等研究所-100)(2009):

  • には 60,000 個のオブジェクト イメージがあり、それぞれが 100 クラスのラベルに接続されています。 *メモ:
    • 電車で 50,000、テストで 10,000。
    • 各画像は 32x32 ピクセルです。
  • は PyTorch の CIFAR100() です。

Datasets for Computer Vision (2)

以上がコンピューター ビジョン用のデータセット (2)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。