ホームページ >バックエンド開発 >Python チュートリアル >コンピュータービジョン用のデータセット (3)

コンピュータービジョン用のデータセット (3)

Linda Hamilton
Linda Hamiltonオリジナル
2024-12-03 10:00:24412ブラウズ

コーヒー買ってきて☕

*メモ:

  • 私の投稿では、MNIST、EMNIST、QMNIST、ETLCDB、くずし字、Moving MNIST について説明しています。
  • 私の投稿では、Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10、CIFAR-100 について説明しています。

(1) オックスフォード-IIIT ペット(2012):

  • には、37 クラスのラベルにそれぞれ接続された 7,349 個の猫と犬の画像があります。 *メモ:
    • 各クラスには約 200 枚の画像があります。
    • 列車または列車と検証の場合は 3,680、テストの場合は 3,669。
  • は PyTorch の OxfordIIITPet() です。

Datasets for Computer Vision (3)

(2) オックスフォード 102 フラワー(2008):

  • には、8,189 枚の花の画像 (電車用 1,020 枚、検証用 1,020 枚、テスト用 6,149 枚) があり、102 のカテゴリ (クラス) があります。 *各クラスには 40 ~ 258 枚の画像があります。
  • は PyTorch の Flowers102() です。

Datasets for Computer Vision (3)

(3) スタンフォードカーズ(2013):

  • には、196 クラスの 16,185 個の車両画像 (電車用が 8,144 個、テスト用が 8,041 個) があります。
  • は PyTorch の StanfordCars() です。

Datasets for Computer Vision (3)

(4) Places365(2017):

  • には、Places データベースの 434 のシーン カテゴリ (クラス) のうち 365 のシーン カテゴリ (クラス) のシーン画像があり、Places365-StandardPlaces365-Challenge、およびPlaces-Extra69 をご覧ください: *メモ:
    • Places365-Standard には、Places データベースの 434 のカテゴリ (クラス) のうち 365 のカテゴリ (クラス) を含む 2,168,460 枚の画像 (電車用 1,803,460 枚、検証用 36,500 枚、テスト用 328,500 枚) があります。 *検証セットにはカテゴリ (クラス) ごとに 50 枚の画像があり、テスト セットにはカテゴリ (クラス) ごとに 900 枚の画像があります。
    • Places365-Challenge には 8,391,628 枚の画像 (電車用 8,026,628 枚、検証用 36,500 枚、テスト用 328,500 枚) があり、Places365-Standard のトレイン セットに 6,223,168 枚の追加画像が追加されます。
    • Places-Extra69 には、Places データベースの 434 カテゴリ (クラス) のうち 69 のカテゴリ (クラス) を追加した 105,321 枚の画像 (電車用が 98,721 枚、テスト用が 6,600 枚) があります。 ※現在、ダウンロードできません。
  • は PyTorch の Places365() です。

Datasets for Computer Vision (3)

(5) Flickr8k(2013):

  • flickr から取得した 8,091 枚の画像があり、各画像に 5 つの異なるキャプションが付いています。
  • は PyTorch の Flickr8k() ですが、それにデータセットを設定する方法が説明されていないため、データセットをロードする方法がわかりません。

Datasets for Computer Vision (3)

(6) Flickr30k(2015):

  • には、flickr から取得した 31,784 枚の画像があり、各画像に 5 つの異なるキャプションが付いています。
  • は PyTorch の Flickr8k() ですが、それにデータセットを設定する方法が説明されていないため、データセットをロードする方法がわかりません。

Datasets for Computer Vision (3)

以上がコンピュータービジョン用のデータセット (3)の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。