Maison >développement back-end >Tutoriel Python >Ensembles de données pour la vision par ordinateur (4)

Ensembles de données pour la vision par ordinateur (4)

Barbara Streisand
Barbara Streisandoriginal
2024-12-09 19:43:17287parcourir

Achetez-moi un café☕

*Mémos :

  • Mon article explique MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji et Moving MNIST.
  • Mon article explique Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 et CIFAR-100.
  • Mon article explique Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k et Flickr30k.

(1) ImageNet(2009) :

  • a les 1 331 167 images d'objets (1 281 167 pour le train et 50 000 pour la validation) chacune connectée au label parmi 1000 classes : *Mémos :
    • Chaque classe a un ou plusieurs noms qui représentent les mêmes choses.
    • Vous pouvez télécharger ILSVRC2012_devkit_t12.tar.gz, ILSVRC2012_img_train.tar et ILSVRC2012_img_val.tar.
  • est ImageNet() dans PyTorch.

Datasets for Computer Vision (4)

(2) LSUN (Compréhension des scènes à grande échelle)(2015) :

  • a des images de scène et il y a les 10 ensembles de données Chambre, Pont, Église extérieure, Salle de classe, Salle de conférence , Salle à manger, Cuisine, Salon, Restaurant et Tour :
    • Chambre compte 3 033 342 images de chambre (3 033 042 pour le train et 300 pour la validation).
    • Bridge compte 818 987 images de pont (818 687 pour le train et 300 pour la validation).
    • Church Outdoor compte 126 527 images extérieures d'églises (126 227 pour le train et 300 pour la validation).
    • Classroom compte 126 527 images de classe (126 227 pour le train et 300 pour la validation).
    • Salle de conférence compte 229 369 images de salle de conférence (229 069 pour le train et 300 pour la validation).
    • Salle à manger compte 657 871 images de salle à manger (657 571 pour le train et 300 pour la validation).
    • Cuisine compte 2 212 577 images de cuisine (2 212 277 pour le train et 300 pour la validation).
    • Salon compte 1 316 102 images de salon (1 315 802 pour le train et 300 pour la validation).
    • Restaurant compte 626 631 images de restaurant (626 331 pour le train et 300 pour la validation).
    • La tour compte 708 564 images de tour (708 264 pour le train et 300 pour la validation).
  • est LSUN() dans PyTorch mais il a le bug.

Datasets for Computer Vision (4)

(3) MS COCO(Microsoft Common Objects in Context)(2014) :

  • a des images d'objets avec des annotations et il y a les 16 ensembles de données Images de train 2014 et Images Val 2014 avec Annotations Train/Val 2014, 2014 Images de test avec Image de test 2014 info, Images de test 2015 avec Informations sur l'image de test 2015, Images de train 2017 et Images Val 2017 avec 2017 Annotations Train/Val, Annotations Stuff Train/Val 2017 ou Annotations Panoptic Train/Val 2017, Images de test 2017 avec Informations sur l'image de test 2017 et 2017 Images sans étiquette avec Informations sur l'image sans étiquette 2017 : *Mémos :
    • Images de train 2014 compte 82 782 images.
    • Images Val 2014 compte 40 504 images.
    • Annotations Train/Val 2014 compte 123 286 annotations (82 782 pour le train et 40 504 pour la validation) pour les Images Train 2014 et Images Val 2014.
    • Images de test 2014 compte 40 775 images.
    • Informations sur l'image de test 2014 contient 40 775 annotations pour Images de test 2014.
    • Images de test 2015 compte 81 434 images.
    • Informations sur l'image de test 2015 contient 81 434 annotations pour Images de test 2015.
    • Images de train 2017 compte 118 287 images.
    • Images Val 2017 compte 5 000 images.
    • Annotations Train/Val 2017 compte 123 287 annotations (118 287 pour le train et 5 000 pour la validation) pour les Images Train 2017 et Images Val 2017.
    • Annotations Stuff Train/Val 2017 compte 123 287 annotations (118 287 pour le train et 5 000 pour la validation) pour les images Train 2017 et images Val 2017.
    • Annotations Panoptic Train/Val 2017 compte 123 287 annotations (118 287 pour le train et 5 000 pour la validation) pour les images du train 2017 et les images Val 2017.
    • Images de test 2017 compte 40 670 images.
    • Informations sur l'image de test 2017 contient 40 670 annotations pour Images de test 2017.
    • Images sans étiquette 2017 compte 123 403 images.
    • Informations sur les images sans étiquette de 2017 contient 123 403 annotations pour Images sans étiquette de 2017.
  • s'appelle aussi simplement COCO.
  • est CocoDetection() ou CocoCaptions()

Datasets for Computer Vision (4)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn