Maison >développement back-end >Tutoriel Python >Ensembles de données pour la vision par ordinateur (1)

Ensembles de données pour la vision par ordinateur (1)

Linda Hamilton
Linda Hamiltonoriginal
2024-12-17 14:16:11635parcourir

Achetez-moi un café☕

(1) MNIST (Institut national modifié des normes et de la technologie)(1998) :

  • a les 70 000 chiffres manuscrits [0 ~ 9] de 28 x 28 pixels chacun. *60 000 pour le train et 10 000 pour le test.
  • est MNIST() dans PyTorch.

Datasets for Computer Vision (1)

(2) EMNIST(MNIST étendu)(2017) :

  • a les caractères manuscrits (chiffres[0~9] et lettres de l'alphabet[A~Z][a~z]) de 28x28 pixels chacun, divisés en 6 ensembles de données (ByClass, ByMerge , Équilibré, Lettres, Chiffres et MNIST) : *Mémos :
    • ByClass comporte 814 255 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a~z]). *697 932 pour le train et 116 323 pour le test.
    • ByMerge comporte 814 255 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a, b, d~h, n, q, r, t]). *697 932 pour le train et 116 323 pour le test.
    • Équilibré comporte 131 600 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a, b, d~h, n, q, r, t]). *112 800 pour le train et 18 800 pour le test.
    • Lettres compte 145 600 lettres de l'alphabet[a~z]. *124 800 pour le train et 20 800 pour le test.
    • Chiffres a 280 000 chiffres[0~9]. *240 000 pour le train et 40 000 pour le test.
    • MNIST comporte 70 000 chiffres[0~9]. *60 000 pour le train et 10 000 pour le test.
  • est EMNIST() dans PyTorch.

Datasets for Computer Vision (1)

(3) QMNIST(2019) :

  • comporte 120 000 chiffres manuscrits [0~9] de 28 x 28 pixels chacun. *60 000 pour le train et 60 000 pour le test.
  • est un MNIST étendu. *Je ne sais pas ce que signifie Q de QMNIST.
  • est QMNIST() dans PyTorch.

Datasets for Computer Vision (1)

(4) ETLCDB (Base de données de caractères Extract-Transform-Load)(2011) :

  • les chiffres, symboles, lettres de l'alphabet et caractères japonais manuscrits ou imprimés à la machine sont divisés en 9 ensembles de données (ETL-1, ETL-2, ETL-3 , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 et ETL-9) : : : : : : : : : : : : : : : : : : : : : *Mémos :
    • ETL1 comporte 141 319 caractères (chiffres[0~9], lettres de l'alphabet[A~Z], symboles[-*/=()・,?'] et Katakana[ア~ン]).
    • ETL2 comporte 52 796 caractères (chiffres [0 ~ 9], lettres de l'alphabet [A ~ Z], symboles, lettres Katakana [ア ~ ン], lettres Hiragana [あ ~ ん] et lettres Kanji).
    • ETL3 comporte 9 600 caractères (chiffres[0~9], lettres de l'alphabet[A~Z] et symboles[¥ -*/=()・,_▾]).
    • ETL4 a 6 120 lettres[あ~ん].
    • ETL5 a 10 608 lettres Katakana[ア~ン].
    • ETL6 comporte 52 796 caractères (chiffres[0~9], lettres de l'alphabet[A~Z][a~z], symboles et lettres Katakana[ア~ン]).
    • ETL7(ETL7L et ETL7S) comporte 16 800 caractères
    • ETL8(ETL8G et ETL8B2) comporte 152 960 caractères
    • ETL9(ETL9G et ETL9B)
    • comporte 607 200 caractères
    • Ce n'est pas dans PyTorch, nous devons donc le télécharger depuis etlcdb.

(5) Kuzushiji(2018) :Datasets for Computer Vision (1)

Le style cursif des caractères japonais est divisé en 3 ensembles de données (

Kuzushiji-MNIST
    ,
  • Kuzushiji-49 et Kuzushiji-Kanji) : *Mémos : Kuzushiji-MNIST
      a une résolution de 28x28 pixels
    • Kuzushiji-49 a 28x28 pixels chacun
    • Kuzushiji-49
    • Kuzushiji-Kanji
    • a 140 424 caractères Kanji déséquilibrés de 64 x 64 pixels chacun.
    • KMNIST() est dans PyTorch mais il n'a que
    Kuzushiji-MNIST
  • 🎜>
  • (6) Déménagement MNIST(2015) :
  • contient 10 000 vidéos de 64 x 64 pixels chacune. *Chaque vidéo comporte 20 images avec 2 chiffres mobiles.

MovingMNIST() est dans PyTorch.Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!

Déclaration:
Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn