Achetez-moi un café☕
(1) MNIST (Institut national modifié des normes et de la technologie)(1998) :
- a les 70 000 chiffres manuscrits [0 ~ 9] de 28 x 28 pixels chacun. *60 000 pour le train et 10 000 pour le test.
- est MNIST() dans PyTorch.
(2) EMNIST(MNIST étendu)(2017) :
- a les caractères manuscrits (chiffres[0~9] et lettres de l'alphabet[A~Z][a~z]) de 28x28 pixels chacun, divisés en 6 ensembles de données (ByClass, ByMerge , Équilibré, Lettres, Chiffres et MNIST) :
*Mémos :
-
ByClass comporte 814 255 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a~z]). *697 932 pour le train et 116 323 pour le test.
-
ByMerge comporte 814 255 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a, b, d~h, n, q, r, t]). *697 932 pour le train et 116 323 pour le test.
-
Équilibré comporte 131 600 caractères (chiffres[0~9] et lettres de l'alphabet[A~Z][a, b, d~h, n, q, r, t]). *112 800 pour le train et 18 800 pour le test.
-
Lettres compte 145 600 lettres de l'alphabet[a~z]. *124 800 pour le train et 20 800 pour le test.
-
Chiffres a 280 000 chiffres[0~9]. *240 000 pour le train et 40 000 pour le test.
-
MNIST comporte 70 000 chiffres[0~9]. *60 000 pour le train et 10 000 pour le test.
- est EMNIST() dans PyTorch.
(3) QMNIST(2019) :
- comporte 120 000 chiffres manuscrits [0~9] de 28 x 28 pixels chacun. *60 000 pour le train et 60 000 pour le test.
- est un MNIST étendu. *Je ne sais pas ce que signifie Q de QMNIST.
- est QMNIST() dans PyTorch.
(4) ETLCDB (Base de données de caractères Extract-Transform-Load)(2011) :
- les chiffres, symboles, lettres de l'alphabet et caractères japonais manuscrits ou imprimés à la machine sont divisés en 9 ensembles de données (ETL-1, ETL-2, ETL-3 , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 et ETL-9) : : : : : : : : : : : : : : : : : : : : :
*Mémos :
-
ETL1 comporte 141 319 caractères (chiffres[0~9], lettres de l'alphabet[A~Z], symboles[-*/=()・,?'] et Katakana[ア~ン]).
-
ETL2 comporte 52 796 caractères (chiffres [0 ~ 9], lettres de l'alphabet [A ~ Z], symboles, lettres Katakana [ア ~ ン], lettres Hiragana [あ ~ ん] et lettres Kanji).
-
ETL3 comporte 9 600 caractères (chiffres[0~9], lettres de l'alphabet[A~Z] et symboles[¥ -*/=()・,_▾]).
-
ETL4 a 6 120 lettres[あ~ん].
-
ETL5 a 10 608 lettres Katakana[ア~ン].
-
ETL6 comporte 52 796 caractères (chiffres[0~9], lettres de l'alphabet[A~Z][a~z], symboles et lettres Katakana[ア~ン]).
-
ETL7(ETL7L et ETL7S) comporte 16 800 caractères
- ETL8(ETL8G et ETL8B2) comporte 152 960 caractères
ETL9(ETL9G et ETL9B)- comporte 607 200 caractères
Ce n'est pas dans PyTorch, nous devons donc le télécharger depuis etlcdb.
-
(5) Kuzushiji(2018) :
Le style cursif des caractères japonais est divisé en 3 ensembles de données (
Kuzushiji-MNIST
, - Kuzushiji-49 et Kuzushiji-Kanji) :
*Mémos :
Kuzushiji-MNIST
a une résolution de 28x28 pixels
-
Kuzushiji-49 a 28x28 pixels chacun
Kuzushiji-49-
Kuzushiji-Kanji
a 140 424 caractères Kanji déséquilibrés de 64 x 64 pixels chacun.-
KMNIST() est dans PyTorch mais il n'a que
Kuzushiji-MNIST 🎜>
-
(6) Déménagement MNIST(2015) :
contient 10 000 vidéos de 64 x 64 pixels chacune. *Chaque vidéo comporte 20 images avec 2 chiffres mobiles.
MovingMNIST() est dans PyTorch.
Ce qui précède est le contenu détaillé de. pour plus d'informations, suivez d'autres articles connexes sur le site Web de PHP en chinois!
Déclaration:Le contenu de cet article est volontairement contribué par les internautes et les droits d'auteur appartiennent à l'auteur original. Ce site n'assume aucune responsabilité légale correspondante. Si vous trouvez un contenu suspecté de plagiat ou de contrefaçon, veuillez contacter admin@php.cn