请我喝杯咖啡☕
(1) MNIST(修改后的国家标准与技术研究所)(1998):
- 有 70,000 个手写数字[0~9],每个数字为 28x28 像素。 *火车60,000,测试10,000。
- 是 PyTorch 中的 MNIST()。
(2) EMNIST(扩展 MNIST)(2017):
- 有手写字符(数字[0~9]和字母[A~Z][a~z]),每个28x28像素,分为6个数据集(ByClass, ByMerge 、平衡、字母、 数字 和 MNIST):
*备注:
-
ByClass 有 814,255 个字符(数字[0~9]和字母[A~Z][a~z])。 *火车697,932,测试116,323。
-
ByMerge 有 814,255 个字符(数字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火车697,932,测试116,323。
-
平衡有131,600个字符(数字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火车112,800,测试18,800。
-
字母有145,600个字母[a~z]。 *火车124,800,测试20,800。
-
数字有280,000个数字[0~9]。 *火车240,000,测试40,000。
-
MNIST 有 70,000 个数字[0~9]。 *火车60,000,测试10,000。
- 是 PyTorch 中的 EMNIST()。
(3) QMNIST(2019):
- 有 120,000 个手写数字[0~9],每个数字 28x28 像素。 *火车60,000,测试60,000。
- 是一个扩展的 MNIST。 *我不知道QMNIST的Q是什么意思。
- 是 PyTorch 中的 QMNIST()。
(4)ETLCDB(提取-转换-加载字符数据库)(2011):
- 将手写或机器打印的数字、符号、字母和日文字符分为 9 个数据集(ETL-1、ETL-2、ETL-3 、ETL-4、 ETL-5、ETL-6、ETL-7、ETL-8 和 ETL-9) : : : : : : : : : : : : : : : : : : : : : :
*备注:
-
ETL1 有 141,319 个字符(数字[0~9]、字母[A~Z]、符号[-*/=()・,?'] 和片假名[ア~ン])。
-
ETL2有52,796个字符(数字[0~9]、字母[A~Z]、符号、片假名字母[ア~ン]、平假名字母[あ~ん]和汉字字母)。
-
ETL3有9,600个字符(数字[0~9]、字母[A~Z]和符号[¥ -*/=()・,_▾])。
-
ETL4 有 6,120 个字母[あ~ん]。
-
ETL5 有 10,608 个片假名字母[ア~ン]。
-
ETL6 有 52,796 个字符(数字[0~9]、字母[A~Z][a~z]、符号和片假名字母[ア~ン])。
-
ETL7(ETL7L 和 ETL7S) 有 16,800 个字符
- ETL8(ETL8G 和 ETL8B2) 有 152,960 个字符
ETL9(ETL9G 和 ETL9B)- 有 607,200 个字符
它不在 PyTorch 中,所以我们需要从 etlcdb 下载它。
-
(5)葛紫寺(2018):
日语字符的草书风格分为 3 个数据集(
Kuzushiji-MNIST
、- Kuzushiji-49 和 Kuzushiji-Kanji):
*备注:
Kuzushiji-MNIST
分辨率为 28x28 像素
-
Kuzushiji-49 每个都有 28x28 像素
Kuzushiji-49- 。
Kuzushiji-Kanji
具有不平衡的 140,424 个汉字字符,每个字符为 64x64 像素。-
KMNIST() 在 PyTorch 中,但它只有
Kuzushiji-MNIST 🎜>
-
(6) 移动 MNIST(2015):
有 10,000 个视频,每个视频为 64x64 像素。 *每个视频有 20 帧,有 2 个移动数字。
MovingMNIST() 位于 PyTorch 中。
以上是计算机视觉数据集 (1)的详细内容。更多信息请关注PHP中文网其他相关文章!