請我喝杯咖啡☕
(1) MNIST(修改後的國家標準與技術研究所)(1998):
- 有 70,000 個手寫數字[0~9],每個數字為 28x28 像素。 *火車60,000,測試10,000。
- 是 PyTorch 中的 MNIST()。
(2) EMNIST(擴充 MNIST)(2017):
- 有手寫字元(數字[0~9]和字母[A~Z][a~z]),每個28x28像素,分為6個資料集(ByClass, ByMerge 、平衡、字母、 數字 和 MNIST):
*備註:
-
ByClass 有 814,255 個字元(數字[0~9]和字母[A~Z][a~z])。 *火車697,932,測試116,323。
-
ByMerge 有 814,255 個字元(數字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火車697,932,測試116,323。
-
平衡有131,600個字(數字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火車112,800,測試18,800。
-
字母有145,600個字母[a~z]。 *火車124,800,測試20,800。
-
數字有280,000個數字[0~9]。 *火車240,000,測試40,000。
-
MNIST 有 70,000 個數字[0~9]。 *火車60,000,測試10,000。
- 是 PyTorch 中的 EMNIST()。
(3) QMNIST(2019):
- 有 120,000 個手寫數字[0~9],每個數字 28x28 像素。 *火車60,000,測試60,000。
- 是一個擴充的 MNIST。 *我不知道QMNIST的Q是什麼意思。
- 是 PyTorch 中的 QMNIST()。
(4)ETLCDB(提取-轉換-載入字元資料庫)(2011):
- 將手寫或機器列印的數字、符號、字母和日文字分為9 個資料集(ETL-1、ETL-2、ETL-3 、ETL-4、 ETL-5、ETL-6、ETL-7、ETL-8 和ETL-9) : : : : : : : : : : : : : : : : : : : : : :
*備註:
-
ETL1 有 141,319 個字元(數字[0~9]、字母[A~Z]、符號[-*/=()・,?'] 和片假名[ア~ン])。
-
ETL2有52,796個字元(數字[0~9]、字母[A~Z]、符號、片假名字母[ア~ン]、平假名字母[あ~ん]和漢字字母)。
-
ETL3有9,600個字元(數字[0~9]、字母[A~Z]和符號[¥ -*/=()・,_▾])。
-
ETL4 有 6,120 個字母[あ~ん]。
-
ETL5 有 10,608 個片假名字母[ア~ン]。
-
ETL6 有 52,796 個字元(數字[0~9]、字母[A~Z][a~z]、符號和片假名字母[ア~ン])。
-
ETL7(ETL7L 和 ETL7S) 有 16,800 個字符
- ETL8(ETL8G 和 ETL8B2) 有 152,960 個字符
ETL9(ETL9G 和 ETL9B)- 有 607,200 個字符
它不在 PyTorch 中,所以我們需要從 etlcdb 下載它。
-
(5)葛紫寺(2018):
日文字符的草書風格分為 3 個資料集(
Kuzushiji-MNIST
、- Kuzushiji-49 和 Kuzushiji-Kanji):
*備註:
Kuzushiji-MNIST
解析度為 28x28 像素
-
Kuzushiji-49 每個都有 28x28 像素
Kuzushiji-49- 。
Kuzushiji-Kanji
具有不平衡的 140,424 個漢字字符,每個字符為 64x64 像素。 -
KMNIST() 在 PyTorch 中,但它只有
Kuzushiji-MNIST 🎜>
-
(6) 移動 MNIST(2015):
有 10,000 個視頻,每個視頻為 64x64 像素。 *每個影片有 20 幀,有 2 個移動數字。
MovingMNIST() 位於 PyTorch 中。
以上是電腦視覺資料集 (1)的詳細內容。更多資訊請關注PHP中文網其他相關文章!