首页 >后端开发 >Python教程 >计算机视觉数据集 (1)

计算机视觉数据集 (1)

Linda Hamilton
Linda Hamilton原创
2024-12-17 14:16:11634浏览

请我喝杯咖啡☕

(1) MNIST(修改后的国家标准与技术研究所)(1998):

  • 有 70,000 个手写数字[0~9],每个数字为 28x28 像素。 *火车60,000,测试10,000。
  • 是 PyTorch 中的 MNIST()。

Datasets for Computer Vision (1)

(2) EMNIST(扩展 MNIST)(2017):

  • 有手写字符(数字[0~9]和字母[A~Z][a~z]),每个28x28像素,分为6个数据集(ByClass, ByMerge 平衡字母数字MNIST): *备注:
    • ByClass 有 814,255 个字符(数字[0~9]和字母[A~Z][a~z])。 *火车697,932,测试116,323。
    • ByMerge 有 814,255 个字符(数字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火车697,932,测试116,323。
    • 平衡有131,600个字符(数字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火车112,800,测试18,800。
    • 字母有145,600个字母[a~z]。 *火车124,800,测试20,800。
    • 数字有280,000个数字[0~9]。 *火车240,000,测试40,000。
    • MNIST 有 70,000 个数字[0~9]。 *火车60,000,测试10,000。
  • 是 PyTorch 中的 EMNIST()。

Datasets for Computer Vision (1)

(3) QMNIST(2019):

  • 有 120,000 个手写数字[0~9],每个数字 28x28 像素。 *火车60,000,测试60,000。
  • 是一个扩展的 MNIST。 *我不知道QMNIST的Q是什么意思。
  • 是 PyTorch 中的 QMNIST()。

Datasets for Computer Vision (1)

(4)ETLCDB(提取-转换-加载字符数据库)(2011):

  • 将手写或机器打印的数字、符号、字母和日文字符分为 9 个数据集(ETL-1ETL-2ETL-3 ETL-4ETL-5ETL-6ETL-7ETL-8ETL-9) : : : : : : : : : : : : : : : : : : : : : : *备注:
    • ETL1 有 141,319 个字符(数字[0~9]、字母[A~Z]、符号[-*/=()・,?'] 和片假名[ア~ン])。
    • ETL2有52,796个字符(数字[0~9]、字母[A~Z]、符号、片假名字母[ア~ン]、平假名字母[あ~ん]和汉字字母)。
    • ETL3有9,600个字符(数字[0~9]、字母[A~Z]和符号[¥ -*/=()・,_▾])。
    • ETL4 有 6,120 个字母[あ~ん]。
    • ETL5 有 10,608 个片假名字母[ア~ン]。
    • ETL6 有 52,796 个字符(数字[0~9]、字母[A~Z][a~z]、符号和片假名字母[ア~ン])。
    • ETL7(ETL7L 和 ETL7S) 有 16,800 个字符
    • ETL8(ETL8G 和 ETL8B2) 有 152,960 个字符
    • ETL9(ETL9G 和 ETL9B)
    • 有 607,200 个字符
    • 它不在 PyTorch 中,所以我们需要从 etlcdb 下载它。

(5)葛紫寺(2018):Datasets for Computer Vision (1)

日语字符的草书风格分为 3 个数据集(

Kuzushiji-MNIST
  • Kuzushiji-49Kuzushiji-Kanji): *备注: Kuzushiji-MNIST
      分辨率为 28x28 像素
    • Kuzushiji-49 每个都有 28x28 像素
    • Kuzushiji-49
    • Kuzushiji-Kanji
    • 具有不平衡的 140,424 个汉字字符,每个字符为 64x64 像素。
    • KMNIST() 在 PyTorch 中,但它只有
    Kuzushiji-MNIST
  • 🎜>
  • (6) 移动 MNIST(2015):
  • 有 10,000 个视频,每个视频为 64x64 像素。 *每个视频有 20 帧,有 2 个移动数字。

MovingMNIST() 位于 PyTorch 中。Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

以上是计算机视觉数据集 (1)的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn