首頁 >後端開發 >Python教學 >電腦視覺資料集 (1)

電腦視覺資料集 (1)

Linda Hamilton
Linda Hamilton原創
2024-12-17 14:16:11635瀏覽

請我喝杯咖啡☕

(1) MNIST(修改後的國家標準與技術研究所)(1998):

  • 有 70,000 個手寫數字[0~9],每個數字為 28x28 像素。 *火車60,000,測試10,000。
  • 是 PyTorch 中的 MNIST()。

Datasets for Computer Vision (1)

(2) EMNIST(擴充 MNIST)(2017):

  • 有手寫字元(數字[0~9]和字母[A~Z][a~z]),每個28x28像素,分為6個資料集(ByClass, ByMerge 平衡字母數字MNIST): *備註:
    • ByClass 有 814,255 個字元(數字[0~9]和字母[A~Z][a~z])。 *火車697,932,測試116,323。
    • ByMerge 有 814,255 個字元(數字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火車697,932,測試116,323。
    • 平衡有131,600個字(數字[0~9]和字母[A~Z][a, b, d~h, n, q, r, t])。 *火車112,800,測試18,800。
    • 字母有145,600個字母[a~z]。 *火車124,800,測試20,800。
    • 數字有280,000個數字[0~9]。 *火車240,000,測試40,000。
    • MNIST 有 70,000 個數字[0~9]。 *火車60,000,測試10,000。
  • 是 PyTorch 中的 EMNIST()。

Datasets for Computer Vision (1)

(3) QMNIST(2019):

  • 有 120,000 個手寫數字[0~9],每個數字 28x28 像素。 *火車60,000,測試60,000。
  • 是一個擴充的 MNIST。 *我不知道QMNIST的Q是什麼意思。
  • 是 PyTorch 中的 QMNIST()。

Datasets for Computer Vision (1)

(4)ETLCDB(提取-轉換-載入字元資料庫)(2011):

  • 將手寫或機器列印的數字、符號、字母和日文字分為9 個資料集(ETL-1ETL-2ETL-3 ETL-4ETL-5ETL-6ETL-7ETL-8ETL-9) : : : : : : : : : : : : : : : : : : : : : : *備註:
    • ETL1 有 141,319 個字元(數字[0~9]、字母[A~Z]、符號[-*/=()・,?'] 和片假名[ア~ン])。
    • ETL2有52,796個字元(數字[0~9]、字母[A~Z]、符號、片假名字母[ア~ン]、平假名字母[あ~ん]和漢字字母)。
    • ETL3有9,600個字元(數字[0~9]、字母[A~Z]和符號[¥ -*/=()・,_▾])。
    • ETL4 有 6,120 個字母[あ~ん]。
    • ETL5 有 10,608 個片假名字母[ア~ン]。
    • ETL6 有 52,796 個字元(數字[0~9]、字母[A~Z][a~z]、符號和片假名字母[ア~ン])。
    • ETL7(ETL7L 和 ETL7S) 有 16,800 個字符
    • ETL8(ETL8G 和 ETL8B2) 有 152,960 個字符
    • ETL9(ETL9G 和 ETL9B)
    • 有 607,200 個字符
    • 它不在 PyTorch 中,所以我們需要從 etlcdb 下載它。

(5)葛紫寺(2018):Datasets for Computer Vision (1)

日文字符的草書風格分為 3 個資料集(

Kuzushiji-MNIST
  • Kuzushiji-49Kuzushiji-Kanji): *備註: Kuzushiji-MNIST
      解析度為 28x28 像素
    • Kuzushiji-49 每個都有 28x28 像素
    • Kuzushiji-49
    • Kuzushiji-Kanji
    • 具有不平衡的 140,424 個漢字字符,每個字符為 64x64 像素。
    • KMNIST() 在 PyTorch 中,但它只有
    Kuzushiji-MNIST
  • 🎜>
  • (6) 移動 MNIST(2015):
  • 有 10,000 個視頻,每個視頻為 64x64 像素。 *每個影片有 20 幀,有 2 個移動數字。

MovingMNIST() 位於 PyTorch 中。 Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

以上是電腦視覺資料集 (1)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn