首頁 >後端開發 >Python教學 >電腦視覺資料集 (4)

電腦視覺資料集 (4)

Barbara Streisand
Barbara Streisand原創
2024-12-09 19:43:17289瀏覽

請我喝杯咖啡☕

*備忘錄:

  • 我的貼文解釋了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。
  • 我的貼文解釋了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。
  • 我的貼文解釋了 Oxford-IIIT Pet、Oxford 102 Flower、Stanford Cars、Places365、Flickr8k 和 Flickr30k。

(1) ImageNet(2009):

  • 有 1,331,167 個物件影像(1,281,167 個用於訓練,50,000 個用於驗證),每個影像都連接到來自 1000 個類別的標籤: *備註:
    • 每個類別都有一個或多個代表相同事物的名稱。
    • 您可以下載 ILSVRC2012_devkit_t12.tar.gz、ILSVRC2012_img_train.tar 和 ILSVRC2012_img_val.tar。
  • 是 PyTorch 中的 ImageNet()。

Datasets for Computer Vision (4)

(2) LSUN(大規模場景理解)(2015):

  • 有場景影像,有10個資料集臥室橋樑教會戶外教室會議室餐廳廚房客廳餐廳塔樓
    • 臥室 有 3,033,342 張臥室圖像(3,033,042 張用於火車,300 張用於驗證)。
    • 橋樑 有 818,987 張橋樑圖像(818,687 張用於火車,300 張用於驗證)。
    • 教堂戶外有126,527張教堂戶外圖像(126,227張用於火車,300張用於驗證)。
    • 教室有126,527張教室圖像(126,227張用於訓練,300張用於驗證)。
    • 會議室有229,369張會議室影像(229,069張用於訓練,300張用於驗證)。
    • 餐廳有 657,871 個餐廳圖像(657,571 個用於火車,300 個用於驗證)。
    • 廚房 有 2,212,577 張廚房圖像(2,212,277 張用於火車,300 張用於驗證)。
    • 客廳有1,316,102張客廳影像(1,315,802張用於火車,300張用於驗證)。
    • 餐廳有626,631張餐廳圖片(626,331張用於火車,300張用於驗證)。
    • 有 708,564 個塔圖像(708,264 個用於訓練,300 個用於驗證)。
  • 是 PyTorch 中的 LSUN(),但它有錯誤。

Datasets for Computer Vision (4)

(3) MS COCO(Microsoft Common Objects in Context)(2014):

  • 有註解的物件影像,並且有 16 個資料集 2014 年訓練影像2014 Val 影像 以及 2014 年訓練/Val註2014測試圖像2014年測試圖像資訊2015 測試圖像2015 測試資訊圖像 >2017 訓練影像2017 Val 圖片2017 Train/Val 註釋, 2017填充訓練/Val 註釋2017 全景訓練/Val 註釋2017 全景訓練/Val 註釋2017 測試影像 以及2017 測試影像資訊2017 年未標記影像
      2017 年未標記影像資訊
    • : *備註:
    • 2014 年火車影像
    • 有 82,782 張圖片。
    • 2014 Val 影像
    • 有 40,504 張影像。 2014 Train/Val 註釋 for 2014 Train 影像
    • 2014 Val 影像
    • 有 123,286 個註釋(82,782 個用於訓練,40,504 個用於驗證)。
    • 2014 年測試影像
    • 有 40,775 張影像。 2014 年測試影像資訊 有 40,775 個關於
    • 2014 年測試影像
    • 的註解。
    • 2015 年測試影像
    • 有 81,434 張影像。 2015 年測試影像資訊 有 81,434 則關於
    • 2015 年測試影像
    • 的註解。
    • 2017 年火車影像
    • 有 118,287 張圖片。
    • 2017 Val 圖片
    • 有 5,000 張圖片。 2017 Train/Val 註釋 有123,287 個註釋(118,287 個用於訓練,5,000 個用於驗證),用於2017 Train 圖像
    • 2017 Val 圖像
    • 2017 Stuff Train/Val 註釋 有123,287 個註釋(118,287 個用於訓練,5,000 個用於驗證),用於2017 Train 圖片
    • 2017 Val 影像
    • 2017 Panoptic Train/Val 註釋 有123,287 個註釋(118,287 個用於訓練,5,000 個用於驗證),用於2017 Train 圖片
    • >。
    • 2017 年測試影像
    • 有 40,670 張影像。
    • 2017 年測試影像資訊 有 40,670 則關於 2017 年測試影像
    • 的註解。
    • 2017 年未標記影像
    • 有 123,403 張影像。
    • 2017 年未標記影像資訊 有 123,403 則關於 2017 年未標記影像
    • 的註解。
  • 也稱為COCO。
  • 是 CocoDetection() 或 CocoCaptions()

Datasets for Computer Vision (4)

以上是電腦視覺資料集 (4)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn