請我喝杯咖啡☕ *備忘錄: 我的貼文解釋了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。 我的貼文解釋了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。 (1) 牛津-IIIT 寵物 (2012): 有 7,349 張貓和狗圖像,每個圖像都連接到來自 37 個類別的標籤: *備註: 每個類別大約有 200 張影像。 3,680 用於訓練或訓練和驗證,3,669 用於測試。 是 PyTorch 中的 OxfordIIITPet()。 (2)牛津102花(2008): 有 8,189 個花卉圖像(1,020 個用於訓練,1,020 個用於驗證,6,149 個用於測試),有 102 個類別(類)。 *每班有 40 至 258 張圖片。 是 PyTorch 中的 Flowers102()。 (3) 史丹佛汽車 (2013): 有 16185 個汽車圖像(8,144 個用於火車,8,041 個用於測試),196 個類別。 是 PyTorch 中的StanfordCars()。 (4) Places365(2017): 地點資料庫中包含434 個場景類別(類別)中的365 個場景類別(類別)的場景影像,其中有Places365-Standard、Places365-Challenge 和Places-Extra69 如您所見: *備註: Places365-Standard 擁有2,168,460 張圖像(1,803,460 張用於訓練,36,500 張用於驗證,328,500 張用於測試),地點資料庫中有434 個類別(類別),其中包含365 個類別(類別)類)。 *驗證集中每個類別(類別)有 50 張影像,測試集中每個類別(類別)有 900 張影像。 Places365-Challenge 有8,391,628 個圖像(8,026,628 個用於訓練,36,500 個用於驗證,328,500 個用於測試),為Places365-Standard Places-Extra69 擁有 105,321 張圖像(98,721 張用於訓練,6,600 張用於測試),以及 Places 資料庫中 434 個類別(類別)中額外的 69 個類別(類別)。 *目前無法下載。 是 PyTorch 中的 Places365()。 (5) Flickr8k(2013): 從 flickr 取得 8,091 張圖像,每張圖像都有 5 個不同的標題。 是 PyTorch 中的 Flickr8k(),但它沒有解釋如何為其設定資料集,所以我不知道如何用它載入資料集。 (6) Flickr30k(2015): 從 flickr 取得了 31,784 張圖像,每張圖像都有 5 個不同的標題。 是 PyTorch 中的 Flickr8k(),但它沒有解釋如何為其設定資料集,所以我不知道如何用它載入資料集。