Beli Saya Kopi☕
*Memo:
-
Siaran saya menerangkan MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji dan Moving MNIST.
-
Siaran saya menerangkan Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 dan CIFAR-100.
-
Siaran saya menerangkan Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k dan Flickr30k.
-
Siaran saya menerangkan ImageNet, LSUN dan MS COCO.
-
Siaran saya menerangkan Klasifikasi Imej(Pengiktirafan), Penyetempatan Objek, Pengesanan Objek dan Pembahagian Imej.
-
Siaran saya menerangkan Pengesanan Titik Utama(Pengesanan Tanda Tanda), Padanan Imej, Penjejakan Objek, Padanan Stereo, Ramalan Video, Aliran Optik, Kapsyen Imej.
(1) PASCAL VOC(Analisis Corak, Pemodelan Statistik dan Kelas Objek Visual Pembelajaran Pengiraan)(2005):
- mempunyai imej objek dan anotasi dengan 4, 10 atau 20 kelas dan terdapat 8 set data VOC2005, VOC2006, VOC2007, VOC2006 🎜>, VOC2009, VOC2010, VOC2011 dan VOC2012
:
*Memo:
-
VOC2005 mempunyai 2,232 imej dan anotasi(sesetengah untuk kereta api, beberapa untuk pengesahan dan beberapa untuk ujian) dengan 4 kelas.-
VOC2006 mempunyai 5,304 imej dan anotasi(1,277 untuk kereta api, 1,341 untuk pengesahan dan 2,686 untuk ujian) dengan 10 kelas.-
VOC2007 mempunyai 9,963 imej dan anotasi(2,501 untuk kereta api, 2,510 untuk pengesahan dan 4,952 untuk ujian) dengan 20 kelas.-
VOC2008 mempunyai 5,096 imej dan anotasi(2,111 untuk kereta api, 2,221 untuk pengesahan dan 764 sebagai tambahan) dengan 20 kelas. *Terdapat 4,133 imej untuk ujian di dalamnya tetapi abaikan sahaja.-
VOC2009 mempunyai 7,818 imej dan anotasi(3,473 untuk kereta api, 3,581 untuk pengesahan dan 764 sebagai tambahan) dengan 20 kelas.-
VOC2010 mempunyai 11,321 imej dan anotasi(4,998 untuk kereta api, 5,105 untuk pengesahan dan 1,218 sebagai tambahan) dengan 20 kelas.-
VOC2011 mempunyai 14,961 imej dan anotasi(5,717 untuk kereta api, 5,823 untuk pengesahan dan 3,421 sebagai tambahan) dengan 20 kelas.-
VOC2012 mempunyai 17,125 imej dan anotasi(5,717 untuk kereta api, 5,823 untuk pengesahan dan 5,585 sebagai tambahan) dengan 20 kelas.
-
ialah VOCSegmentation() dan VOCDetection() dalam PyTorch.
(2) Pangkalan Data SUN(Pangkalan data Memahami Pemandangan)(2010):
-
mempunyai 108,754 imej adegan dengan 397 kelas.-
juga dipanggil SUN397.-
ialah SUN397() dalam PyTorch.
(3) Set Data Kinetik(2017):
- mempunyai klip video pendek tindakan manusia dan terdapat 3 set data Kinetics-400, Kinetics-600 dan Kinetics-700:
*Memo:
- Setiap klip video berdurasi sekitar 10 saat.
-
Kinetics-400(2017) mempunyai 306,245 klip video setiap satu disambungkan ke label daripada 400 kategori(kelas).
-
Kinetics-600(2018) mempunyai 495,547 klip video setiap satu disambungkan ke label daripada 600 kategori.
-
Kinetics-700(2019) mempunyai 545,317 klip video setiap satu disambungkan ke label daripada 700 kategori.
- digunakan untuk Klasifikasi Video.
- ialah Kinetics() dalam PyTorch.
(4) Cityscapes(2016):
- mempunyai 25,000 imej pemandangan jalan bandar beranotasi pemahaman semantik dengan 30 kelas dikumpulkan ke dalam 8 kategori. *5,000 imej beranotasi halus dan 20,000 imej beranotasi kasar.
- digunakan untuk Pembahagian Imej.
- ialah Cityscapes() dalam PyTorch. *Cara untuk menetapkan set data tidak dijelaskan.
Imej beranotasi halus:
Imej beranotasi kasar:
Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (5). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!
Kenyataan:Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn