Rumah >pembangunan bahagian belakang >Tutorial Python >Set Data untuk Penglihatan Komputer (5)

Set Data untuk Penglihatan Komputer (5)

Barbara Streisandasal: 2024-12-26 16:42:15564semak imbas

Beli Saya Kopi☕

*Memo:

Siaran saya menerangkan MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji dan Moving MNIST.
Siaran saya menerangkan Fashion-MNIST, Caltech 101, Caltech 256, CelebA, CIFAR-10 dan CIFAR-100.
Siaran saya menerangkan Oxford-IIIT Pet, Oxford 102 Flower, Stanford Cars, Places365, Flickr8k dan Flickr30k.
Siaran saya menerangkan ImageNet, LSUN dan MS COCO.
Siaran saya menerangkan Klasifikasi Imej(Pengiktirafan), Penyetempatan Objek, Pengesanan Objek dan Pembahagian Imej.
Siaran saya menerangkan Pengesanan Titik Utama(Pengesanan Tanda Tanda), Padanan Imej, Penjejakan Objek, Padanan Stereo, Ramalan Video, Aliran Optik, Kapsyen Imej.

(1) PASCAL VOC(Analisis Corak, Pemodelan Statistik dan Kelas Objek Visual Pembelajaran Pengiraan)(2005):

mempunyai imej objek dan anotasi dengan 4, 10 atau 20 kelas dan terdapat 8 set data VOC2005, VOC2006, VOC2007, VOC2006 🎜>, VOC2009, VOC2010, VOC2011 dan VOC2012

Datasets for Computer Vision (5)

(2) Pangkalan Data SUN(Pangkalan data Memahami Pemandangan)(2010):

Datasets for Computer Vision (5)

(3) Set Data Kinetik(2017):

mempunyai klip video pendek tindakan manusia dan terdapat 3 set data Kinetics-400, Kinetics-600 dan Kinetics-700: *Memo:
- Setiap klip video berdurasi sekitar 10 saat.
- Kinetics-400(2017) mempunyai 306,245 klip video setiap satu disambungkan ke label daripada 400 kategori(kelas).
- Kinetics-600(2018) mempunyai 495,547 klip video setiap satu disambungkan ke label daripada 600 kategori.
- Kinetics-700(2019) mempunyai 545,317 klip video setiap satu disambungkan ke label daripada 700 kategori.
digunakan untuk Klasifikasi Video.
ialah Kinetics() dalam PyTorch.

Datasets for Computer Vision (5)

(4) Cityscapes(2016):

mempunyai 25,000 imej pemandangan jalan bandar beranotasi pemahaman semantik dengan 30 kelas dikumpulkan ke dalam 8 kategori. *5,000 imej beranotasi halus dan 20,000 imej beranotasi kasar.
digunakan untuk Pembahagian Imej.
ialah Cityscapes() dalam PyTorch. *Cara untuk menetapkan set data tidak dijelaskan.

Imej beranotasi halus:

Datasets for Computer Vision (5)

Imej beranotasi kasar:

Datasets for Computer Vision (5)

Atas ialah kandungan terperinci Set Data untuk Penglihatan Komputer (5). Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Object for database pytorch

Kenyataan：

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Artikel sebelumnya：Bagaimanakah Saya Boleh Membenamkan Pembolehubah dengan Cekap ke dalam Rentetan dalam Python?Artikel seterusnya：Bagaimanakah Saya Boleh Membenamkan Pembolehubah dengan Cekap ke dalam Rentetan dalam Python?

Artikel berkaitan

Lihat lagi