首页 >后端开发 >Python教程 >计算机视觉数据集 (3)

计算机视觉数据集 (3)

Linda Hamilton
Linda Hamilton原创
2024-12-03 10:00:24419浏览

请我喝杯咖啡☕

*备忘录:

  • 我的帖子解释了 MNIST、EMNIST、QMNIST、ETLCDB、Kuzushiji 和 Moving MNIST。
  • 我的帖子解释了 Fashion-MNIST、Caltech 101、Caltech 256、CelebA、CIFAR-10 和 CIFAR-100。

(1) 牛津-IIIT 宠物 (2012):

  • 有 7,349 张猫和狗图像,每个图像都连接到来自 37 个类别的标签: *备注:
    • 每个类大约有 200 张图像。
    • 3,680 用于训练或训练和验证,3,669 用于测试。
  • 是 PyTorch 中的 OxfordIIITPet()。

Datasets for Computer Vision (3)

(2)牛津102花(2008):

  • 有 8,189 个花卉图像(1,020 个用于训练,1,020 个用于验证,6,149 个用于测试),有 102 个类别(类)。 *每个班级有 40 至 258 张图片。
  • 是 PyTorch 中的 Flowers102()。

Datasets for Computer Vision (3)

(3) 斯坦福汽车 (2013):

  • 有 16185 个汽车图像(8,144 个用于火车,8,041 个用于测试),196 个类别。
  • 是 PyTorch 中的StanfordCars()。

Datasets for Computer Vision (3)

(4) Places365(2017):

  • 地点数据库中包含 434 个场景类别(类)中的 365 个场景类别(类)的场景图像,其中有 Places365-StandardPlaces365-ChallengePlaces-Extra69 如您所见: *备注:
    • Places365-Standard 拥有 2,168,460 张图像(1,803,460 张用于训练,36,500 张用于验证,328,500 张用于测试),地点数据库中有 434 个类别(类),其中包含 365 个类别(类)。 *验证集中每个类别(类)有 50 张图像,测试集中每个类别(类)有 900 张图像。
    • Places365-Challenge 有 8,391,628 个图像(8,026,628 个用于训练,36,500 个用于验证,328,500 个用于测试),为 Places365-Standard 的训练集添加了 6,223,168 个额外图像。
    • Places-Extra69 拥有 105,321 张图像(98,721 张用于训练,6,600 张用于测试),以及 Places 数据库中 434 个类别(类)中额外的 69 个类别(类)。 *目前无法下载。
  • 是 PyTorch 中的 Places365()。

Datasets for Computer Vision (3)

(5) Flickr8k(2013):

  • 从 flickr 获取 8,091 张图像,每张图像都有 5 个不同的标题。
  • 是 PyTorch 中的 Flickr8k(),但它没有解释如何为其设置数据集,所以我不知道如何用它加载数据集。

Datasets for Computer Vision (3)

(6) Flickr30k(2015):

  • 从 flickr 获取了 31,784 张图像,每张图像都有 5 个不同的标题。
  • 是 PyTorch 中的 Flickr8k(),但它没有解释如何为其设置数据集,所以我不知道如何用它加载数据集。

Datasets for Computer Vision (3)

以上是计算机视觉数据集 (3)的详细内容。更多信息请关注PHP中文网其他相关文章!

声明:
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn