>백엔드 개발 >파이썬 튜토리얼 >컴퓨터 비전용 데이터세트(2)

컴퓨터 비전용 데이터세트(2)

DDD
DDD원래의
2024-11-24 13:55:14434검색

커피 한잔 사주세요😄

*내 게시물에서는 MNIST, EMNIST, QMNIST, ETLCDB, Kuzushiji 및 Moving MNIST에 대해 설명합니다.

(1) 패션-MNIST(2017):

  • 10개 클래스의 10개 클래스 라벨에 각각 연결된 70,000개의 패션 이미지가 있습니다. *메모:
    • 기차용 60,000, 시험용 10,000
    • 각 이미지는 28x28픽셀입니다.
  • PyTorch의 FashionMNIST()입니다.

Datasets for Computer Vision (2)

(2) Caltech 101(2003):

  • 에는 101개 카테고리(클래스)의 라벨에 각각 연결된 8,677개의 객체 이미지가 있습니다. *각 이미지의 크기는 대략 300x200픽셀입니다.
  • PyTorch의 Caltech101()입니다.

Datasets for Computer Vision (2)

(3) Caltech 256(2007):

  • 257개 카테고리(클래스)의 라벨에 연결된 30,607개의 객체 이미지가 있습니다. *실제로는 칼텍 256이라는 이름에 비해 257개의 카테고리(클래스)가 있습니다.
  • PyTorch의 Caltech256()입니다.

Datasets for Computer Vision (2)

Datasets for Computer Vision (2)

(4) CelebA(대규모 CelebFaces 속성)(2015):

  • 202,599개의 유명인 얼굴 이미지가 각각 40개의 속성과 연결되어 있습니다. *메모:
    • 트레인용 162,770개, 검증용 19,867개, 테스트용 19,962개.
    • 구글 드라이브에서 구글 드라이브 API로 다운로드하는 것은 용량이 너무 붐비기 때문에 구글 드라이브에서 직접 다운로드하는 것을 권장합니다.
  • PyTorch의 CelebA()입니다.

Datasets for Computer Vision (2)

(5) CIFAR-10(캐나다 고등연구소-10)(2009):

  • 10개 클래스의 라벨에 각각 연결된 60,000개의 차량 및 동물 이미지가 있습니다. *메모:
    • 기차용 50,000, 시험용 10,000
    • 각 이미지는 32x32픽셀입니다.
  • PyTorch의 CIFAR10()입니다.

Datasets for Computer Vision (2)

(6) CIFAR-100(캐나다 고등연구소-100)(2009):

  • 100개 클래스의 라벨에 각각 연결된 60,000개의 객체 이미지가 있습니다. *메모:
    • 기차용 50,000, 시험용 10,000
    • 각 이미지는 32x32픽셀입니다.
  • PyTorch의 CIFAR100()입니다.

Datasets for Computer Vision (2)

위 내용은 컴퓨터 비전용 데이터세트(2)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.