>백엔드 개발 >파이썬 튜토리얼 >컴퓨터 비전용 데이터세트(1)

컴퓨터 비전용 데이터세트(1)

Linda Hamilton
Linda Hamilton원래의
2024-12-17 14:16:11684검색

커피 한잔 사주세요😄

(1) MNIST(수정된 국립 표준 기술 연구소)(1998):

  • 각각 28x28 픽셀로 70,000개의 손으로 쓴 숫자[0~9]가 있습니다. *기차용 60,000, 테스트용 10,000
  • PyTorch의 MNIST()입니다.

Datasets for Computer Vision (1)

(2) EMNIST(확장 MNIST)(2017):

  • 손글씨 문자(숫자[0~9]와 알파벳[A~Z][a~z])를 각각 28x28픽셀로 6개의 데이터 세트(ByClass, ByMerge)로 나눕니다. , 균형, 글자, 숫자MNIST): *메모:
    • ByClass는 814,255자(숫자[0~9], 영문자[A~Z][a~z])로 구성됩니다. *기차용 697,932개, 시험용 116,323개.
    • ByMerge에는 814,255자(숫자[0~9] 및 알파벳[A~Z][a, b, d~h, n, q, r, t])가 있습니다. *기차용 697,932개, 시험용 116,323개.
    • Balanced는 131,600자(숫자[0~9], 영문자[A~Z][a, b, d~h, n, q, r, t])로 구성됩니다. *기차용 112,800, 시험용 18,800
    • 문자에는 145,600개의 알파벳[a~z]이 있습니다. *기차용 124,800, 시험용 20,800
    • 숫자에는 280,000자리[0~9]가 있습니다. *기차용 240,000, 시험용 40,000
    • MNIST에는 70,000자리[0~9]가 있습니다. *기차용 60,000, 테스트용 10,000
  • PyTorch의 EMNIST()입니다.

Datasets for Computer Vision (1)

(3) QMNIST(2019):

  • 각각 28x28 픽셀로 120,000개의 손으로 쓴 숫자[0~9]가 있습니다. *기차용 60,000, 시험용 60,000
  • 은 확장된 MNIST입니다. *QMNIST의 Q가 무슨 뜻인지 모르겠습니다.
  • PyTorch의 QMNIST()입니다.

Datasets for Computer Vision (1)

(4) ETLCDB(Extract-Transform-Load Character Database)(2011):

  • 손으로 직접 쓰거나 기계로 인쇄한 숫자, 기호, 알파벳 문자 및 일본어 문자를 9개의 데이터 세트로 분할합니다(ETL-1, ETL-2, ETL-3 , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8ETL-9) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : *메모:
    • ETL1에는 141,319자(숫자[0~9], 알파벳[A~Z], 기호[-*/=()・,?'] 및 가타카나[あ~ん])가 있습니다.
    • ETL2에는 52,796자(숫자[0~9], 알파벳[A~Z], 기호, 가타카나[あ~ん], 히라가나[あ~ん], 한자)가 있습니다.
    • ETL3에는 9,600자(숫자[0~9], 알파벳[A~Z] 및 기호[¥ -*/=()・,_▾])가 있습니다.
    • ETL4에는 6,120자[あ~ん]가 있습니다.
    • ETL5에는 10,608개의 가타카나 문자[あ~nt]가 있습니다.
    • ETL6에는 52,796자(숫자[0~9], 알파벳[A~Z][a~z], 기호 및 가타카나[あ~nt])가 있습니다.
    • ETL7(ETL7L 및 ETL7S)은 16,800자입니다.
    • ETL8(ETL8G 및 ETL8B2)은 152,960자입니다.
    • ETL9(ETL9G 및 ETL9B)
    • 에는 607,200자가 있습니다.
    • PyTorch에는 없으므로 etlcdb에서 다운로드해야 합니다.

(5) 쿠즈시지(2018):Datasets for Computer Vision (1)

일본어 문자의 필기체 스타일은 3개의 데이터 세트(

Kuzushiji-MNIST
    ,
  • Kuzushiji-49Kuzushiji-Kanji)로 나뉩니다. *메모: Kuzushiji-MNIST
      의 해상도는 28x28픽셀입니다.
    • Kuzushiji-49는 각각 28x28픽셀입니다.
    • Kuzushiji-49
    • 구즈시지-한자
    • 는 140,424자의 한자 문자를 각각 64x64픽셀로 불균형하게 구성합니다.
    • KMNIST()는 PyTorch에 있지만
    Kuzushiji-MNIST
  • 🎜>만 있습니다.
  • (6) MNIST 이동(2015):
  • 각각 64x64픽셀 크기의 동영상이 10,000개 있습니다. *각 영상은 2개의 움직이는 숫자로 구성된 20프레임으로 구성되어 있습니다.

MovingMNIST()는 PyTorch에 있습니다.Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

    Datasets for Computer Vision (1)

위 내용은 컴퓨터 비전용 데이터세트(1)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.