커피 한잔 사주세요😄
(1) MNIST(수정된 국립 표준 기술 연구소)(1998):
- 각각 28x28 픽셀로 70,000개의 손으로 쓴 숫자[0~9]가 있습니다. *기차용 60,000, 테스트용 10,000
- PyTorch의 MNIST()입니다.
(2) EMNIST(확장 MNIST)(2017):
- 손글씨 문자(숫자[0~9]와 알파벳[A~Z][a~z])를 각각 28x28픽셀로 6개의 데이터 세트(ByClass, ByMerge)로 나눕니다. , 균형, 글자, 숫자 및 MNIST):
*메모:
-
ByClass는 814,255자(숫자[0~9], 영문자[A~Z][a~z])로 구성됩니다. *기차용 697,932개, 시험용 116,323개.
-
ByMerge에는 814,255자(숫자[0~9] 및 알파벳[A~Z][a, b, d~h, n, q, r, t])가 있습니다. *기차용 697,932개, 시험용 116,323개.
-
Balanced는 131,600자(숫자[0~9], 영문자[A~Z][a, b, d~h, n, q, r, t])로 구성됩니다. *기차용 112,800, 시험용 18,800
-
문자에는 145,600개의 알파벳[a~z]이 있습니다. *기차용 124,800, 시험용 20,800
-
숫자에는 280,000자리[0~9]가 있습니다. *기차용 240,000, 시험용 40,000
-
MNIST에는 70,000자리[0~9]가 있습니다. *기차용 60,000, 테스트용 10,000
- PyTorch의 EMNIST()입니다.
(3) QMNIST(2019):
- 각각 28x28 픽셀로 120,000개의 손으로 쓴 숫자[0~9]가 있습니다. *기차용 60,000, 시험용 60,000
- 은 확장된 MNIST입니다. *QMNIST의 Q가 무슨 뜻인지 모르겠습니다.
- PyTorch의 QMNIST()입니다.
(4) ETLCDB(Extract-Transform-Load Character Database)(2011):
- 손으로 직접 쓰거나 기계로 인쇄한 숫자, 기호, 알파벳 문자 및 일본어 문자를 9개의 데이터 세트로 분할합니다(ETL-1, ETL-2, ETL-3 , ETL-4, ETL-5, ETL-6, ETL-7, ETL-8 및 ETL-9) : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : : :
*메모:
-
ETL1에는 141,319자(숫자[0~9], 알파벳[A~Z], 기호[-*/=()・,?'] 및 가타카나[あ~ん])가 있습니다.
-
ETL2에는 52,796자(숫자[0~9], 알파벳[A~Z], 기호, 가타카나[あ~ん], 히라가나[あ~ん], 한자)가 있습니다.
-
ETL3에는 9,600자(숫자[0~9], 알파벳[A~Z] 및 기호[¥ -*/=()・,_▾])가 있습니다.
-
ETL4에는 6,120자[あ~ん]가 있습니다.
-
ETL5에는 10,608개의 가타카나 문자[あ~nt]가 있습니다.
-
ETL6에는 52,796자(숫자[0~9], 알파벳[A~Z][a~z], 기호 및 가타카나[あ~nt])가 있습니다.
-
ETL7(ETL7L 및 ETL7S)은 16,800자입니다.
- ETL8(ETL8G 및 ETL8B2)은 152,960자입니다.
ETL9(ETL9G 및 ETL9B)- 에는 607,200자가 있습니다.
PyTorch에는 없으므로 etlcdb에서 다운로드해야 합니다.
-
(5) 쿠즈시지(2018):
일본어 문자의 필기체 스타일은 3개의 데이터 세트(
Kuzushiji-MNIST
, - Kuzushiji-49 및 Kuzushiji-Kanji)로 나뉩니다.
*메모:
Kuzushiji-MNIST
의 해상도는 28x28픽셀입니다.
-
Kuzushiji-49는 각각 28x28픽셀입니다.
Kuzushiji-49-
구즈시지-한자
는 140,424자의 한자 문자를 각각 64x64픽셀로 불균형하게 구성합니다.-
KMNIST()는 PyTorch에 있지만
Kuzushiji-MNIST 🎜>만 있습니다.
-
(6) MNIST 이동(2015):
각각 64x64픽셀 크기의 동영상이 10,000개 있습니다. *각 영상은 2개의 움직이는 숫자로 구성된 20프레임으로 구성되어 있습니다.
MovingMNIST()는 PyTorch에 있습니다.
위 내용은 컴퓨터 비전용 데이터세트(1)의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!