>일반적인 문제 >Alexnet 네트워크 구조에 대한 자세한 설명

Alexnet 네트워크 구조에 대한 자세한 설명

(*-*)浩
(*-*)浩원래의
2019-10-26 15:55:0912859검색

2012년 Alex가 제안한 Alexnet 네트워크 구조 모델은 신경망 응용 열풍을 일으켰고, 2012년 이미지 인식 대회에서 우승하여 CNN을 이미지 분류의 핵심 알고리즘 모델로 만들었습니다.

Alexnet 네트워크 구조에 대한 자세한 설명

AlexNet 모델은 8개의 레이어, 5개의 컨볼루셔널 레이어, 3개의 완전 연결 레이어로 구분됩니다. 각 컨볼루셔널 레이어에는 여기 함수 RELU 및 로컬 응답 정규화(LRN) 처리가 포함되어 있으며 다운샘플링(풀 처리)이 수행됩니다. ). (추천 학습: 웹 프론트엔드 동영상 튜토리얼)

첫 번째 레이어: Convolutional 레이어 1, 입력은 224×224×3224 곱하기 224 곱하기 3224×224×3의 이미지이고, 컨볼루션 커널은 96이고, 논문에 있는 두 개의 GPU는 각각 48개의 커널을 계산합니다. 컨볼루션 커널의 크기는 11×11×311 곱하기 311×11×3이고, 스트라이드는 단계 크기를 나타내고, 패드 = 0은 확장이 없음을 의미합니다.

컨볼루션 후 이미지의 크기는 얼마입니까?

wide = (224 + 2 * padding - kernel_size) / stride + 1 = 54<br/>height = (224 + 2 * padding - kernel_size) / stride + 1 = 54<br/>dimention = 96<br/>

그런 다음 (Local Response Normalized)을 진행하고 pool_size = (3, 3), stride = 2, pad = 0을 풀링하고 마지막으로 컨볼루션의 첫 번째 레이어의 특징 맵을 얻습니다

두 번째 레이어: Volume 제품 레이어 2, 입력은 이전 컨볼루션 계층의 기능 맵이고 컨볼루션 수는 256개이며 논문의 두 GPU에는 각각 128개의 컨볼루션 커널이 있습니다. 컨볼루션 커널의 크기는 5×5×485 x 5 x 485×5×48입니다. pad = 2, stride = 1, 그리고 마지막으로 max_pooling, pool_size = (3, 3), stride = 2입니다.

세 번째 레이어: 컨볼루션 3, 입력은 두 번째 레이어의 출력, 컨볼루션 커널 수는 384, kernel_size = (3×3×2563 곱하기 3 곱하기 2563×3×256), 패딩 = 1 , 세 번째 레이어는 LRN 및 Pool을 수행하지 않습니다

네 번째 레이어: Convolution 4, 입력은 세 번째 레이어의 출력, 컨볼루션 커널 수는 384, kernel_size = (3×33 x 33×3 ), 패딩 = 1, 세 번째 레이어와 마찬가지로 LRN과 Pool이 없습니다

다섯 번째 레이어: Convolution 5, 입력은 네 번째 레이어의 출력, 컨볼루션 커널 수는 256, kernel_size = (3) ×33 x 33×3), 패딩 = 1. 그런 다음 max_pooling으로 직접 진행, pool_size = (3, 3), stride = 2;

6, 7, 8번째 레이어는 완전 연결 레이어이며 각 레이어의 뉴런 수는 4096개이며 최종 출력 소프트맥스는 위에서 소개한 바와 같이 ImageNet 대회의 카테고리 수는 1,000개이기 때문입니다. RELU와 Dropout은 완전 연결 계층에서 사용됩니다.

위 내용은 Alexnet 네트워크 구조에 대한 자세한 설명의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.