이 글은 위챗 공개 계정 '정보화 시대에 살기'에서 재출판되었습니다. 이 기사를 재인쇄하려면 Living in the Information Age 공개 계정에 문의하세요.
CNN(Convolutional Neural Network)은 일반적으로 데이터 입력 계층, 컨볼루션 계층, 활성화 계층, 다운샘플링 계층 및 완전 연결 계층을 포함하는 특수 심층 피드포워드 네트워크입니다.
콘볼루션 레이어는 데이터를 필터링하는 일련의 콘볼루션 커널로 구성됩니다. 값 가중 합산의 선형 중첩 프로세스. 이미지 I는 입력으로 사용되고, 2차원 컨볼루션 커널 K는 컨볼루션에 사용됩니다:
여기서 I(i,j)는 이미지입니다. (i,j) 위치 값 S(i,j)는 컨볼루션 작업 후 얻은 특징 맵입니다.
활성화 컨볼루션 연산은 선형이며 제한된 표현 능력으로 선형 매핑만 수행할 수 있습니다. 따라서 비선형 매핑 문제를 해결하려면 비선형 활성화 함수를 도입해야 합니다. 다양한 비선형 문제를 처리하기 위해 도입된 활성화 함수도 다릅니다. 일반적으로 사용되는 함수는 sigmoid, tanh, relu 등입니다.
시그모이드 함수 표현식:
Tanh 함수 표현식:
Relu 함수의 표현은 다음과 같습니다:
다운샘플링 레이어는 풀링 레이어라고도 하며, 일반적으로 피처 이미지의 크기를 줄이기 위해 여러 컨볼루셔널 레이어 뒤에 배치됩니다. 풀링 기능은 특정 위치에서 주변 출력의 전반적인 통계적 특성을 사용하여 해당 위치의 네트워크 출력을 대체합니다. 일반적으로 풀링 계층에는 세 가지 기능이 있습니다. 첫째, 특징 차원을 줄입니다. 풀링 작업은 중복된 정보를 제거하고 다음 계층의 데이터 처리량을 줄일 수 있는 다른 특징 추출 프로세스와 동일합니다. 둘째, 과적합을 방지하기 위해 풀링 연산은 보다 추상적인 정보를 획득하고 일반화를 향상시킵니다. 세 번째는 특성 불변성을 유지하는 것이며 풀링 작업은 가장 중요한 특성을 유지합니다.
완전 연결 레이어는 일반적으로 컨벌루션 신경망의 끝에 배치되며 레이어 사이의 모든 뉴런은 가중치로 연결됩니다. 목적은 네트워크에서 학습된 모든 기능을 샘플의 레이블 공간에 매핑하여 카테고리 판단을 내리는 것입니다. Softmax 함수는 일반적으로 신경망의 마지막 계층에서 분류기의 출력으로 사용됩니다. Softmax 함수에 의해 출력되는 각 값의 범위는 (0, 1)입니다.
이미지 인식 분야에서 널리 사용되는 VGGNet, ResNet, AlexNet 등과 같은 몇 가지 고전적이고 효율적인 CNN 모델이 있습니다.
위 내용은 이미지 인식: 컨볼루셔널 신경망의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!