首頁  >  文章  >  科技週邊  >  影像辨識:卷積神經網絡

影像辨識:卷積神經網絡

王林
王林轉載
2023-04-29 13:31:061694瀏覽

 本文轉載自微信公眾號「活在資訊時代」,作者活在資訊時代。轉載本文請聯絡活在資訊時代公眾號。

卷積神經網路層(Convolutional Neural Network,CNN)是一種特殊的深層前饋網絡,一般包括資料輸入層、卷積層、活化層、下取樣層和全連接層。

影像辨識:卷積神經網絡

卷積層是卷積神經網路中重要的單元,它的構成是一系列對資料進行濾波的捲積核,其本質就是影像的局部區域與卷積核的權值加權求和的線性疊加過程。影像I作為輸入,使用二維的捲積核K進行卷積,則卷積過程可表示為:

影像辨識:卷積神經網絡

其中,I(i,j)為影像在(i,j)位置的值,S(i,j)為卷積運算後所得到的特徵圖。

啟動卷積運算是線性的,只能進行線性的映射,表達能力有限。因此針對非線性映射問題的處理是,需要引入非線性激活函數。對於處理不同的非線性問題,所引入的活化函數也不同,常用的主要有sigmoid、tanh、relu等。

Sigmoid函數表達式為:

影像辨識:卷積神經網絡


Tanh函數表達式為:

影像辨識:卷積神經網絡


#Relu函數的表達式式為:

影像辨識:卷積神經網絡

下取樣層又叫池化層,一般會放在幾個卷積層之後,來減小特徵圖像的大小。池化函數使用某一位置的相鄰輸出的總體統計特徵來取代網路在該位置的輸出。一般池化層有三個功能:一是降低特徵維度,池化操作相當於又進行了一次特徵提取過程,可以去除冗餘信息,減小下一層的數據處理量。二是為了防止過擬合,池化操作獲得更抽象的訊息,提高泛化性。三是保持特徵不變性,池化操作保留最重要的特徵。

全連接層通常放在卷積神經網路的尾部,層與層之間所有的神經元都有權值連接。目的是將網路中學習到的特徵全部映射到樣本的標記空間,從而進行類別判斷。 Softmax函數通常用在神經網路的最後一層,作為分類器的輸出,softmax函數輸出的每個值的範圍都在(0,1)之間。

有一些經典且有效率的CNN模型,例如:VGGNet、ResNet、AlexNet等,都已廣泛應用於影像辨識領域。

以上是影像辨識:卷積神經網絡的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除