ホームページ >テクノロジー周辺機器 >AI >画像認識: 畳み込みニューラル ネットワーク
この記事は WeChat 公開アカウント「情報時代に生きる」から転載したものであり、著者は情報時代に生きています。この記事を転載するには、情報時代の暮らしの公開アカウントまでご連絡ください。
畳み込みニューラル ネットワーク (CNN) は特別なディープ フィードフォワード ネットワークであり、通常、データ入力層、畳み込み層、活性化層、ダウンサンプリング層が含まれます。接続されたレイヤー。
#畳み込み層は畳み込みニューラル ネットワークの重要な単位であり、一連のフィルタリング データで構成されます。コンボリューションカーネルの重み付けは、画像の局所領域とコンボリューションカーネルの重み付けの重み付け和の線形重ね合わせ処理です。画像 I が入力として使用され、2 次元コンボリューション カーネル K がコンボリューションに使用されます。コンボリューション プロセスは次のように表現できます:
このうち、I(i,j) は位置 (i,j) の画像の値、S(i,j) は畳み込み演算後に得られる特徴マップです。
アクティベーション畳み込み演算は線形であり、線形マッピングのみを実行でき、表現能力は限られています。したがって、非線形写像問題に対処するには、非線形活性化関数を導入する必要があります。さまざまな非線形問題に対処するために、導入される活性化関数も異なります。一般的に使用されるのは、sigmoid、tanh、relu などです。
#シグモイド関数の式は次のとおりです:
#ダウンサンプリング層はプーリング層とも呼ばれ、通常はいくつかの畳み込み層の後に配置されます。アイキャッチ画像のサイズを縮小します。プーリング機能は、特定の位置での隣接する出力の全体的な統計特性を使用して、その位置でのネットワークの出力を置き換えます。一般に、プーリング層には 3 つの機能があります: まず、特徴次元を削減します。プーリング操作は別の特徴抽出プロセスと同等であり、冗長な情報を削除し、次の層のデータ処理量を削減できます。 2 つ目は過剰適合を防止することで、プーリング操作によりより抽象的な情報が得られ、一般化が向上します。 3 つ目は、機能の不変性を維持することであり、プーリング操作では最も重要な機能が保持されます。
全結合層は通常、畳み込みニューラル ネットワークの最後に配置され、層間のすべてのニューロンには重み付けされた接続があります。目的は、ネットワークで学習されたすべての特徴をサンプルのラベル空間にマッピングしてカテゴリを判断することです。 Softmax 関数は通常、分類器の出力としてニューラル ネットワークの最後の層で使用され、softmax 関数によって出力される各値の範囲は (0, 1) です。
VGGNet、ResNet、AlexNet など、画像認識の分野で広く使用されている古典的で効率的な CNN モデルがいくつかあります。
以上が画像認識: 畳み込みニューラル ネットワークの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。