RNN、LSTM、GRU の概念、違い、長所と短所を調べる-AI-php.cn

ホームページ

テクノロジー周辺機器

RNN、LSTM、GRU の概念、違い、長所と短所を調べる

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jan 22, 2024 pm 07:51 PM

AI機械学習人工ニューラルネットワーク

RNN、LSTM、GRU の概念、違い、長所と短所を調べる

時系列データでは、観測間に依存関係があるため、相互に独立していません。ただし、従来のニューラルネットワークは各観測値を独立したものとして扱うため、時系列データをモデル化するモデルの能力が制限されます。この問題を解決するために、リカレントニューラルネットワーク (RNN) が導入されました。これは、ネットワーク内のデータポイント間の依存関係を確立することにより、時系列データの動的特性をキャプチャするためのメモリの概念を導入しました。反復接続を通じて、RNN は以前の情報を現在の観測値に渡して、将来の値をより適切に予測できます。このため、RNN は時系列データを含むタスクにとって強力なツールになります。

しかし、RNN はどのようにしてこの種の記憶を実現するのでしょうか?

RNN は、ニューラルネットワークのフィードバックループを通じて記憶を実現します。これが、RNN と従来のニューラルネットワークの主な違いです。フィードバックループでは層内で情報を渡すことができますが、フィードフォワードニューラルネットワークでは層間でのみ情報が渡されます。したがって、さまざまな種類の RNN があります。

リカレントニューラルネットワーク (RNN)
長短期記憶ネットワーク (LSTM)
Gate Controlled Recurrent Unit Network (GRU)

この記事では、RNN、LSTM、GRU の概念、類似点と相違点、およびそれらの長所と短所のいくつかを紹介します。。

リカレントニューラルネットワーク (RNN)

フィードバックループを通じて、RNN ユニットの出力は同じユニットによる入力としても使用されます。。したがって、すべての RNN には過去と現在という 2 つの入力があります。過去の情報を使用すると、短期記憶が作成されます。

よりよく理解するために、RNN ユニットのフィードバックループを拡張できます。拡張されたセルの長さは、入力シーケンスのタイムステップ数と等しくなります。

過去の観測が、展開されたネットワークを介して隠れ状態としてどのように渡されるかを確認できます。各セルでは、現在のタイムステップからの入力、前のタイムステップからの隠れ状態、およびバイアスが結合され、アクティブ化関数によって制約されて、現在のタイムステップでの隠れ状態が決定されます。

RNN は、1 対 1、1 対多、多対 1、および多対多の予測に使用できます。

RNN の利点

RNN は、その短期記憶により、連続データを処理し、履歴データのパターンを識別できます。さらに、RNN はさまざまな長さの入力を処理できます。

RNN の欠点

RNN には、勾配降下消失の問題があります。この場合、バックプロパゲーション中に重みを更新するために使用される勾配は非常に小さくなります。ゼロに近い勾配で重みを乗算すると、ネットワークが新しい重みを学習できなくなります。学習を停止すると、RNN は長いシーケンスで見たことを忘れてしまいます。消失勾配降下の問題は、ネットワーク層の数に応じて増加します。

RNN は最新の情報のみを保持するため、過去の観測を考慮する場合、モデルには問題があります。したがって、RNN には短期記憶のみがあり、長期記憶はありません。

さらに、RNN はバックプロパゲーションを使用して重みを時間内に更新するため、ネットワークも勾配爆発の影響を受けます。また、ReLu 活性化関数が使用されている場合は、デッド ReLu の影響を受けます。単位。前者は収束の問題を引き起こす可能性があり、後者は学習の停止を引き起こす可能性があります。

Long Short-Term Memory (LSTM)

LSTM は、RNN における勾配消失の問題を解決する特別なタイプの RNN です。

LSTM の鍵となるのはセルの状態であり、セルの入力から出力に渡されます。セル状態では、3 つのゲートを通る小さな直線アクションだけで、情報がチェーン全体に沿って流れることができます。したがって、セル状態は LSTM の長期メモリを表します。これら 3 つのゲートは、それぞれフォーゲットゲート、入力ゲート、出力ゲートと呼ばれます。これらのゲートはフィルターとして機能し、情報の流れを制御し、どの情報を保持するか無視するかを決定します。

忘却の門は、どれだけの長期記憶を保持すべきかを決定します。この目的のために、シグモイド関数を使用してセル状態の重要性を考慮します。出力は 0 と 1 の間で変化し、0 は情報を保持せず、1 はセル状態に関するすべての情報を保持します。

入力ゲートは、セルの状態、つまり長期記憶にどのような情報を追加するかを決定します。

#出力ゲートは、セル状態のどの部分が出力を構築するかを決定します。したがって、出力ゲートは短期記憶を担当します。

一般に、状態は忘却ゲートと入力ゲートを通じて更新されます。

LSTM の利点

LSTM の利点は RNN と似ており、主な利点は長期と短期の両方をキャプチャできることです。 -term シーケンスのパターン。したがって、これらは最も一般的に使用される RNN です。

LSTM の欠点

LSTM は構造がより複雑であるため、計算コストが高くなり、トレーニング時間が長くなります。

LSTM は重みを更新するために時間逆伝播アルゴリズムも使用するため、LSTM にはデッド ReLu ユニット、勾配爆発などの逆伝播の欠点があります。

ゲート型再帰ユニット (GRU)

LSTM と同様に、GRU は単純な RNN の勾配消失問題を解決します。ただし、LSTM との違いは、GRU では使用するゲートの数が少なく、別個の内部メモリ (セル状態) を持たないことです。したがって、GRU はメモリとして隠れた状態に完全に依存しており、アーキテクチャがより単純になります。

リセットゲートは、どれだけの過去の情報を保持し無視するかを決定するため、短期記憶を担当します。

更新ゲートは長期記憶を担当し、LSTM の忘却ゲートに相当します。

現在のタイムステップの隠れ状態は 2 つのステップに基づいて決定されます。

最初に、隠れ状態の候補を決定します。候補状態は、現在の入力と前のタイムステップの隠れ状態、および活性化関数の組み合わせです。候補隠れ状態に対する前の隠れ状態の影響は、リセットゲートによって制御されます。

2 番目のステップでは、候補の隠れ状態と前のタイムステップの隠れ状態を組み合わせて、現在の隠れ状態を生成します。以前の隠れ状態と候補の隠れ状態がどのように組み合わされるかは、更新ゲートによって決定されます。

更新ゲートによって与えられた値が 0 の場合、前の隠れ状態は完全に無視され、現在の隠れ状態は候補の隠れ状態と同じになります。更新ゲートの値が 1 の場合は、その逆が当てはまります。

GRU の利点

GRU は、LSTM に比べてアーキテクチャがシンプルであるため、計算効率が高く、トレーニング速度が速く、必要なメモリが少ないだけです。。

さらに、GRU は小規模なシーケンスに対してより効果的であることが示されています。

GRU の欠点

GRU には個別の隠れ状態とセル状態がないため、 LSTM のような過去の観察が考慮されない可能性があります。

RNN や LSTM と同様に、GRU もバックプロパゲーションと重みのタイムリーな更新の欠点、つまりデッド ReLu ユニットと勾配爆発に悩まされる可能性があります。

以上がRNN、LSTM、GRU の概念、違い、長所と短所を調べるの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は网易伏羲で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

外挿の包括的なガイドApr 15, 2025 am 11:38 AM

導入数週間で作物の進行を毎日観察する農民がいるとします。彼は成長率を見て、さらに数週間で彼の植物がどれほど背が高くなるかについて熟考し始めます。 thから

ソフトAIの台頭とそれが今日のビジネスにとって何を意味するかApr 15, 2025 am 11:36 AM

ソフトAIは、おおよその推論、パターン認識、柔軟な意思決定を使用して特定の狭いタスクを実行するように設計されたAIシステムとして定義されていますが、曖昧さを受け入れることにより、人間のような思考を模倣しようとします。しかし、これはBusineにとって何を意味しますか

AIフロンティア向けの進化するセキュリティフレームワークApr 15, 2025 am 11:34 AM

答えは明確です。クラウドコンピューティングには、クラウドネイティブセキュリティツールへの移行が必要であるため、AIはAIの独自のニーズに特化した新しい種類のセキュリティソリューションを要求します。クラウドコンピューティングとセキュリティレッスンの台頭で

3つの方法生成AIは起業家を増幅します：平均に注意してください！Apr 15, 2025 am 11:33 AM

起業家とAIと生成AIを使用して、ビジネスを改善します。同時に、すべてのテクノロジーと同様に、生成的AIが増幅器であることを覚えておくことが重要です。厳密な2024年の研究o

Andrew Ngによる埋め込みモデルに関する新しいショートコースApr 15, 2025 am 11:32 AM

埋め込みモデルのパワーのロックを解除する：Andrew Ngの新しいコースに深く飛び込むマシンがあなたの質問を完全に正確に理解し、応答する未来を想像してください。これはサイエンスフィクションではありません。 AIの進歩のおかげで、それはRになりつつあります

大規模な言語モデル（LLMS）の幻覚は避けられませんか？Apr 15, 2025 am 11:31 AM

大規模な言語モデル（LLM）と幻覚の避けられない問題 ChatGpt、Claude、GeminiなどのAIモデルを使用した可能性があります。これらはすべて、大規模なテキストデータセットでトレーニングされた大規模な言語モデル（LLMS）、強力なAIシステムの例です。

60％の問題 - AI検索がトラフィックを排出する方法Apr 15, 2025 am 11:28 AM

最近の研究では、AIの概要により、産業と検索の種類に基づいて、オーガニックトラフィックがなんと15〜64％減少する可能性があることが示されています。この根本的な変化により、マーケティング担当者はデジタルの可視性に関する戦略全体を再考することになっています。新しい

AI R＆Dの中心に人間が繁栄するようにするMITメディアラボApr 15, 2025 am 11:26 AM

Elon UniversityがDigital Future Centerを想像している最近のレポートは、300人近くのグローバルテクノロジーの専門家を調査しました。結果のレポート「2035年に人間である」は、ほとんどがTを超えるAIシステムの採用を深めることを懸念していると結論付けました。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。