ホームページ >テクノロジー周辺機器 >AI >超強い!深層学習アルゴリズムのトップ 10!
2006 年にディープ ラーニングの概念が提案されてから、ほぼ 20 年が経過しました。ディープ ラーニングは、人工知能分野における革命として、多くの影響力のあるアルゴリズムを生み出してきました。では、ディープラーニングのトップ 10 アルゴリズムは何だと思いますか?
私の考える深層学習の上位アルゴリズムは次のとおりであり、それらはすべてイノベーション、アプリケーションの価値、影響力の点で重要な位置を占めています。
背景: ディープ ニューラル ネットワーク (DNN) は、多層パーセプトロンとも呼ばれます。最も一般的なディープ ラーニング アルゴリズム は、最初に発明されたとき、コンピューティング能力のボトルネックにより批判されましたが、近年のコンピューティング能力とデータの爆発的な増加により、画期的な進歩が見られました。
#DNN は、複数の隠れ層を含むニューラル ネットワーク モデルです。このモデルでは、各層が入力を次の層に渡し、非線形活性化関数を利用して学習の非線形特性を導入します。これらの非線形変換を重ね合わせることで、DNN は入力データの複雑な特徴表現を学習できます。
モデルのトレーニングには、バックプロパゲーション アルゴリズムと勾配降下最適化アルゴリズムを使用して重みを継続的に調整することが含まれます。トレーニング中に、重みに対する損失関数の勾配が計算され、その後、勾配降下法またはその他の最適化アルゴリズムを使用して重みが更新され、損失関数が最小化されます。
利点: 入力データの複雑な特徴を学習し、非線形関係を捉えることができます。強力な特徴学習および表現機能を備えています。
ネットワークの深さが増すと、勾配消失問題が増加し、トレーニングが不安定になります。さらに、モデルは極小値に陥る傾向があり、複雑な初期化戦略と正則化手法が必要になります。
利用シナリオ: 画像分類、音声認識、自然言語処理、レコメンデーションシステムなど。
Python サンプル コード:
import numpy as npfrom keras.models import Sequentialfrom keras.layers import Dense# 10 個の入力特徴量があると仮定し、 3 つの出力カテゴリ input_dim = 10num_classes = 3# DNN モデルの作成 model = Sequential()model.add(Dense(64, activatinotallow='relu', input_shape=(input_dim,)))model.add(Dense(32, activatinotallow= ' relu'))model.add(Dense(num_classes, activatinotallow='softmax'))# モデルをコンパイルし、オプティマイザーと損失関数を選択します。model.compile(optimizer='adam', loss='categorical_crossentropy', metrics=['精度'])# トレーニング データとラベルのサンプルが 100 個あると仮定します。 X_train = np.random.rand(100, input_dim)y_train = np.random.randint(0, 2, size=(100, num_classes))# トレーニング モデルmodel.fit(X_train, y_train, epochs=10)
モデル原理: 畳み込みニューラル ネットワーク (CNN) は、画像データを処理するために特別に設計されたニューラル ネットワークです。 Lechun 氏は CNN の先駆者です。 CNN は、畳み込み層を使用して局所的な特徴をキャプチャし、プーリング層を通じてデータの次元を削減します。畳み込み層は、入力データに対してローカル畳み込み演算を実行し、パラメーター共有メカニズムを使用してモデルのパラメーターの数を減らします。プーリング層は畳み込み層の出力をダウンサンプリングして、データの次元数と計算の複雑さを軽減します。この構造は、画像データの処理に特に適しています。
モデルのトレーニングには、バックプロパゲーション アルゴリズムと勾配降下最適化アルゴリズムを使用して重みを継続的に調整することが含まれます。トレーニング中に、重みに対する損失関数の勾配が計算され、その後、勾配降下法またはその他の最適化アルゴリズムを使用して重みが更新され、損失関数が最小化されます。
利点: 画像データを効果的に処理し、局所的な特徴をキャプチャできます。パラメーターの数が少ないほど、過剰適合のリスクが軽減されます。
欠点: シーケンス データや長距離の依存関係には適さない可能性があります。入力データの複雑な前処理が必要になる場合があります。
使用シナリオ: 画像分類、ターゲット検出、セマンティック セグメンテーションなど。
Python サンプル コード
from keras.models import Sequentialfrom keras.layers import Conv2D, MaxPooling2D, Flatten, Dense#入力画像 64x64 ピクセルで、3 つのカラー チャネルがあります input_shape = (64, 64, 3)# CNN モデルを作成します model = Sequential()model.add(Conv2D(32, (3, 3), activatinotallow='relu', input_shape =input_shape ))model.add(MaxPooling2D((2, 2)))model.add(Conv2D(64, (3, 3), activatinotallow='relu'))model.add(Flatten())model.add( Dense( 128, activatinotallow='relu'))model.add(Dense(num_classes, activatinotallow='softmax'))# モデルをコンパイルし、オプティマイザーと損失関数を選択します。model.compile(optimizer='adam', loss=' categorical_crossentropy', metrics=['accuracy'])# トレーニング データとラベルのサンプルが 100 個あると仮定します。 X_train = np.random.rand(100, *input_shape)y_train = np.random.randint(0, 2, size=( 100, num_classes ))# トレーニング モデル model.fit(X_train, y_train, epochs=10)
ディープラーニングの急速な発展に伴い、ディープ ニューラル ネットワークは多くの分野で目覚ましい成功を収めています。ただし、ディープ ニューラル ネットワークのトレーニングでは、勾配の消失やモデルの劣化などの問題が発生し、ネットワークの深さとパフォーマンスが制限されます。これらの問題を解決するために、残差ネットワーク (ResNet) が提案されました。
モデル原理:
ResNet は、「残留ブロック」を導入することでディープ ニューラル ネットワークの問題を解決します。勾配消失とモデルの劣化の問題。残差ブロックは「スキップ接続」と 1 つ以上の非線形層で構成されており、勾配を後の層から前の層に直接逆伝播できるため、ディープ ニューラル ネットワークのトレーニングを向上させることができます。このようにして、ResNet は非常に深いネットワーク構造を構築し、複数のタスクで優れたパフォーマンスを達成できます。
モデル トレーニング:
ResNet のトレーニングでは、通常、バックプロパゲーション アルゴリズムと最適化アルゴリズム (確率的勾配降下法など) が使用されます。トレーニング プロセス中に、重みに対する損失関数の勾配を計算し、最適化アルゴリズムを使用して重みを更新することにより、損失関数が最小化されます。さらに、トレーニングプロセスを高速化し、モデルの一般化能力を向上させるために、正則化技術、アンサンブル学習などの方法も使用できます。
利点:
欠点:
使用シナリオ:
ResNet には、画像分類、ターゲット検出、顔認識など。さらに、ResNet は自然言語処理、音声認識などの分野でも使用できます。
Python サンプル コード (簡易バージョン):
この簡易バージョンの例では、Keras ライブラリを使用して次のことを行う方法を示します。単純な ResNet モデルを構築します。
from keras.models import Sequentialfrom keras.layers import Conv2D、Add、Activation、BatchNormalization、Shortcutdefresidual_block(input, filters):x = Conv2D(filters=filters, kernel_size=(3) , 3)、padding='same')(input)x = BatchNormalization()(x)x = Activation('relu')(x)x = Conv2D(filters=フィルター、kernel_size=(3, 3)、padding= 'same')(x)x = BatchNormalization()(x)x = Activation('relu')(x)return x
シーケンス データを処理する場合、従来のリカレント ニューラル ネットワーク (RNN) は勾配の消失やモデルの劣化などの問題に直面します。 . により、ネットワークの深さとパフォーマンスが制限されます。これらの問題を解決するために、LSTM が提案されました。
モデル原理:
LSTM は、「ゲート」メカニズムを導入することによって情報の流れを制御します。これにより、勾配の消失とモデルの劣化の問題が解決されます。 LSTM には、入力ゲート、忘却ゲート、出力ゲートという 3 つのゲート メカニズムがあります。入力ゲートは新しい情報の入力を決定し、忘却ゲートは古い情報の忘却を決定し、出力ゲートは最終的な出力情報を決定します。これらのゲート メカニズムを通じて、LSTM は長期的な依存関係の問題に対してより優れたパフォーマンスを発揮できます。
モデル トレーニング:
LSTM のトレーニングでは、通常、逆伝播アルゴリズムと最適化アルゴリズム (確率的勾配降下法など) が使用されます。トレーニング プロセス中に、重みに対する損失関数の勾配を計算し、最適化アルゴリズムを使用して重みを更新することにより、損失関数が最小化されます。さらに、トレーニングプロセスを高速化し、モデルの一般化能力を向上させるために、正則化技術、アンサンブル学習などの方法も使用できます。
利点:
欠点:
使用シナリオ:
LSTM には、テキスト生成などの自然言語処理の分野における幅広いアプリケーション シナリオがあります。 、機械翻訳、音声認識など。また、LSTMは時系列分析やレコメンドシステムなどの分野でも活用できます。
Python サンプル コード (簡易バージョン):
from keras.models import Sequentialfrom keras.layers import LSTM, Densedef lstm_model(input_shape, num_classes ):model = Sequential()model.add(LSTM(units=128, input_shape=input_shape))# LSTM 層を追加します。model.add(Dense(units=num_classes, activatinotallow='softmax'))# 完全に接続された層を追加します。戻りモデル
Word2Vec モデルは、表現学習の 先駆的な研究です。 Google の科学者によって開発された、自然言語処理のための (浅い) ニューラル ネットワーク モデル。 Word2Vec モデルの目標は、各単語を固定サイズのベクトルにベクトル化し、類似した単語を類似したベクトル空間にマッピングできるようにすることです。
モデル原理
Word2Vec モデルはニューラル ネットワークに基づいており、入力単語を使用してその文脈単語を予測します。トレーニング プロセス中に、モデルは、特定のコンテキストに出現する単語がターゲット単語のベクトル表現にできる限り近づくように、各単語のベクトル表現を学習しようとします。このトレーニング方法は「スキップグラム」または「連続バッグ オブ ワード」(CBOW)と呼ばれます。
モデル トレーニング
Word2Vec モデルのトレーニングには大量のテキスト データが必要です。まず、テキスト データが一連の単語または N グラムに前処理されます。次に、ニューラル ネットワークを使用して、これらの単語または N グラムのコンテキストをトレーニングします。トレーニング プロセス中、モデルは予測誤差を最小限に抑えるために単語のベクトル表現を継続的に調整します。
利点
欠点
使用シナリオ
Word2Vec は、テキスト分類、感情分析、情報抽出など、さまざまな自然言語処理タスクで広く使用されています。たとえば、Word2Vec を使用すると、ニュース報道の感情的な傾向 (肯定的または否定的) を特定したり、大量のテキストから重要なエンティティや概念を抽出したりできます。
Python サンプル コード
from gensim.models import Word2Vecfrom nltk.tokenize import word_tokenizefrom nltk.corpus import abcimport nltk# abc corpus nltk.download をダウンロードしてロードします('abc')corpus = abc.sents()# コーパスをセグメント化し、小文字の文に変換 = [[word. lower() for word in word_tokenize(text)] for text in corpus]# Word2Vec モデルをトレーニングする model = Word2Vec(文章、vector_size=100、window=5、min_count=5、workers=4)# 単語「the」のベクトル表現を検索します。 Vector = model.wv['the']# 他の単語との類似度を計算します。 model.wv .similarity('the', 'of')# 類似度の値を出力 print(similarity)
背景:
深層学習の初期段階では、畳み込みニューラル ネットワーク (CNN) が注目に値します。画像認識と自然言語処理の分野で成功を収めています。ただし、タスクの複雑さが増すにつれて、シーケンスツーシーケンス (Seq2Seq) モデルとリカレント ニューラル ネットワーク (RNN) がシーケンス データを処理する一般的な方法になりました。 RNN とそのバリアントは一部のタスクでは良好に実行されますが、長いシーケンスを処理するときに勾配消失やモデルの劣化の問題が発生する傾向があります。これらの問題を解決するために、Transformer モデルが提案されました。 GPTやBertなどの後の大型モデルはすべてTransformerをベースにしており、優れたパフォーマンスを実現しました。
モデルの原理:
Transformer モデルは主に、エンコーダーとデコーダーの 2 つの部分で構成されます。各パーツは複数の同一の「レイヤー」で構成されています。各層には、セルフアテンション サブ層と線形フィードフォワード ニューラル ネットワーク サブ層の 2 つのサブ層が含まれています。セルフ アテンション サブレイヤーは、ドット積アテンション メカニズムを使用して入力シーケンス内の各位置の表現を計算します。一方、線形フィードフォワード ニューラル ネットワーク サブレイヤーは、セルフ アテンション レイヤーの出力を入力として受け取り、出力表現。さらに、エンコーダとデコーダの両方に、入力シーケンス内の位置情報を取得するための位置エンコード層が含まれています。
モデル トレーニング:
Transformer モデルのトレーニングでは、通常、バックプロパゲーション アルゴリズムと最適化アルゴリズム (確率的勾配降下法など) が使用されます。トレーニング プロセス中に、重みに対する損失関数の勾配を計算し、最適化アルゴリズムを使用して重みを更新することにより、損失関数が最小化されます。さらに、トレーニングプロセスを高速化し、モデルの一般化能力を向上させるために、正則化技術、アンサンブル学習などの方法も使用できます。
利点:
欠点:
使用シナリオ:
Transformer モデルには、機械などの自然言語処理の分野における幅広いアプリケーション シナリオがあります。翻訳、テキスト分類、テキスト生成などさらに、Transformer モデルは画像認識、音声認識などの分野でも使用できます。
Python サンプル コード (簡易バージョン):
import torchimport torch.nn を nnimport torch.nn.function as Fclass TransformerModel(nn.Module):def __init__(self, vocab_size, embedding_dim, num_heads, num_layers, dropout_rate=0.5):super(TransformerModel, self) ).__init__()self.embedding = nn.Embedding(vocab_size, embedding_dim)self.transformer = nn.Transformer(d_model=embedding_dim, nhead=num_heads, num_encoder_layers=num_layers, num_decoder_layers=num_layers,dropout=dropout_rate)self.fc = nn .Linear(embedding_dim, vocab_size)def forward(self, src, tgt):embedded = self.embedding(src)output = self.transformer(embedded)output = self.fc(output)return 出力 pip インストール トランスフォーマー
GAN のアイデアは、ゲーム理論におけるゼロサム ゲームに由来しており、1 人のプレーヤーが生成を試みます。他のプレイヤーが本物のデータと偽のデータを区別しようとしている間、最も現実的な偽のデータ。 GAN はモンティ ホール問題 (生成モデルと判別モデルの組み合わせの問題) から発展しましたが、モンティ ホール問題とは異なり、GAN は特定の確率分布の近似や特定のサンプルの生成を重視せず、生成モデルと判別モデルを直接使用します。
モデル原理:
GAN は、ジェネレーター (Generator) とディスクリミネーター (Discriminator) の 2 つの部分で構成されます。 )。ジェネレーターのタスクは偽のデータを生成することですが、ディスクリミネーターのタスクは、入力データが本物のデータセットからのものなのか、それともジェネレーターによって生成された偽のデータなのかを判断することです。トレーニング プロセス中、ジェネレーターとディスクリミネーターが競合し、平衡状態に達するまでパラメーターが常に調整されます。この時点で、ジェネレーターによって生成された偽のデータは、弁別器が本物のデータと偽のデータを区別できないほど現実的です。
モデルのトレーニング:
GAN のトレーニング プロセスは最適化問題です。各トレーニング ステップでは、まず現在のパラメーターに基づくジェネレーターを使用して偽のデータを生成し、次にディスクリミネーターを使用してデータが本物か生成されたかを判断します。そして、この判定結果に基づいて、識別器のパラメータが更新される。同時に、弁別器の過学習を防ぐために、生成された偽のデータが弁別器を欺くことができるように生成器をトレーニングする必要があります。このプロセスは平衡状態に達するまで繰り返されます。
利点:
欠点:
使用シナリオ:
簡単な Python サンプル コード:
以下は、PyTorch を使用して実装された簡単な GAN サンプル コードです。
import torchimport torch.nn as nnimport torch.optim as optimimport torch.nn.Functional as F# ジェネレーターとディスクリミネーターのネットワーク構造クラス Generator(nn.Module):def __init__(self, input_dim, Output_dim) を定義します。 super(Generator, self).__init__()self.model = nn.Sequential(nn.Linear(input_dim, 128),nn.ReLU(),nn.Linear(128, Output_dim),nn.Sigmoid())def forward (self, x):return self.model(x)class Discriminator(nn.Module):def __init__(self, input_dim):super(Discriminator, self).__init__()self.model = nn.Sequential(nn.Linear (input_dim, 128),nn.ReLU(),nn.Linear(128, 1),nn.Sigmoid())def forward(self, x):return self.model(x)# ジェネレーターとディスクリミネーターをインスタンス化する Generator オブジェクト input_dim = 100# 入力次元は実際のニーズに応じて調整できます。 Output_dim = 784# MNIST データセットの場合、出力次元は 28*28=784gen = Generator(input_dim, Output_dim)disc = Discriminator(output_dim)# 損失関数を定義しますおよびオプティマイザー基準 = nn.BCELoss()# バイナリクロスエントロピー損失関数は、GAN の弁別器部分とジェネレーターのロジスティック損失部分に適しています。ただし、一般的により一般的なオプションは、バイナリ クロスエントロピー損失関数 (バイナリ クロス
拡散モデルは深層学習に基づいた生成モデルで、主に画像や音声などの連続データを生成するために使用されます。拡散モデルの中心的な考え方は、ノイズを徐々に追加することで複雑なデータ分布を単純なガウス分布に変換し、次にノイズを徐々に除去することで単純な分布からデータを生成することです。
モデル原理
拡散モデルには、順拡散プロセスと逆拡散プロセスという 2 つの主要なプロセスが含まれています。
順拡散プロセス:
逆拡散プロセス (ノイズ除去プロセスとも呼ばれます):
モデル トレーニング
拡散モデルのトレーニングには通常、次の手順が含まれます:
利点
欠点
使用シナリオ
拡散モデルは、画像生成、音声生成、ビデオ生成など、連続データを生成する必要があるシナリオに適しています。また、モデルはプログレッシブ生成の特性を持っているため、データ補間やスタイル転送などの作業にも使用できます。
Python サンプル コード
以下は、PyTorch ライブラリを使用した拡散モデル トレーニングの簡略化されたサンプル コードです。
import torchimport torch.nn as nnimport torch.optim as optim# 単純な拡散モデル クラスがあるとします。 DiffusionModel(nn.Module):def __init__(self, input_dim, hidden_dim, num_timesteps):super(DiffusionModel , self).__init__()self.num_timesteps = num_timestepsself.noises = nn.ModuleList([nn.Linear(input_dim, hidden_dim),nn.ReLU(),nn.Linear(hidden_dim, input_dim)] for _ in range(num_timesteps ) )def forward(self, x, t):noise_prediction = self.noises[t](x)return noise_prediction# モデル パラメーターを設定します input_dim = 784# 入力が 28x28 グレースケール イメージであると仮定します hidden_dim = 128num_timesteps = 1000# model model = DiffusionModel(input_dim, hidden_dim, num_timesteps)# 損失関数とオプティマイザー基準を定義します = nn.MSELoss()optimizer = optim.Adam(model.parameters(), lr=1e-3)
グラフ ニューラル ネットワーク (略して GNN) は、グラフ構造のデータを処理するために特別に使用される深層学習モデルです。現実世界では、ソーシャル ネットワーク、分子構造、交通ネットワークなど、多くの複雑なシステムをグラフで表すことができます。従来の機械学習モデルは、これらのグラフ構造データを処理する際に多くの課題に直面しますが、グラフ ニューラル ネットワークはこれらの問題を解決するための新しいアイデアを提供します。
モデル原理:
グラフ ニューラル ネットワークの核となるアイデアは、ニューラル ネットワークを通じてグラフ内のノードの特徴表現を学習することです。ノード間の関係を考慮します。具体的には、GNN は近隣情報を繰り返し転送することでノードの表現を更新し、同じコミュニティまたは近いコミュニティ内のノードが同様の表現を持つようにします。各層で、ノードは隣接ノードに関する情報に基づいてその表現を更新し、それによってグラフ内の複雑なパターンをキャプチャします。
モデル トレーニング:
トレーニング グラフ ニューラル ネットワークでは、通常、確率的勾配降下法 (SGD) などの勾配ベースの最適化アルゴリズムが使用されます。トレーニング プロセス中に、損失関数の勾配がバックプロパゲーション アルゴリズムを通じて計算され、ニューラル ネットワークの重みが更新されます。一般的に使用される損失関数には、ノード分類のためのクロスエントロピー損失、リンク予測のためのバイナリクロスエントロピー損失などが含まれます。
利点:
欠点:
利用シナリオ:
簡単な Python サンプル コード:
import torchfrom torch_geometric.datasets import Planetoidfrom torch_geometric.nn import GCNConvfrom torch_geometric.data import DataLoaderimport time# Cora データセットをロードする dataset = Planetoid(root='/tmp/Cora', name='Cora')# 定義 GNNモデルクラス GNN(torch.nn.Module):def __init__(self, in_channels, hidden_channels, out_channels):super(GNN, self).__init__()self.conv1 = GCNConv(in_channels, hidden_channels)self.conv2 = GCNConv( hidden_channels 、out_channels)def forward(self, data):x、edge_index = data.x、data.edge_indexx = self.conv1(x,edge_index)x = F.relu(x)x = F.dropout(x, training= self .training)x = self.conv2(x,edge_index)return F.log_softmax(x, dim=1)# ハイパーパラメータとモデルトレーニングプロセスを定義する num_epochs = 1000lr = 0.01hidden_channels = 16out_channels = dataset.num_classesdata = dataset[0] # を使用します例としてのデータセット内の最初のデータ data model = GNN(dataset.num_features, hidden_channels, out_channels)optimizer = torch.optim.Adam(model.parameters(), lr=lr)data = DataLoader([data],batch_size=1) )# データ セットを DataLoader オブジェクトに変換して、バッチ トレーニングと評価をサポートします。model.train()# モデルをトレーニング モードに設定します。範囲 (num_epochs) のエポック:for data in data:# 各エポックでトラバースします。データ セット全体一度最適化されます optimizer.zero_grad()# 勾配をクリアします out = model(data)# 順方向伝播、出力と損失関数値を計算します loss = F.nll_loss(out[data.train_mask], data.y[data.train_mask ] )# 損失関数値を計算します。ここでは例として負の対数尤度損失関数を使用します。 loss.backward()# 逆伝播、勾配を計算します。optimizer.step()# 重みパラメータを更新します
従来の強化学習アルゴリズムでは、エージェントは Q テーブルを使用して状態アクション値関数の推定値を保存します。ただし、このアプローチは、高次元の状態空間とアクション空間を扱う場合に制限に遭遇します。この問題を解決するために、DQN は、より複雑な問題を処理できるように、状態アクション値関数の近似を学習する深層学習テクノロジを導入した深層強化学習アルゴリズムです。
モデル原理:
DQN は、ニューラル ネットワーク (ディープ Q ネットワークと呼ばれます) を使用して、状態アクション値関数を近似します。このニューラル ネットワークは現在の状態を入力として受け取り、各アクションの Q 値を出力します。トレーニング プロセス中、エージェントは常に環境と対話してニューラル ネットワークの重みを更新し、徐々に最適な Q 値関数に近づきます。
モデル トレーニング:
DQN のトレーニング プロセスには、オフライン段階とオンライン段階の 2 つの段階が含まれます。オフラインフェーズでは、エージェントはエクスペリエンスのバッチ (状態、アクション、報酬、次の状態) をエクスペリエンス再生バッファーからランダムにサンプリングし、これらのエクスペリエンスを使用してディープ Q ネットワークを更新します。オンライン段階では、エージェントは現在の状態とディープ Q ネットワークを使用して最適なアクションを選択して実行し、新しいエクスペリエンスをエクスペリエンス再生バッファーに保存します。
利点:
欠点:
使用シナリオ:
DQN は、囲碁、カード ゲームなど、さまざまなゲーム AI タスクで広く使用されています。その他、ロボット制御、自然言語処理、自動運転などの分野でも活用されています。
pythonimport numpy as npimport tensorflow as tffrom tensorflow.keras.models import Sequentialfrom tensorflow.keras.layers import Dense、Dropoutclass DQN:def __init__(self, state_size, action_size):self.state_size = state_sizeself.action_size = action_sizeself .memory = np.zeros((MEM_CAPACITY, state_size * 2 2))self.gamma = 0.95self.epsilon = 1.0self.epsilon_min = 0.01self.epsilon_decay = 0.995self.learning_rate = 0.005self.model = self.create_model() def create_model(self):model = Sequential()model.add(Dense(24, input_dim=self.state_size,activation='relu'))model.add(Dense(24,activation='relu'))model.add (Dense(self.action_size, activity='linear'))model.compile(loss='mse', optimizer=tf.keras.optimizers.Adam(lr=self.learning_rate))return modeldef remember(self, state, action 、報酬、next_state、done):self.memory[self.memory_counter % MEM_CAPACITY, :] = [状態、アクション、報酬、next_state、done]self.memory_counter = 1def act(self, state):if np.random.rand () ## ###############################
以上が超強い!深層学習アルゴリズムのトップ 10!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。