ホームページ > 記事 > テクノロジー周辺機器 > TensorFlow アプリケーション技術の拡張 - 画像分類
機械学習のモデル トレーニングについては、中文大学 MOOC の 2 つのコースなど、TensorFlow の公式コースやリソースをさらに学習することをお勧めします 《TensorFlow 入門実践コース》 および 《TensorFlow 入門コース - デプロイメント》 科学研究や研究に関わるモデルの分散トレーニングの場合、リソース プラットフォームでは非常に時間がかかり、個々のニーズをタイムリーに満たすことができない場合があります。ここでは、前の記事 「TensorFlow フレームワーク学習の予備理解」 で説明した Jiutian Bisheng プラットフォームの使用法を具体的に拡張して、学生やユーザーがモデルをより迅速に実行できるようにします。トレーニング。このプラットフォームは、データ管理やモデルのトレーニングなどのタスクを実行でき、科学研究タスクの便利で高速な練習プラットフォームです。モデル トレーニングの具体的な手順は次のとおりです:
(1) Jiutian Bisheng プラットフォームに登録してログインします。後続のトレーニング タスクではコンピューティング パワー Bean の消費が必要であるため、新規ユーザーのコンピューティング パワー Bean の数は制限されています。 、ただし、友人や他のタスクによって共有して、コンピューティング パワー Bean の取得を完了することができます。同時に、大規模なモデル トレーニング タスクの場合、より多くのモデル トレーニング ストレージ スペースを取得するために、プラットフォームのスタッフに電子メールで連絡してコンソールをアップグレードすることができ、これにより、将来必要となるトレーニング ストレージ要件を満たすことができます。ストレージとコンピューティング能力の詳細は次のとおりです。
(2) データ管理インターフェイスに入り、科学研究プロジェクト モデルで使用されるデータ セットを展開し、科学研究タスクに必要なデータ セット。パッケージ化してアップロードすると、プラットフォームでのモデル トレーニングに必要なデータ セットの展開が完了します。
(3) モデル トレーニング ウィンドウに新しいプロジェクト トレーニング インスタンスを追加し、以前にインポートしたデータ セットと必要な CPU リソースを選択します。作成されたインスタンスは、科学研究用にトレーニングする必要がある単一のモデル ファイルです。新しいプロジェクト インスタンスの詳細は以下のとおりです。
# (4) 新しく追加したプロジェクト インスタンスを実行します。プロジェクト トレーニング環境 、正常に実行された後、jupyter エディターを選択して、必要なコード ファイルを作成および編集できます。 (5) その後のコードの作成とモデルのトレーニングは、jupyter エディターを使用して実行できます。 2. 画像分類技術の拡張画像分類とは、その名のとおり、画像間の違いに基づいて異なる画像のカテゴリを判断することです。画像間の違いに基づいて判別モデルを設計することは、機械学習で習得する必要がある知識です。画像分類の基礎知識や操作プロセスについては、中国大学MOOCの「TensorFlow入門実践講座」を参照することで、TensorFlowの基本的な応用や設計思想を素早く理解することができます。 。https://www.php.cn/link/b977b532403e14d6681a00f78f95506e
この章は主に、画像分類を拡張することで学生にこのコースを紹介することを目的としていますユーザーは画像分類についてより深く理解できるようになります。 2.1 畳み込み演算は何に役立ちますか? 画像を処理または分類する場合、避けて通れない操作が 1 つあります。この操作が畳み込みです。具体的な畳み込み演算は基本的に学習動画で理解できますが、多くの読者は畳み込み演算をどのように実行するかというレベルにしか留まらず、なぜ畳み込みを行うのか、畳み込み演算を何に使うのかがまだ不明瞭な方も多いかもしれません。ここでは、畳み込みをより深く理解するのに役立つ、すべての人向けの拡張機能を示します。 基本的な畳み込みプロセスを次の図に示します。画像を例にとると、画像を表すために行列が使用されます。行列の各要素は、画像内の対応するピクセル値です。 。コンボリューション演算は、コンボリューション カーネルに対応する行列を乗算して、これらの小領域の固有値を取得することです。抽出された特徴は、コンボリューション カーネルが異なると異なるため、画像のさまざまなチャネルでコンボリューション演算を実行して、画像のさまざまなチャネルの特徴を取得し、後続の分類タスクをより適切に実行することになります。毎日のモデル トレーニングでは、特定のコンボリューション カーネルを手動で設計する必要はありませんが、画像の実際のラベルを与えることでネットワークを使用して自動的にトレーニングされます。ただし、このプロセスはコンボリューション カーネルについての人々の理解を助けません。カーネルと畳み込みのプロセスは直感的ではありません。そこで、畳み込み演算の意味を皆さんによく理解していただくために、畳み込み演算の例を示します。以下のマトリックスに示すように、数値はグラフィックのピクセルを表します。計算の便宜上、ここでは 0 と 1 のみを取ります。このマトリックス グラフィックの特徴は、上位の値であることがわかります。グラフィックの半分は明るく、グラフィックの下半分は黒であるため、画像には非常に明確な境界線があり、つまり、明らかな水平特性があります。
したがって、上記の行列の水平方向の特徴を適切に抽出するには、設計されたコンボリューション カーネルも水平方向の特徴抽出の属性を持たなければなりません。垂直特徴抽出属性を使用するコンボリューションカーネルは、特徴抽出の自明性が比較的不十分です。以下に示すように、水平特徴を抽出するコンボリューション カーネルが畳み込みに使用されます。
得られた畳み込み結果の行列から、元のグラフィックスの水平特徴が次のとおりであることがわかります。グラフィックスの色付き部分のピクセル値が深くなり、グラフィックスの水平方向の特徴をうまく抽出して強調表示できるため、グラフィックスの分割線がより明確になります。垂直方向の特徴を抽出するコンボリューションカーネルを使用してコンボリューションを実行した場合:
得られたコンボリューション結果の行列から、元のグラフィックスの水平方向の特徴も抽出できることがわかりますが、2本の分割線が生成されます グラフィックスは、非常に明るい→明るい→黒に変化します 実際のグラフィックスに反映される状況も、明るい→暗い→黒と変化し、本物のオリジナルの水平特性とは異なりますグラフィックスです。
上記の例から、コンボリューション カーネルが異なると最終的に抽出されるグラフィック特徴の品質に影響を与えることが容易にわかりますが、同時に、グラフィックによって反映される特性も異なります。畳み込みカーネルをより良く学習および設計するには、ネットワーク モデルを設計することも特に重要です。実際の地図分類プロジェクトでは、画像の違いに基づいて適切な特徴を選択して抽出する必要があり、多くの場合トレードオフを考慮する必要があります。
前のセクションの畳み込み演算の役割からわかるように、画像に適応する畳み込みカーネルをよりよく学習するためにネットワーク モデルを設計することが特に重要です。ただし、実際のアプリケーションでは、指定された画像カテゴリの実際のラベルをマシンが理解できるベクトル データに変換することによって、自動学習とトレーニングが実行されます。もちろん、手動設定で改善することが完全に不可能というわけではありません。データ セットのラベルは固定されていますが、データ セットの画像タイプに基づいて異なるネットワーク モデルを選択できます。異なるネットワーク モデルの長所と短所を考慮すると、多くの場合、良好なトレーニング結果が得られます。
同時に、画像の特徴を抽出するときに、マルチタスク学習手法を使用することも検討できます。既存の画像データで、その画像データを再度使用して、いくつかの追加の画像特徴 ( (画像のチャネル特徴) や空間特徴など)、以前に抽出された特徴を補足または埋めて、最終的に抽出された画像特徴を改善します。もちろん、この操作により抽出された特徴が冗長になる場合もあり、得られる分類効果が逆効果になることも多いため、実際の学習分類結果に基づいて検討する必要があります。
画像分類の分野は、元の古典的な AlexNet ネットワーク モデルから最近の人気のある ResNet ネットワーク モデルまで、長い間発展してきました。近年、画像分類技術は比較的順調に発展しており、一般的に使用される一部の画像データ セットの分類精度は 100% になる傾向があります。現在、この分野では、ほとんどの人が最新のネットワーク モデルを使用しており、ほとんどの画像分類タスクでは、最新のネットワーク モデルを使用すると確かに明らかな分類効果が得られます。そのため、この分野では多くの人が最新のネットワーク モデルを使用しています。以前のネットワーク モデルを参照し、最新の人気のあるネットワーク モデルを直接学習します。
ここでも、テクノロジーの更新と反復が非常に速く、将来的には最新のネットワーク モデルさえも使用されるため、読者にはグラフ分類の分野におけるいくつかの古典的なネットワーク モデルに慣れておくことをお勧めします。削除される可能性もありますが、基本的なネットワーク モデルの動作原理はほぼ同じです。クラシック ネットワーク モデルをマスターすると、基本原理をマスターできるだけでなく、異なるネットワーク モデル間の違いや、異なるタスクを処理する利点も理解できます。 。 劣等感。たとえば、画像データ セットが比較的小さい場合、最新のネットワーク モデルを使用したトレーニングは非常に複雑で時間がかかる可能性がありますが、改善効果は最小限であるため、無視できる効果のために自分自身のトレーニング時間のコストを犠牲にしても、利益を得る価値はありません。 。したがって、画像分類ネットワーク モデルをマスターするには、将来画像分類モデルを選択するときに真の対象となるように、画像分類ネットワーク モデルが何であるか、またその理由を知る必要があります。
Rice、51CTO コミュニティ編集者は、かつて電子商取引人工知能研究開発センターのビッグデータ テクノロジー部門で推奨アルゴリズムを担当していました。現在は自然言語処理の研究に従事、主な専門分野は推薦アルゴリズム、NLP、CV、使用コーディング言語はJava、Python、Scalaなど。 ICCC 会議論文を 1 件出版しました。
以上がTensorFlow アプリケーション技術の拡張 - 画像分類の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。