ホームページ >よくある問題 >人工知能の解釈: トレーニングと推論の主要な段階

人工知能の解釈: トレーニングと推論の主要な段階

百草
百草オリジナル
2024-04-11 15:57:45828ブラウズ

人工知能 (AI)、機械学習、生成 AI は、現代のエンタープライズ テクノロジー ツールボックスの重要な部分になっています。 AI は、リアルタイム言語翻訳、顔認識、音声アシスタント、パーソナライズされた推奨システム、不正行為検出など、幅広いテクノロジーをカバーしています。 AI のトレーニングと推論のプロセスは、モデルの機能を理解するために重要です。トレーニングには、データセットを使用してモデルをトレーニングすることが含まれ、モデルが処理された情報から学習して予測や決定を行えるようにします。推論フェーズでは、トレーニングされたモデルを新しいデータに適用し、画像認識、言語翻訳、意思決定などのタスクを実行できるようにします。

人工知能の解釈: トレーニングと推論の主要な段階

人工知能、機械学習、そして最近では生成人工知能は、現在、デジタル イノベーションに取り組むすべての企業のテクノロジーおよび方法論的ツールキットの一部となっています。人工知能には、リアルタイムの言語翻訳、顔認識、音声アシスタント、パーソナライズされた推奨システムや不正行為の検出、病気を特定するためのコンピューター支援医療診断など、通常は人間の知能を必要とするタスクを実行できる幅広いテクノロジーが含まれます。放射線画像から。

モデル (*) の機能をより深く理解するために、AI のトレーニングと推論のプロセスについて説明しましょう。 AI トレーニングの図

注: (*) の付いた用語は、この記事の最後にある用語集セクションで定義されています。

人工知能トレーニング

要するに、人工知能トレーニングは、大量のテストデータに基づいて機械学習モデルを開発するプロセスです。

これには、モデルが学習し、処理する情報に基づいて予測 (*) または決定 (*) できるようにするデータセット (*) をモデルに供給することが含まれます。これは、モデルが特定のタスクを実行するために必要な知識とスキルを習得する段階です。

自然言語 (*) を解釈する場合でも、複雑な計算を実行する場合でも、このステップは基礎となります。実際、モデルの精度、効率、全体的なパフォーマンス、ひいてはそれを使用するアプリケーションが決まります。

AI モデルのトレーニング プロセスにはいくつかのステップが含まれます。

1. データの準備

このステップには、効果的に使用できる形式でデータを収集、クリーニング、整理することが含まれます。モデル入力データの品質と信頼性を確保することが重要です。

2. アルゴリズム

2 番目のステップでは、目的の問題を解決するのに最適な適切なアルゴリズム (*) またはニューラル ネットワーク (*) アーキテクチャを選択します。解決する。

3. 絞り込み

モデルを選択したら、3 番目のステップは反復的な絞り込みです。これには、モデルのトレーニングとテストを複数回行って、パフォーマンスに基づいてパラメーターを調整し、精度を向上させ、エラーを減らすことが含まれます。

AI トレーニング クラスの図の画像

人工知能トレーニング: 課題

人工知能モデルのトレーニングは、次のような大きな課題に直面しています。 :

データ品質

モデルの品質はトレーニング データの品質に依存します。不正確、不完全、または偏ったデータセットは、精度の低い予測につながる可能性があります。

情報技術リソース

トレーニングに必要なコンピューティング リソースには、特に深層学習ネットワーク (*) などの複雑なモデルの場合、高い処理能力と大量のメモリが必要です。過学習 (*) などの現象により、予測タスクや分類タスクの品質が低下する可能性があります。

AI モデルのトレーニングに必要な計算リソースを説明するには、GPT-3 のような複雑な深層学習ネットワークをトレーニングするには、1,750 億のパラメーターを組み込むために大量の計算能力が必要であることを考えてみましょう。

人工知能推論

この段階では、トレーニングされた機械学習 (*) モデルが新しいデータに適用され、予測、分類、推奨、または現実世界のアプリケーションでの意思決定などのタスク。

言い換えれば、推論は、画像内のオブジェクトの識別、言語の翻訳、製品の推奨の提供、自動運転車の誘導など、AI モデルが意図した利点を提供できるようにする段階です。

トレーニングと推論を区別する

推論プロセスと人工知能トレーニングを区別するには、主に 2 つの基準があります:

データのリアルタイム処理の重要性

効率性と低遅延の必要性

実際には、自動運転またはリアルタイムの不正検出システムには、新しいデータを迅速に解釈できるモデルが必要ですそしてすぐに行動を起こしてください。

克服すべき課題

推論フェーズでは、リソース効率に重点を置き、さまざまな環境にわたって一貫したパフォーマンスを維持し、速度の点でモデルを最適化する必要があります。 AI モデルは、精度や信頼性を犠牲にすることなく適応可能である必要があります。これには、モデルのパフォーマンスの低下を避けながら計算負荷を軽減する、モデル プルーニング (*) や量子化 (*) などの手法が必要です。

#例

推論の実際の応用例を示す具体的な例は次のとおりです。

サイバー セキュリティ

承認されると、電子メールのやりとりの大規模なデータセットでトレーニングされたアプリケーションは、受信電子メール内の潜在的なスパムやフィッシングの試みを識別してフラグを立て、サイバーセキュリティの脅威からユーザーを保護します。

自動運転車

同様に、自動運転車の分野も人工知能の推論能力に大きく依存しています。この場合、数え切れないほどの運転データからトレーニングされたモデルがリアルタイムで使用され、道路を移動し、交通標識を認識し、瞬時の意思決定を行います。

トレーニングと推論: 比較分析

トレーニングと推論は、人工知能モデル開発における 2 つの重要かつ補完的な段階であり、それぞれ特定のニーズを満たします。トレーニング フェーズでは、モデルが履歴データから知識を取得できるようになります。このステップでは、正確な予測を達成するためにモデルのパラメーターを調整するために多くの計算能力が必要です。

一方、推論は、トレーニングされたモデルを新しいデータに適用して、リアルタイムで予測や意思決定を行い、効率と低遅延の重要性を強調します。

留意事項

人工知能システムの開発には、モデルの複雑さ、包括的なトレーニング、推論効率のバランスをとることが重要です。

複雑なモデルはより良い理解と予測を提供しますが、トレーニングと推論により多くのリソースが必要になります。

開発者は、リアルタイムでの使用に十分な複雑さ、正確さ、効率性を備えたモデルを作成する必要があります。

枝刈り、量子化、転移学習などの手法を使用すると、精度と効率の観点からモデルを最適化できます。

インフラストラクチャ要件

トレーニングおよび推論フェーズのインフラストラクチャ要件は、ハードウェアのパフォーマンスに大きく依存することになります。

ディープ ラーニング モデルのトレーニングは非常に大量の計算を必要とし、強力なコンピューティング機能を提供するには専用のリソースが必要です。この段階では、モデルの精度と効率が左右される大規模なデータセットを管理するために高性能 GPU が必要になることがよくあります。

対照的に、推論フェーズでは必要な計算能力は低くなりますが、低遅延、高スループットのパフォーマンスが必要です。そのインフラストラクチャには、自動運転車や電子メール サーバーなどのデータ生成源に近いリアルタイム データ処理を可能にする効率と応答性が必要ですが、同時に医療診断における新しい例も導入されています。

結論

AI のトレーニングと推論の微妙な点を理解すると、AI モデルを通じて知識を取得することと、その知識を具体的なアプリケーションに展開することの間の複雑さが明らかになります。

人工知能は強力であるだけでなく、適応性も必要です。この目標を達成するには、広範なトレーニング リソースの使用と、高速で効率的な推論の必要性との間でバランスをとる必要があります。ヘルスケア、金融、産業などの分野で AI が進歩するにつれて、特定のビジネス ケースに適用される AI の作成が可能になるため、これらのトレーニングと推論の段階が重要になります。

もう 1 つ...

二酸化炭素排出量についてはどうですか?

機械学習と人工知能を進歩させるには、より効率的な人工知能モデルの開発、ハードウェア インフラストラクチャの最適化、革新的な戦略の幅広い採用に重点を置く必要があることは明らかです。同時に、おそらく AI のエコロジカル フットプリントも考慮する必要があります。

「将来の人工知能にはエネルギーのブレークスルーが必要であり、人々の予想よりもはるかに多くの電力を消費するでしょう。」

-Sam Altman 氏、OpenAI

DAVOS (スイス) CEO。 2024 年 1 月 16 日

確かに、人工知能モデルのトレーニングによる環境への影響が精査されるにつれ、持続可能性が重要な問題となっています。企業や一般大衆がそれを採用するにつれて、テクノロジー巨人のデバイスプラットフォームに電力を供給し冷却するために、より多くの電力と膨大な量の水が必要になるだろう。たとえば、研究者らは、GPT-3の製造では1,287メガワット時の電力を消費し、123台のガソリン乗用車を1年間運転するのに相当する552トンの二酸化炭素を生成したと推定している。

技術の進歩と環境への責任が調和して共存する、より持続可能な未来の実現に努めることが、人工知能の進化の最終目標となる可能性があります。

(*) 用語集

  • アルゴリズム: 特定のタスクを実行したり、特定の問題を解決したりするために設計された、定義された段階的な計算手順またはルールのセット

  • データセット: データ ポイントまたはレコードのコレクション。通常は表形式で、教師あり学習の特徴 (独立変数) やラベルなど、機械学習モデルのトレーニング、テスト、検証に使用されます。 (従属変数または結果)。

  • 決定: 機械学習では、これは、スパム フィルターが電子メールをスパムと判断し、スパム メールに移動するなど、データ分析後にモデルが到達する結論を指します。フォルダー)、スパムではない(受信箱に残しておきます)。

  • ディープ ラーニング: 大量のデータから複雑なパターンと表現を自動的に学習できる、多層ニューラル ネットワークと呼ばれるモデルを含む機械学習のサブセットです。

  • ラベル付きデータ: これは、各インスタンスが結果またはカテゴリでラベル付けされているデータセットを指し、トレーニング プロセス中に機械学習モデルに明確なガイダンスを提供します。

  • #機械学習: 特定のタスクごとに明示的にプログラムすることなく、パターンを認識し、データに基づいて意思決定を行うアルゴリズムのトレーニングを含む人工知能の分野

  • モデル: データセット上でトレーニングされた数学的および計算的表現。トレーニング データ内のパターンと関係を学習することで、まだ見たことのない新しいデータを予測および分類できます。

  • モデル プルーニング: における手法トレーニング中にパラメータを適応的にプルーニングして、モデルに大きな影響を与えることなくクライアント デバイスの計算量と通信の需要を削減することでモデルのサイズを削減するフェデレーテッド ラーニング。話し言葉か書き言葉かにかかわらず、人間の言語表現に固有の複雑さ、ニュアンス、規則を含む相互コミュニケーション
  • ニューラル ネットワーク: 人間の脳の構造にヒントを得たコンピューティング モデル。相互接続されたノードまたはニューロンで構成され、信号を処理して送信し、データから学習することで複雑なタスク (パターン認識や意思決定など) を解決します。

  • #過学習: 機械学習モデルがトレーニング データを厳密に学習しすぎると、目に見えないデータの結果を一般化して正確に予測できなくなります

  • パターン: (機械学習のコンテキストにおいて) モデルは、新しい未知のデータに関する予測や意思決定に使用できる、データ内の識別可能なパターンを識別する方法を学習します

  • 予測: (機械学習において) ) トレーニングされたモデルを使用して、トレーニング段階で学習したパターンに基づいて、新しい未確認のインスタンスの最も可能性の高い結果または値を推定するプロセス

  • # 量子化: (深層学習で)モデル内の重みとアクティベーションの精度を 2、3、または 4 桁に下げるプロセス。これにより、モデルが正確でありながら推論時により効率的に実行できるようになります。性的損失が最小限に抑えられます。

  • 教師あり/教師なし: 教師あり学習と教師なし学習の違いは、教師あり学習トレーニングには、入力から出力までのマッピングを学習するようにモデルを導くラベル付きデータ (*) があることです。一方、教師なし学習には、結果に明示的なラベルを付けずにデータ内のパターンや構造を見つけることが含まれます。

以上が人工知能の解釈: トレーニングと推論の主要な段階の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。