機械学習システムアーキテクチャの 10 の要素-AI-php.cn

ホームページ

テクノロジー周辺機器

機械学習システムアーキテクチャの 10 の要素

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 13, 2023 pm 11:37 PM

システム機械学習建築

今は AI エンパワーメントの時代であり、機械学習は AI を実現するための重要な技術手段です。では、普遍的な機械学習システムアーキテクチャは存在するのでしょうか?

ベテランプログラマの認識範囲内では、特にシステムアーキテクチャに関しては何でもありません。ただし、ほとんどの機械学習駆動システムまたはユースケースに適用できる場合、スケーラブルで信頼性の高い機械学習システムアーキテクチャを構築することは可能です。機械学習のライフサイクルの観点から見ると、このいわゆるユニバーサルアーキテクチャは、機械学習モデルの開発から、トレーニングシステムやサービスシステムの運用環境への展開まで、主要な機械学習段階をカバーします。このような機械学習システムアーキテクチャを 10 要素の次元から記述してみることができます。

機械学習システムアーキテクチャの 10 の要素

1. データおよび特徴エンジニアリングパイプライン

一定時間内に高品質のデータを提供し、スケーラブルかつ柔軟な方法で有用なデータを生成する機械学習機能。一般に、データパイプラインは特徴エンジニアリングパイプラインから分離できます。データパイプラインは、抽出、変換、読み込み (ETL) パイプラインを指します。このパイプラインでは、データエンジニアがオブジェクトストレージ上に構築されたデータレイクなどのストレージ場所にデータを転送する責任を負い、機能エンジニアリングパイプラインは生データをデータに変換することに重点を置いています。機械学習アルゴリズムがより高速かつ正確に学習する機械学習機能に役立ちます。

特徴量エンジニアリングは通常 2 つの段階に分かれています。第 1 段階では、通常、特徴量エンジニアリングロジックは、最適な特徴セットを見つけるために、開発段階でさまざまな実験を通じてデータサイエンティストによって作成されます。一方、データエンジニアまたは機械学習エンジニアは、モデルトレーニング用の特徴量エンジニアリングパイプラインの作成を担当します。環境内の本番サービスは高品質の特徴データを提供します。

2. 特徴ストレージ

機械学習特徴データを保存し、バージョン管理を実行し、検出、共有、再利用に使用され、モデルのトレーニングとサービスに一貫したデータと機械学習機能を提供します。機械学習システムの信頼性を向上させます。

機械学習の特徴データに対して、特徴ストレージは特徴エンジニアリングパイプラインによって作成された永続ストレージソリューションです。特徴ストレージはモデルのトレーニングと提供をサポートします。したがって、これはエンドツーエンドの機械学習システムアーキテクチャの非常に重要な部分であり、重要なコンポーネントです。

3. 機械学習モデルのトレーニングと再トレーニングパイプライン

機械学習トレーニング用のさまざまなパラメーターとハイパーパラメーターを実行し、シンプルで構成可能な方法で実験を実施し、これらのトレーニングを記録しますさまざまなパラメーターとモデルのパフォーマンス指標走る。最もパフォーマンスの高いモデルを自動的に評価、検証、選択し、機械学習モデルライブラリに記録します。

4. トレーニングとモデルのメタストレージ

パラメーター、インジケーター、コード、構成結果、トレーニング済みモデルを含む機械学習操作を保存および記録し、モデルのライフサイクル管理、モデルの注釈、モデルを提供します。発見とモデルの再利用、その他の機能。

エンジニアリング、モデルトレーニング、モデルサービスを特徴とする完全な機械学習システムの場合、データから大量のメタデータを生成できます。これらすべてのメタデータは、システムがどのように動作するかを理解するのに非常に役立ち、データ -> 機能 -> モデル -> サーバーの追跡可能性を提供し、モデルが動作しなくなったときにデバッグに役立つ情報を提供します。

5. 機械学習モデルのサービスパイプライン

フルサービスとレイテンシーの両方を考慮して、実稼働環境で機械学習モデルを使用するための適切なインフラストラクチャを提供します。

一般的に、サービスモードにはバッチサービス、ストリーミングサービス、オンラインサービスの 3 つがあります。サービスの種類ごとに、まったく異なるインフラストラクチャが必要になります。さらに、インフラストラクチャは耐障害性があり、特にビジネスクリティカルな機械学習システムの場合、リクエストやスループットの変動に応じて自動的にスケールする必要があります。

6. 本番環境での ML モデルの監視

本番環境では、データ収集、モニタリング、分析、可視化、およびデータとモデルのドリフトや異常が発見された場合の通知機能を提供し、必要な情報を提供します。システムのデバッグを支援します。

7. 機械学習パイプライン

特定の機械学習ワークフローと比較して、機械学習パイプラインは、データサイエンティストが高品質のコードを維持し、生産時間を短縮しながら、より迅速に開発および反復できるようにする再利用可能なフレームワークを提供します。一部の機械学習パイプラインフレームワークは、オーケストレーション機能とアーキテクチャ抽象化機能も提供します。

8. ワークフローオーケストレーション

ワークフローオーケストレーションは、エンドツーエンドの機械学習システムを統合し、これらすべての主要コンポーネントの依存関係を調整および管理するための重要なコンポーネントです。ワークフローオーケストレーションツールは、ログ、キャッシュ、デバッグ、再試行などの機能も提供します。

9. 継続的インテグレーション/継続的トレーニング/継続的デリバリー (CI/CT/CD)

継続的テストと継続的インテグレーションは、新しいデータを使用して新しいモデルを継続的にトレーニングし、必要に応じてモデルのパフォーマンスをアップグレードすることを指します。継続的に実稼働環境にサービスを提供し、安全かつ俊敏かつ自動化された方法でモデルをデプロイします。

10. データとモデルのエンドツーエンドの品質管理

エンドツーエンドの機械学習ワークフローの各段階で、信頼性の高いデータ品質チェック、モデル品質チェック、データとコンセプトのドリフトが行われます。機械学習システム自体が信頼できるものであることを保証するために、検出機能を組み込む必要があります。これらの品質管理チェックには、記述統計、全体的なデータ形状、欠損データ、重複データ、ほぼ一定の特徴、統計検定、距離メトリック、モデル予測品質などが含まれます。

上記は機械学習システムのアーキテクチャの10要素と言えます。私たちの実践では、全体的なワークフローはほぼ同じままであるはずですが、その一部の要素は微調整およびカスタマイズする必要がある場合があります。

機械学習のシステムアーキテクチャを調整するにはどうすればよいですか?

製品設計の開始時にアーキテクチャ要素を合理化するにはどうすればよいですか?

機械学習システムを導入する際に、元のシステムアーキテクチャの継続性を維持するにはどうすればよいですか?

以上が機械学習システムアーキテクチャの 10 の要素の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

私のコラムに新しいかもしれない人のために、具体化されたAI、AI推論、AIのハイテクブレークスルー、AIの迅速なエンジニアリング、AIのトレーニング、AIのフィールディングなどのトピックなど、全面的なAIの最新の進歩を広く探求します。

ヨーロッパのAI大陸行動計画：GigaFactories、Data Labs、Green AIApr 10, 2025 am 11:21 AM

ヨーロッパの野心的なAI大陸行動計画は、人工知能のグローバルリーダーとしてEUを確立することを目指しています。重要な要素は、AI GigaFactoriesのネットワークの作成であり、それぞれが約100,000の高度なAIチップを収容しています。

Microsoftの簡単なエージェントストーリーは、より多くのファンを作成するのに十分ですか？Apr 10, 2025 am 11:20 AM

AIエージェントアプリケーションに対するMicrosoftの統一アプローチ：企業の明確な勝利新しいAIエージェント機能に関するマイクロソフトの最近の発表は、その明確で統一されたプレゼンテーションに感銘を受けました。 TEで行き詰まった多くのハイテクアナウンスとは異なり

従業員へのAI戦略の販売：Shopify CEOのマニフェストApr 10, 2025 am 11:19 AM

Shopify CEOのTobiLütkeの最近のメモは、AIの能力がすべての従業員にとって基本的な期待であると大胆に宣言し、会社内の重大な文化的変化を示しています。これはつかの間の傾向ではありません。これは、pに統合された新しい運用パラダイムです

IBMは、完全なAI統合でZ17メインフレームを起動しますApr 10, 2025 am 11:18 AM

IBMのZ17メインフレーム：AIを強化した事業運営の統合先月、IBMのニューヨーク本社で、Z17の機能のプレビューを受け取りました。 Z16の成功に基づいて構築（2022年に開始され、持続的な収益の成長の実証

5 chatgptプロンプトは他の人に依存して停止し、自分を完全に信頼するApr 10, 2025 am 11:17 AM

揺るぎない自信のロックを解除し、外部検証の必要性を排除します！これらの5つのCHATGPTプロンプトは、完全な自立と自己認識の変革的な変化に向けて導きます。ブラケットをコピー、貼り付け、カスタマイズするだけです

AIはあなたの心に危険なほど似ていますApr 10, 2025 am 11:16 AM

人工知能のセキュリティおよび研究会社であるAnthropicによる最近の[研究]は、これらの複雑なプロセスについての真実を明らかにし始め、私たち自身の認知領域に不穏に似た複雑さを示しています。自然知能と人工知能は、私たちが思っているよりも似ているかもしれません。内部スヌーピング：人類の解釈可能性研究人類によって行われた研究からの新しい発見は、AIの内部コンピューティングをリバースエンジニアリングすることを目的とする機械的解釈可能性の分野の大きな進歩を表しています。AIが何をするかを観察するだけでなく、人工ニューロンレベルでそれがどのように行うかを理解します。誰かが特定のオブジェクトを見たり、特定のアイデアについて考えたりしたときに、どのニューロンが発射するかを描くことによって脳を理解しようとすることを想像してください。 a

Dragonwingは、QualcommのEdge Momentumを紹介していますApr 10, 2025 am 11:14 AM

Qualcomm's DragonWing：企業とインフラストラクチャへの戦略的な飛躍 Qualcommは、新しいDragonwingブランドで世界的に企業やインフラ市場をターゲットにして、モバイルを超えてリーチを積極的に拡大しています。これは単なるレブランではありません

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン

Dreamweaver Mac版

ビジュアル Web 開発ツール

SublimeText3 英語版

推奨: Win バージョン、コードプロンプトをサポート!

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、