ホームページ  >  記事  >  テクノロジー周辺機器  >  AI エージェントがエンタープライズ レベルの設計についてどのように考えるか

AI エージェントがエンタープライズ レベルの設計についてどのように考えるか

WBOY
WBOY転載
2024-01-15 20:39:051137ブラウズ

今年大規模モデルが爆発的に増加した後、現在の人工知能技術はまだ第 2 世代システムの段階にあり、汎用人工知能 (AGI) のレベルにはまだ達していません。ただし、一部の分野ではすでに AI エージェントを使用して処理できます。典型的な B エンド アプリケーションとして、ビジネス ニーズを満たす AI エージェントを設計するにはどうすればよいでしょうか?

人工知能の急速な発展に伴い、さまざまな高度な大規模モデル、製品、ツールが次々と登場しています。 B エンドのプロダクト マネージャーとして、企業の効率が業界の発展に遅れをとらないように、この革新的な人工知能テクノロジーを積極的に採用し、自社のビジネスに適用する必要があります。

一般的に言えば、企業が独自に大規模モデルを開発していない場合、企業自体に適した AI 製品やツールを構築するための AI 機能を開発するには、サードパーティの大規模モデル機能に依存する必要があります。

下の図に示すように、一般的な大規模モデルの方向には、自然言語処理 (NLP)、マルチモーダル (マルチモーダル)、および音声認識が含まれます。大手模型メーカーは、特定の方向の能力に基づいて AI トレーニングを実施し、特定の分野で「反復可能な」および「標準化可能な」タスクにおいて AI が人間に取って代わることを可能にします。

浅谈AI Agent在B端的设计思路

画像はOpen Privacy Computingの「Battle of 100 Models!」より引用!どの大規模 AI モデルが好みですか? 》

当社のビジネスに必要な AI 機能を決定するには、対応する AI モデルの調査を実施し、大規模なモデルの出力機能を評価する必要があります。大規模モデルを再現率、精度、セキュリティ、解釈可能性、安定性、コスト、開発の可能性などの複数の側面から評価して、最終的にニーズに合った大規模モデルを選択できます。このトピックについては、以前の記事で自分に合った大型モデルを選択する方法について詳しく説明しました。

しかし、現在のAI技術はまだ第2世代システムの段階にあり、まだAGIのレベルには達していません。現在アクセス可能な大規模モデルには、主に次のような問題がまだいくつかあります。

1. AI の幻想:

AI の錯覚とは、知識記憶、理解能力、トレーニング方法、モデル技術における人工知能の限界を指し、出力結果の不正確または信頼性の低いパフォーマンスにつながります。一般的な問題には、データの偏りや解釈のしやすさが含まれます

AI幻想の存在により、AIが安定して信頼できる解を出力できると期待したとしても、一定の割合で誤答が存在することになります。たとえば、ある分野で AI の精度が 50% だった場合、50 問中 25 件の誤答が発生します。高い精度が求められるビジネスには、AIをそのまま適用することはできません。

2. コンプライアンスに関する質問への回答

AIの本質は統計に基づいた結果の予測であり、善悪を判断する明確な能力に欠けています。したがって、倫理的、法的、その他の問題に関しては、AI は正確な判断や区別を行うことができず、企業に悪影響を与える可能性があります

3. 十分ネイティブではありません:

現在、人工知能の対話方法は主に入出力を介しています。ユーザーがコンテンツを入力し、人工知能が結果を出力します。ただし、このプロセスはすべてのビジネス担当者の使用習慣に適合するわけではありません。

翻訳シナリオを例に挙げると、翻訳者のビジネス プロセスには通常、次の手順が含まれます。

翻訳ニーズの決定: 原文言語、訳文言語、翻訳スタイル、地域ごとの文化の違い、調整計画などを確認します。

バッチ翻訳: 通常、翻訳タスクには複数のコンテンツが含まれており、翻訳者はバッチで同時に処理を完了する必要があります。
  1. 校正: 翻訳が完了したら、ビジネス ニーズを満たしているかどうかを判断するために校正者による校正が必要です。
  2. 修正: 翻訳結果が要件を満たしていない場合は、修正が必要です。改訂完了後、改訂が承認されるまで翻訳、校正、改訂のプロセスを続けます。
  3. 配信: 校正したコンテンツをビジネスに適用します。
  4. しかし、人件費を節約するために AI を翻訳に使用したい場合、大規模な言語モデルの対話入力対話方式を直接使用すると、次のような問題が発生します。
  5. 1) 既存のワークフローを中断し、使用習慣を身に付けるのを困難にします:
大きな言語モデルのダイアログ ウィンドウを使用すると、元の翻訳作業のビジネス プロセスが中断されます。当初は、翻訳ツールまたはドキュメント上で作業を完了するだけで済みましたが、大規模モデルのダイアログに参加した後は、各翻訳テキストを入力ボックスに入力する必要があります。

2) 運営コスト増加の上限:

大規模な言語モデルでは会話の長さに制限があり、翻訳内容が大規模な場合、対話をバッチで行う必要があり、人件費が増加します。

3) 特殊な翻訳ニーズを満たすための運用コストの増加:

用語の翻訳や指定された翻訳スタイルなど、特定の翻訳ニーズがある場合は、毎回やり取りが必要となり、さらに人手がかかります。

上記の問題により、AI がビジネス翻訳の効率を効果的に向上させることができなくなります。ユーザーは操作が煩雑なため利用習慣がつきにくく、AIを使うよりも自分で直接翻訳したほうが良いと無意識に考えることが多く、リプレイスコストが高くなってしまいます。

また、AI翻訳には錯覚の問題があり、期待を超えるユーザーエクスペリエンスを提供することはできません。

したがって、[(新しいエクスペリエンス - 古いエクスペリエンス) - 代替コスト] は 0 を超えません。AI のネイティブ インタラクション手法を直接使用しても、ビジネス率を効果的に向上させることはできないため、さらにいくつかのネイティブな手法が必要です。道。

浅谈AI Agent在B端的设计思路

1. AI エージェントとは

人工知能が直面している現在の課題を考慮すると、B 側で独自のアプリケーションを構築する方法を考える必要があります。考えられる 1 つの方法は、ビジネス向けにカスタマイズされた AI エージェント

を構築してみることです。

いわゆる AI エージェント (人工知能エージェントとも呼ばれる) は、タスクを理解し、学習し、実行できる自動化されたプログラムを指します。これは、「AI をインターンとして扱い、些細なタスクを AI に引き受けさせる一方で、私たちはこのインターンを指導して、その出力が期待される結果を確実に満たすようにする責任がある」と例えることもできます。

大規模なモデルとは異なり、AI エージェントの対話方法は人々とのプロンプトに限定されません。具体的な業務目標をもとに、ニーズに応じた成果を出力するシステムです。 AI エージェントのコアは大規模なモデルであり、認識モジュール、計画モジュール、アクション モジュールの拡張機能も含まれています

浅谈AI Agent在B端的设计思路

  1. 知覚モジュール: 知覚モジュールは、ビジネス データ ソースおよび外部データ ソースとの接続を通じて、データを入力用のプロンプト単語に組み立てます。
  2. アクション モジュール: アクション モジュールは、ビジネス機能インターフェイスとの接続を通じて、認識と計画の結果に基づいて、対応するビジネス オペレーションを実行できます。さらに、ビジネス実践におけるフィードバックデータは、コード、戦略、プロンプトワードを備えたフィードバックシステムを通じて最適化することもできます。
  3. 計画モジュール: 計画モジュールは AI エージェントの中核です。大規模モデルの機能を活用することに加えて、コード ロジックと組み合わせたビジネス ニーズに基づいて設計することも必要です。ここでは、脳がどのように機能するかを考え、ビジネスを推進するために適切な入力および出力方法を採用する必要があります。
2. AI エージェントの設計方法

では、ビジネス ニーズを満たす AI エージェントを設計するにはどうすればよいでしょうか?

1. 適切なビジネス シナリオを見つける

まず、AI エージェントに適したシナリオを決定し、データ入力をシミュレートして出力結果を収集することで、選択したシナリオの適合性を評価する必要があります。出力結果を判断する際には、期待どおりであるかどうかを検討する必要があります。結果が期待どおりでない場合は、エラーの重大度、および精度と再現率に改善の余地があるかどうかを評価する必要があります。改善の余地がある場合は、プロンプトワードを最適化したり、認識、行動、計画モジュールの構築を導入したりすることで、AI を現場のニーズを満たすことができます。

2. 入力と出力の期待を整理する

AI エージェントが何を入力し、何を出力する必要があるかを決定するには、AI エージェントの「目標」と「要件」を明確にする必要があります。

これらの「目標」と「要件」に基づいて、ビジネス ニーズを満たし、ビジネスを強化するために適切な入力および出力方法を選択する方法を考える必要があります。これは、後続の出力プロセスを設計し、設計検証フェーズで評価して要件を満たしているかどうかを判断するのに役立ちます。

3. 出力プロセスを整理する

複雑な出力要件に直面した場合、さまざまな AI が相互に連携して、最終的に要件を満たす出力結果を達成できるように、複数の AI 会話プロセスを設計する必要があります。たとえば、テキスト分類シナリオでは、まずバージョン 3.5 の大規模モデルを使用して、ニーズを満たす正確な第 1 レベルの分類を行うことができます。

バージョン 4.0 のコストはバージョン 3.5 の数十倍であり、第 1 レベルの分類にはバージョン 3.5 で十分であるため、コストを節約するためにバージョン 3.5 の使用を選択できます。その後、二次分類にバージョン 4.0 を使用して、より良い分類結果を取得し、必要なコンテンツを確実に出力できます。

プロセスを設計するときは、次の要素を考慮する必要があります:

  • コスト要因: 大規模モデルとそのバージョンによってコストは異なります。利益以上の損失を避けるために、ビジネス上のメリットを比較検討し、合理的な大規模モデルの使用プランを選択する必要があります。
  • 効果的な要因: 大型モデルとそのバージョンによって効果は異なり、異なる分野で強みを持っています。使用上のニーズに基づいて、最適なソリューションを選択する必要があります。

コストと効果を総合的に考慮し、最適なプランを決定しました

4. 出力検証メカニズム

AIの出力結果に誤解を招く内容がビジネスに影響を与えないようにするためには、効果的な検証メカニズムを確立する必要があります。一般的な検証方法には、語彙一致、正規表現一致、手動検査などがあります。シソーラスや手動の手段を使用して、誤解を招くコンテンツをブロックします。さらに、AI 自体が出力の品質検査を実行して問題のあるコンテンツを除外し、誤解を招くコンテンツの検出率を向上させる品質検査エージェントを構築することもできます。

5. 幻想隠蔽計画

幻覚の発生は完全になくすことのできない現象です。ビジネスへの悪影響を回避するには、次のような安全計画を策定する必要があります。

1) 手動検査: AI 出力がユーザーに渡される前に、手動検査リンクが導入されます。手動検査に合格した場合にのみ、結果がユーザーに出力されます。このようにして、AI の幻想がビジネスに悪影響を与えることを完全に防ぐことができ、AI の出力を効率の向上に利用することもできます。ただし、この方法では人間によるレビューが必要となるため、一定の人件費が増加します。

浅谈AI Agent在B端的设计思路

2) 合理的なパッケージ化: B 側の AI アプリケーションであることを考慮すると、出力アプリケーションを「AI アシスタント」としてパッケージ化するなどの方法を使用して、「ここでの出力結果は次のとおりです」とユーザーに直接明確にすることができます。 AIによって生成されたものであり、参照のみを目的としています。」このようにして、ユーザーが合理的な心理的期待を形成し、幻覚出力が発生した場合の副作用を回避できるようになります。

3. 概要

上記のアイデアに基づいて、B サイド翻訳エージェント、データ分類エージェント、インテリジェント顧客サービス エージェントなどのサービスを構築できます。もちろん、これらは私の個人的な考えの一部にすぎません。皆さんの意見交換や議論を歓迎します。

私に投票してください

私は 2023 年全員がプロダクト マネージャーのセレクションに参加しています。私の記事を気に入った友人が来てサポートしてくれることを願っています~

下のリンクをクリックして私の個人選挙ページに入り、赤いハートをクリックして私に投票してください。

お一人様1日最大30票まで投票でき、投票すると抽選で書籍や全員プロダクトマネージャー記念周辺機器、Starting Point会員権などのプレゼントが当たります。教室!

次のリンクをクリックして投票してください: https://996.pm/7d9yE

###コラムニスト###

レモン ケーキは清潔で衛生的です。パブリック アカウント: レモン ケーキは清潔で衛生的です。誰もがプロダクト マネージャーのコラムニストです。ゲーム業界のBエンド製品 ゲーム業界でCRM、リスクコントロール、BI、SDK、AI関連コンテンツを担当 定期的に個人的な感想やまとめ記事をアウトプットしています~

この記事は「誰もがプロダクトマネージャー」に掲載されたものです。無断転載を禁じます

タイトル画像は、CC0 プロトコルに基づいた Unsplash からのものです

以上がAI エージェントがエンタープライズ レベルの設計についてどのように考えるかの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事はsohu.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。