ホームページ  >  記事  >  テクノロジー周辺機器  >  会話システムのパフォーマンスを向上させる 9 つのヒント

会話システムのパフォーマンスを向上させる 9 つのヒント

王林
王林転載
2023-10-17 17:25:01997ブラウズ

会話システムのパフォーマンスを向上させる 9 つのヒント

会話型 AI は、ユーザーに必要な情報を、必要なときに、ユーザーの希望に最も適した方法で提供する優れたソリューションとみなされています。しかし、それでも、会話型 AI システムには依然としていくつかの共通の欠陥があります。

以下は、会話型システムのパフォーマンス向上に役立つよう、私が長年にわたってまとめたヒントです:

1. 質問を合理化する

会話型人工知能システムの目標は、タスクを完了するために必要な情報を取得することです。情報はコンテキストやユーザーの質問から得られます。

ただし、システムが尋ねるすべての質問により、会話が失敗する可能性があります。したがって、私たちの目標は、質問の数を最小限に抑えるか、質問を簡単にすることです。

自動車保険を例に挙げると、ユーザーは提出したばかりの保険金請求のステータスを確認したいと考えています。複雑な質問や説明はなく、ユーザーに請求の 11 桁の ID を提供するよう求めるだけです。このような設計は、よりユーザーのニーズに合致し、会話が失敗するリスクを軽減します。

会話システムのパフォーマンスを向上させる 9 つのヒント

2. 技術者が質問しすぎる可能性があります

テクノロジー主導のアプローチでは、通常、最初に考慮すべきことは、必要な「請求の詳細」API です。開発者は、ポリシー ID を利用して詳細を取得できる API がすでに存在していると言及することもあります。これは素晴らしいですね!必要な情報を取得するには、ユーザーが 1 つのポリシー ID を入力するだけで済みます。この設計は、現在の技術的アプローチとは正反対です。

会話システムのパフォーマンスを向上させる 9 つのヒント

これは開発者にとっては比較的簡単ですが、ユーザーにとっては特定の課題を引き起こす可能性があります。ユーザーは 11 桁の ID を正確に入力する必要があります。音声のコンテキストでは、ユーザーが 11 桁を知っていたとしても、それらを正確に捉えるのは困難な場合があります。

3. わかりやすいデザインで質問に答えやすくする

ユーザーがクレーム ID を入力しやすくするために、最後の 4 桁だけを必要とするなど、必要な桁数を減らすことができます。桁数。11 桁すべてではありません。バックエンドでは完全なクレーム ID が依然として必要ですが、この設計により、ユーザーは非常に簡単に質問できるようになります。小さな数字を入力したり話したりするときに、間違いを犯す可能性が低くなります。

会話システムのパフォーマンスを向上させる 9 つのヒント

「より簡単な質問をする」方法はたくさんあります。

  1. さまざまな質問をする : 請求の場合は、これをご覧ください。請求の日付について尋ねることが含まれる場合があります。多くの使用例では、クレーム ID または日付は各ユーザーに固有です。
  2. 写真認識の使用: 一部のモバイル アプリケーションは、写真から必要な情報を認識して抽出できます。

ただし、まだ質問しているため、より単純な質問をすることには制限があります。たとえば、車の保険金請求の場合、電話をかけてきた人は保険金請求に関する詳細情報を取得できることが期待されますが、このプロセスはユーザーにとって課題となる可能性があります。では、さらに物事を単純化できないでしょうか?

**4. **合理的な仮定を立てる (場合によっては確認する)

別の方法で考えて、トピックを技術的な観点からユーザーの観点に移してみましょう。私たちはユーザーを第一に考え、なぜユーザーが車のクレームについて電話をかけてくるのかを理解する必要があります。おそらく、彼らは自動車事故に遭ったばかりで、申請した保険金請求を追跡しているからでしょう。

ユーザーは複数の請求を行っている可能性がありますが、最新の請求に関する情報を問い合わせるために電話をかけることがあります。このような場合、当社は合理的な仮定を立てる必要があり、ユーザーのニーズによりよく応えるためにはこれらの仮定を確認する必要があります。

会話システムのパフォーマンスを向上させる 9 つのヒント

#上図は、ユーザーの負担を軽減できる方法を示しています。現在、ユーザーは、請求情報を積極的に提供する代わりに、システムによって提供される情報を受け取ることができます。この改善により、ユーザーの対話負担が軽減されるだけでなく、バ​​ックエンドのデータ取得のニーズも満たされます。ユーザーにとっては、積極的に情報を提供するよりも、情報を確認する方が便利です。さらに、このアプローチにより、会話型人工知能システムがよりインテリジェントに見えるようになり、システムに対するユーザーの信頼も向上します。

ただし、このモードでは、情報が悪意のある第三者に漏洩しないように、追加のコンテキスト情報が必要です。たとえば、保険金請求の検索の例では、システムは発信者を識別する (おそらく着信電話番号を保険金請求ポリシーに結び付ける) ことによってこのプロセスを容易にします。

質問をスキップして合理的な推測だけを行うことは必ずしも可能なわけではありませんが、これはより効率的な会話型 AI システムを構築するための強力なテクニックの 1 つです。次に、尋ねる必要がある質問を改善する方法を検討しましょう。

5.明確な選択肢を提供する

前のセクションでは、問題を軽減して人工知能システムのパフォーマンスを向上させる方法について説明しました。ただし、場合によっては、質問を削除することができず、依然として質問する必要がある場合があります。この場合、強力なアプローチは明確な選択肢を提供すること、つまりユーザーに明示的なリストから選択するよう求めることです。ユーザーにリンゴかオレンジのどちらかを選択するよう求めると想像してみましょう。これは比較的簡単に思えますが、ユーザーが確実に選択できるようにするにはどうすればよいでしょうか?

多肢選択問題の実装は、思っているよりも難しいかもしれません。潜在的な落とし穴を一緒に調べてみましょう。

6.「はい/いいえ」の混乱に注意してください

「はい/いいえ」の混乱に注意する必要があります。オプションの質問にどう答えるかがユーザーにとって必ずしも明確であるとは限りません。たとえば、ユーザーに「リンゴとオレンジのどちらが欲しいですか?」と尋ねると、「はい!」と答えるかもしれません。この場合、ユーザーにとってより明確になるように質問を再構成する必要があります:

  • 「リンゴかオレンジを選んでください。」
  • 「リンゴとオレンジのどちらの果物が好きですか?」

これらの質問を言い換えると、次のように見えるかもしれません。技術的には同じでも、実際の会話での効果は大きく異なる可能性があるため、会話型 AI システムの最適なパフォーマンスを確保するには、会話媒体に適した会話コピーを選択することが重要です。

7. ボタンにより操作プロセスが簡素化されます

ユーザーの中には、質問を入力したり音声で答えたりすることに抵抗がある人もいます。チャットのシナリオでは、回答を入力するよりもボタンをクリックする方が便利な場合があります。音声シナリオでは、通常、ユーザーはキーボード上のボタンを押すことができます。たとえば、「1」を押すと最初のオプションを選択することを意味し、「2」を押すと 2 番目のオプションを選択することを意味します。 「リンゴまたはオレンジを選択してください」という質問に対するユーザーの応答を評価する場合、「リンゴ」または「1」を同等の回答として受け入れることができます。これにより、操作がよりスムーズに完了することができます。

ボタンは「ハイテク」とは感じられないかもしれませんが、正しく使用すればユーザーの効率を高めることができます。

ユーザーが選択プロセス中に犯した小さな間違いに対しては、ある程度の柔軟性を持たせる必要があります。ユーザーが選択を求められると、ユーザーと人工知能システムの両方が誤操作をしてしまう可能性があります。たとえば、チャット インターフェイスでは、ユーザーが「appel」の代わりに「apple」と綴る可能性があります。このとき、AIは単に「わかりません」と答えるのではなく、ユーザーがAppleを選択するつもりであると合理的に想定し、正しい応答を提供する必要があります。この耐障害性により、使いやすさが向上します。

音声アプリケーションでは、オプションにドメイン固有の用語が含まれている場合、これらの選択オプションが正確に認識されるようにカスタム モデルをトレーニングする必要がある場合があります。どのような選択肢を提供しても、ユーザーがどのように反応する可能性があるかがわかったので、音声サービスがユーザーを正確に文字起こしできることを確認する必要があります。この果物選択の例では、精度を確保するために、カスタム モデルのトレーニングに「リンゴ」と「オレンジ」のエントリを必ず含めてください。

会話システムのパフォーマンスを向上させる 9 つのヒント

カスタム モデルをトレーニングした場合でも、転写エラーが発生する可能性があります。音声サービスでは、「リンゴ」を「アピール」や「ハックル」などと誤って表記する場合があります。この場合、認識精度をさらに向上させるために、これらの潜在的な誤転写シナリオを Watson Assistant 実装に追加することを検討できます。

選択性の問題は、会話型人工知能システムではよく発生します。これらのヒントを適用することで、選択的な質問をより効率的に行うことができます。

8.明確な選択肢を提供する

前のコンテンツでは、対話テキストがより正確であればユーザーの反応も向上するため、言葉を正確に選択することで人工知能のパフォーマンスがどのように向上するかについて説明しました。より詳細な会話テキストは、ユーザー エクスペリエンスを向上させるだけでなく、ユーザーの満足度を高め、タスクの完了を迅速化するのにも役立ちます。この一連の効果を組み合わせることで、よりスムーズなユーザー エクスペリエンスが促進されます。

9. 意味のあることを言う

会話では、一言一言がユーザーの負担を増大させます。テキストチャットでは読む必要があり、音声会話では言葉を聞く(そして待つ)必要があります。したがって、会話を見直して不必要なテキストを排除することが重要です。例をいくつか示します:

  • 「メニュー オプションが最近変更されたため、よく聞いてください。」 このメッセージが最後に役に立ったのはいつですか?年に 1 回しか電話をかけない場合、これらのオプションを覚えている可能性はほとんどありません。毎日電話をかける場合、聞く必要があるのは 1 回だけです。この文はほとんどの状況では実際には役に立たず、私が最も嫌いな IVR (自動音声応答) の 1 つです。
  • 「あなたの電話は私たちにとって重要です。」 これはユーザーに伝えるべきことではなく、行動を通じて示すべきものです。ユーザーに対する真の敬意とは、言葉よりも行動が雄弁であることを意味します。
  • 「(やり方の詳しい説明)」。ユーザーが「自分のやり方で」操作できるように長い説明を提供する必要がある場合は、説明への依存を減らすための技術的な改善を検討してください。これにより、会話がよりスムーズかつ効率的になります。

10. 句読点の正確な使用

会話型 AI システムは、テキスト読み上げエンジンを使用してユーザーと会話し、これらのエンジンは句読点の手がかりに基づいて文内のどこにあるかを判断しますアクセントと休止。

「句読点は命を救う」というスローガンのインスピレーションとなった、太字のカンマ付きで「食べましょう、おばあちゃん」と書かれた気の利いた T シャツを覚えています。実際には、句読点によって AI システムの「命」が救われるわけではありませんが、会話テキストがよりスムーズに聞こえるようになります。

会話の句読点をチェックするときは、次のことを確認してください:

  • すべての文がピリオドで終わっていること。
  • 複雑な文はカンマで区切ります。
  • 選択リストには、「Oxford comma」(つまり、「A、B、または C を選択してください」の最後のカンマ) を含めます。

さらに、自動化機能を使用して、仮想アシスタントでのすべての会話の音声ファイルを作成することを検討することもできます。

概要

この記事では、会話型人工知能を改善するためのさまざまな技術的方法を検討します。新しい会話型 AI システムを開発するとき、または既存の AI システムを改善するときに、これらの手法の採用を検討してください。新しいシステムであっても既存のシステムであっても、継続的な改善と反復は AI システムのパフォーマンスにプラスの影響を与えます。これらの実践により、会話型 AI システムのパフォーマンスが大幅に向上することが証明されています。

以上が会話システムのパフォーマンスを向上させる 9 つのヒントの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明:
この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。