Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています-AI-php.cn

ホームページ

テクノロジー周辺機器

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 09, 2023 pm 03:41 PM

検索研究

テキスト生成タスクは、通常、教師強制を使用してトレーニングされます。このトレーニング方法を使用すると、モデルはトレーニングプロセス中にポジティブなサンプルのみを確認できます。ただし、生成ターゲットと入力の間には通常、特定の制約があり、これらの制約は通常、文の主要な要素に反映されます。たとえば、クエリ書き換えタスクでは、「マクドナルドを注文」を「KFC を注文」に変更することはできません。抑制の重要な要素はブランドのキーワードです。対照学習を導入し、生成プロセスに負のサンプルパターンを追加することにより、モデルはこれらの制約を効果的に学習できます。

既存の比較学習方法は、主に文全体のレベル [1][2] に焦点を当てており、文内の単語単位のエンティティは無視されています。下図の例は、文中のキーワードの重要な意味を示しています。入力文の場合、そのキーワードが置き換えられると (例: 宇宙論 -> 天体物理学)、文の意味が変化するため、意味空間における ( の位置)分布で表される）も変化します。文内で最も重要な情報であるキーワードは、意味分布の点に対応し、文の分布の位置を大部分決定します。同時に、場合によっては、既存の対照的な学習目標がモデルにとって簡単すぎるため、モデルが肯定的な例と否定的な例の間の重要な情報を真に学習できなくなることがあります。

これに基づいて、Ant Group、北京大学などの研究者は、多粒度の比較生成方法を提案し、階層的な比較構造を設計しました。学習レベルで実行され、文の粒度で学習の全体的な意味論が強化され、単語の粒度で局所的な重要な情報が強化されます。研究論文がACL 2022に採択されました。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

論文アドレス: https://aclanthology.org/2022.acl-long.304.pdf

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

メソッド

私たちのメソッドは古典的なものに基づいています。 CVAE テキスト生成フレームワーク [3][4] では、各文をベクトル空間の分布にマッピングすることができ、文内のキーワードをこの分布からサンプリングされた点とみなすことができます。文の粒度の比較を通じて潜在空間ベクトル分布の表現を強化する一方で、構築されたグローバルキーワードグラフを通じてキーワードポイントの粒度の表現を強化し、最後にマハラノビス距離を使用して比較します。キーワードポイントとセンテンスの分布構成レベル間のコントラストにより、2 つの粒度で情報表現を強化します。最終的な損失関数は、3 つの異なる対照的な学習損失を追加することによって取得されます。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

文の詳細な比較学習

atインスタンスレベルでは、元の入力 x、ターゲット出力

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

、および対応する出力負のサンプルを使用して、文の粒度ペア

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# を比較します。以前のネットワークを使用して、以前の分布

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

## ( ## として記録) を学習します。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

##; 事後ネットワークを通じて近似の事後分布を学習する

と

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

## はそれぞれ # として記録されます。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃そして＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃。文粒度比較学習の目標は、事前分布と正の事後分布の間の距離をできる限り小さくすると同時に、事前分布と負の事後分布の間の距離を最大化することです。対応する損失関数は次のとおりです。次のようになります。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

ここで、は陽性サンプルまたは陰性サンプル、は温度係数です。ここでは、KL ダイバージェンス (カルバック・ライブラーダイバージェンス)[5] を使用して、2 つの分布間の直接距離を測定します。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#キーワードの詳細な比較学習

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

キーワードネットワーク

キーワード粒度の対照学習を使用して、モデルが文内の重要な情報にさらに注意を払うようにします。この目標を達成するために、出力テキストに対応する否定的な関係が構築されてキーワードグラフが構築されます。具体的には、与えられた文のペア

# に従って、そこからキーワード ## をそれぞれ決定できます # ＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃そして＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃（キーワード抽出には古典的な TextRank アルゴリズム [6] を使用します);

## という文には、他の文がある可能性があります。はキーワード

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

と同じであり、これらの文は集合

を形成します。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

、この

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#のすべての文は肯定的な出力例と否定的な出力文のペアです。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

それぞれに肯定的なキーワードの例

# があります。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

と除外キーワードの例

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

##。このようにして、コレクション全体で、任意の出力文

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

について、対応するキーワード # と見なすことができます。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

## とその周囲のすべての

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

(文間の正と負の関係を通じて関連付けられている)

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

の間の正のエッジです。周囲の

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# の間に負のエッジ ## があります

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています。これらのキーワードノードとその直接エッジに基づいて、キーワードグラフを構築できます

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

各ノードの初期化として BERT embedding[7] を使用します

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています、MLP 層を使用して学習します各エッジの表現

#。グラフアテンション (GAT) レイヤーと MLP レイヤーを通じて、キーワードネットワーク内のノードとエッジを繰り返し更新します。各反復では、最初に次の方法でエッジ表現を更新します: Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#ここで

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

## は

になります。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃または＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃。 Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

次に、更新されたエッジに基づいて Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

、グラフアテンションレイヤーを通じて各ノードの表現を更新します。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#ここで

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# はすべて学習可能なパラメータです。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# は注意の重みです。勾配消失の問題を防ぐために、

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

に残りの接続を追加して、express

# を取得しました。＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃最後の反復のノード表現をキーワードの表現として使用し、u として示します。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています #キーワード比較

と偽者ノード

から得られます。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

。入力文の出力ポジティブサンプルから抽出されたキーワードを

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# として記録します。これは、上記のキーワードネットワークに含まれます。負の隣接ノードは

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# として記録され、次に

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

、キーワード粒度の比較学習損失は次のように計算されます:

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています ## ここで、

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用していますは

を参照するために使用されます。＃＃＃＃＃＃＃＃＃＃＃＃または＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃＃

, h(・) は距離の尺度を表すために使用されます。キーワード粒度の比較学習では、コサイン類似度を選択して 2 点間の距離を計算します。

#横断的な比較学習

## 上記の文粒度とキーワード粒度のコントラスト学習はそれぞれ分布とポイントで実装されるため、2 つの粒度を独立して比較すると、差が小さいため強調効果が弱まる可能性があることに注意してください。この点において、我々は、点と分布の間のマハラノビス距離 [8] に基づいて、異なる粒度間の比較関連を構築し、対象の出力キーワードと文の分布の間の距離が可能な限り小さくなり、偽者間の距離が小さくなるようにします。粒径を独立して比較するため、コントラストが消えてしまうという欠点を補い、その分布を可能な限り小さくしています。具体的には、クロス粒度マハラノビス距離対比学習は、文の事後意味分布を可能な限り狭めることを望んでいます。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

との間の距離をできるだけ広げながら、

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

# 間の距離、損失関数は次のとおりです。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#Here

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

は、

# を参照するためにも使用されます。

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています ## または

##、h(・) はマハラノビスです距離。 Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています

#実験と分析

Alipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用しています ##実験結果

私たちは、Douban (対話) [9]、QQP (言い換え) [10][11]、RocStories (ストーリーテリング) [12] の 3 つの公開データセットで実験を行い、すべて SOTA 効果を達成しました。私たちが比較するベースラインには、従来の生成モデル (例: CVAE[13]、Seq2Seq[14]、Transformer[15])、事前トレーニング済みモデルに基づく手法 (例: Seq2Seq-DU[16]、DialoGPT[17]、BERT-GEN) が含まれます。 [7]、T5[18]）および対照学習に基づく方法（例：グループごと[9]、T5-CLAPS[19]）。自動評価指標として、BLEU スコア[20]と文ペア間の BOW 埋め込み距離 (極値/平均/貪欲)[21]を計算し、その結果を次の図に示します。

## QQP データセットに対して手動評価も使用しました。3 人のアノテーターがそれぞれ T5-CLAPS、DialoGPT、Seq2Seq-DU、および私たちのモデルの結果を生成しました。結果は次のとおりです。マークが付けられ、結果は以下のようになります:

アブレーション分析

キーワードを使用するかどうか、キーワードネットワークを使用するかどうか、マハラノビス距離を使用するかどうかを分析しました。アブレーション解析実験が実施され、その結果、これら 3 つの設計が最終結果において重要な役割を果たしていることがわかりました。実験結果を下の図に示します。

#視覚分析

階層的対照学習の役割に関して、ランダムにサンプリングされたケースを視覚化し、t-sne による次元削減後に次の図を得ました [22]。この図から、入力文の表現は抽出されたキーワードの表現に近いことがわかり、文中の最も重要な情報としてのキーワードが通常、意味分布の位置を決定することがわかります。さらに、対照学習では、トレーニング後、入力文の分布が正のサンプルに近づき、負のサンプルから遠ざかることがわかります。これは、対照学習が意味分布の修正に役立つことを示しています。

#キーワード重要度分析

最後に、さまざまなキーワードをサンプリングすることの影響を調査します。以下の表に示すように、入力された質問に対して、TextRank抽出法とランダム選択法により意味分布を制御するための条件としてキーワードを与え、生成されたテキストの品質をチェックします。キーワードは文の中で最も重要な情報単位です。キーワードが異なると意味分布も異なり、異なるテストが生成されます。選択したキーワードが多いほど、生成される文はより正確になります。一方、他のモデルで生成された結果も下の表に示します。

##ビジネスアプリケーション
この記事複数のテキスト生成データセットに対する競合ベースライン作業を上回る、粒度を超えた階層的対比学習メカニズムを提案します。この研究に基づいたクエリ書き換えモデルは、Alipay 検索の実際のビジネスシナリオに正常に実装され、顕著な結果を達成しました。 Alipay の検索サービスは広範な領域をカバーしており、ドメイン特性が顕著です。ユーザーの検索クエリ表現とサービス表現の間には文字どおりの大きな違いがあり、キーワードに基づいて直接照合することで望ましい効果を達成することは困難です (たとえば、ユーザーが「新車発売クエリ」というクエリを入力すると、「新車発売クエリ」というサービスを呼び出すことができません）、クエリ書き換えの目標は、ユーザーが入力したクエリを次のような方法に書き換えることです。ターゲットサービスによりよく一致するように、クエリの意図を変更せずにサービス式に近づけます。いくつかの言い換え例を次に示します。
#

以上がAlipay の検索エクスペリエンスを向上させるために、Ant と北京大学は階層型比較学習テキスト生成フレームワークを使用していますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

外挿の包括的なガイドApr 15, 2025 am 11:38 AM

導入数週間で作物の進行を毎日観察する農民がいるとします。彼は成長率を見て、さらに数週間で彼の植物がどれほど背が高くなるかについて熟考し始めます。 thから

ソフトAIの台頭とそれが今日のビジネスにとって何を意味するかApr 15, 2025 am 11:36 AM

ソフトAIは、おおよその推論、パターン認識、柔軟な意思決定を使用して特定の狭いタスクを実行するように設計されたAIシステムとして定義されていますが、曖昧さを受け入れることにより、人間のような思考を模倣しようとします。しかし、これはBusineにとって何を意味しますか

AIフロンティア向けの進化するセキュリティフレームワークApr 15, 2025 am 11:34 AM

答えは明確です。クラウドコンピューティングには、クラウドネイティブセキュリティツールへの移行が必要であるため、AIはAIの独自のニーズに特化した新しい種類のセキュリティソリューションを要求します。クラウドコンピューティングとセキュリティレッスンの台頭で

3つの方法生成AIは起業家を増幅します：平均に注意してください！Apr 15, 2025 am 11:33 AM

起業家とAIと生成AIを使用して、ビジネスを改善します。同時に、すべてのテクノロジーと同様に、生成的AIが増幅器であることを覚えておくことが重要です。厳密な2024年の研究o

Andrew Ngによる埋め込みモデルに関する新しいショートコースApr 15, 2025 am 11:32 AM

埋め込みモデルのパワーのロックを解除する：Andrew Ngの新しいコースに深く飛び込むマシンがあなたの質問を完全に正確に理解し、応答する未来を想像してください。これはサイエンスフィクションではありません。 AIの進歩のおかげで、それはRになりつつあります

大規模な言語モデル（LLMS）の幻覚は避けられませんか？Apr 15, 2025 am 11:31 AM

大規模な言語モデル（LLM）と幻覚の避けられない問題 ChatGpt、Claude、GeminiなどのAIモデルを使用した可能性があります。これらはすべて、大規模なテキストデータセットでトレーニングされた大規模な言語モデル（LLMS）、強力なAIシステムの例です。

60％の問題 - AI検索がトラフィックを排出する方法Apr 15, 2025 am 11:28 AM

最近の研究では、AIの概要により、産業と検索の種類に基づいて、オーガニックトラフィックがなんと15〜64％減少する可能性があることが示されています。この根本的な変化により、マーケティング担当者はデジタルの可視性に関する戦略全体を再考することになっています。新しい

AI R＆Dの中心に人間が繁栄するようにするMITメディアラボApr 15, 2025 am 11:26 AM

Elon UniversityがDigital Future Centerを想像している最近のレポートは、300人近くのグローバルテクノロジーの専門家を調査しました。結果のレポート「2035年に人間である」は、ほとんどがTを超えるAIシステムの採用を深めることを懸念していると結論付けました。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、