言語モデル、グラフ ニューラル ネットワーク、テキスト グラフ トレーニング フレームワーク GLEM を効果的に統合して、新しい SOTA を実現します
- #主な拠点: モントリオール アルゴリズム学習人工知能研究所 (Mila)、Microsoft Research Asia など
- ペーパーアドレス: https://arxiv.org/abs/2210.14709
- コードアドレス: https://github.com /andyjzhao/glem
##図 1: (a) テキストグラフ (b) グラフ ニューラル ネットワーク (c) 言語モデル
グラフは、ノード間の構造的関係をモデル化する汎用データ構造です。実際には、多くのノードにリッチ テキスト機能が含まれており、このグラフはテキスト属性グラフと呼ばれます [2]。たとえば、論文引用ネットワークには論文のテキストと論文間の引用関係が含まれ、ソーシャル ネットワークにはユーザーのテキスト説明とユーザーの直接の対話関係が含まれます。テキストグラフ上の表現学習モデルは、ノード分類やリンク予測などのタスクに適用でき、幅広い応用価値があります。#テキスト グラフには、ノードのテキスト情報とノード間のグラフ構造情報の 2 つの情報が含まれます。従来のテキスト グラフのモデリングは、テキスト モデリングとグラフ モデリングの 2 つの観点に分けることができます。このうち、テキスト モデリング手法 (図 1.b に示す) は通常、Transformer ベースの言語モデル (LM) を使用して単一ノードのテキスト表現を取得し、ターゲット タスクを予測します。グラフ モデリングのモデリング手法 (図 1.b に示す)図 1.c) では、通常、グラフ ニューラル ネットワーク (GNN) を使用してノード機能間の相互作用をモデル化し、メッセージ伝播メカニズムを通じてターゲット タスクを予測します。
ただし、2 つのモデルは、それぞれテキスト グラフ内のテキストとグラフ構造のみをモデル化できます。従来の言語モデルは構造情報を直接考慮できず、グラフ ニューラル ネットワークは構造情報を直接考慮できません。オリジナルのテキスト情報、モデリング。テキストとグラフの構造を同時にモデル化するために、研究者は言語モデルとグラフ ニューラル ネットワークを統合し、2 つのモデルのパラメーターを同時に更新しようとしています。しかし、既存の研究 [2、3] は、同時に多数の隣接するテキストをモデル化することができず、拡張性が低く、大きなテキスト グラフには適用できません。
GLEM フレームワーク
グラフ ニューラル ネットワークと言語モデルをより効果的に統合するために、この記事では
Graph と L## を提案します。 # anguage Expectation Maximization (GLEM) フレームワークによる学習。 GLEM フレームワークは、変分期待値最大化アルゴリズム (変分 EM) に基づいており、グラフ ニューラル ネットワークと言語モデルを交互に学習するため、優れたスケーラビリティを実現します。
#図 2: GLEM フレームワーク
具体的には、ノード分類タスクを例に挙げると、E ステップ で、GLEM は、グラフ ニューラル ネットワークによって予測された実際のラベルと擬似ラベル
に基づいて言語モデルをトレーニングします。 M ステップ では、GLEM は、言語モデル によって予測された実際のラベルと擬似ラベルに基づいて、グラフ ニューラル ネットワーク をトレーニングします。このようにして、GLEM フレームワークはローカルのテキスト情報とグローバルな構造的相互作用情報を効果的にマイニングします。 GLEM フレームワークを通じてトレーニングされたグラフ ニューラル ネットワーク (GLEM-GNN) と言語モデル (GLEM-LM) の両方を使用して、ノード ラベルを予測できます。 実験
この論文の実験部分では、主に次の側面から GLEM フレームワークについて説明します。
- 有効性: GLEM モデルはグラフ ニューラル ネットワークと言語モデルを効果的に統合し、両方のモデルを大幅に改善します。 GLEM フレームワークは、OGB の 3 つのテキスト グラフ ノード分類タスクで 1 位を獲得しました。
- スケーラビリティ: グラフ ニューラル ネットワークと言語モデルを交互にトレーニングすることで、GLEM フレームワークは大規模な言語モデルと深い GNN を同時にトレーニングできます。
- 構造のない帰納的推論能力: 従来の GNN モデルは、グラフ構造のない新しいノードに直面するとパフォーマンスが低下します。対照的に、GLEM-LM では、(グラフ構造なしで) テキスト特徴のみを使用して効率的な推論が可能になります。
- モデルの収束: GLEM は EM 反復アルゴリズムを使用し、一部のデータ セットでは 1 回の EM 反復で収束できます。
#図 3: GLEM フレームワークは、OGBN-arxiv、製品、論文100M データセットで 1 位を獲得
以上が言語モデル、グラフ ニューラル ネットワーク、テキスト グラフ トレーニング フレームワーク GLEM を効果的に統合して、新しい SOTA を実現しますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ


ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

AtomエディタMac版ダウンロード
最も人気のあるオープンソースエディター

ZendStudio 13.5.1 Mac
強力な PHP 統合開発環境

DVWA
Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

WebStorm Mac版
便利なJavaScript開発ツール

Safe Exam Browser
Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。
