ホームページ >テクノロジー周辺機器 >AI >GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2023-06-05 16:03:401787ブラウズ

AI 生成テキストのマルチスケールポジティブ非ラベル検出
思考連鎖の背後にある謎: 理論的観点
ツール作成者としての大規模言語モデル
#SpecInfer: 投機的推論とトークンツリーによる生成 LLM サービスの高速化検証
安価で迅速: 大規模言語モデル向けの効率的なビジョン言語命令チューニング
mPLUG-2: 全体にわたるモジュール化されたマルチモーダル基盤モデルテキスト、画像、ビデオ
レコメンダーシステムの次の目標は何ですか? ID ベースとモダリティベースのレコメンダーモデルの再考

論文 1: AI 生成テキストのマルチスケールポジティブ非ラベル検出

## 著者: Yuchuan Tian、Hanting Chen、他
論文アドレス: https://arxiv.org/abs/2305.18149

#要約: AI 詐欺の成功率は非常に高い数日前、「10 分で 430 万をだまし取られた」というキーワードが検索で話題になりました。最も人気のある大規模言語モデルに関しては、北京大学とファーウェイの研究者が最近、認識方法を研究しました。同じ質問に人間と AI がそれぞれ回答する例をいくつか示します。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

## 推奨事項:

「ChatGPT 詐欺」を特定する効果は OpenAI を超える: 北京大学とファーウェイの AI 生成検出器が登場

論文 2: 思考連鎖の背後にある謎の解明に向けて: 理論的展望

#著者: Guhao Feng、Bohang Zhang など

論文アドレス: https:// arxiv .org/abs/2305.15408

思考連鎖ヒント (CoT) は、大規模モデルの創発における最も不可解な現象の 1 つです。、特に数学的推論と意思決定の問題を解決する際に、驚くべき結果を達成しました。 CoTはどのくらい重要ですか?その成功の背後にあるメカニズムは何ですか？この記事では、北京大学の数名の研究者が、CoT が大規模言語モデル (LLM) 推論の実現に不可欠であることを証明し、理論的および実験的観点から CoT がどのように LLM の大きな可能性を解き放つことができるかを明らかにします。

#この記事では、算術と方程式という 2 つの非常に基本的だが核となる数学的タスクを選択します (次の図は、これら 2 つのタスクの入力と出力の例を示しています)

# 推奨事項: GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する思考の連鎖は言語モデルの隠された能力をどのように解放しますか?最新の理論的研究により、その背後にある謎が明らかになりました

#論文 3: ツール作成者としての大規模言語モデル

著者: Tianle Cai、Xuezhi Wang など

論文アドレス: https://arxiv.org/pdf/2305.17126.pdf
要約: この記事では、人類にとっての製造ツールの重要性に触発され、Google Deepmind、プリンストン、スタンフォード大学の研究者がこれについて説明します。「進化」の概念をLLMの分野に適用し、予備的な検討を行った。彼らは、LLM As Tool Maker (LATM) が新しいタスクを処理するための独自の再利用可能なツールを生成できるようにする閉ループフレームワークを提案しています。

推奨事項: GPT-4 およびその他の大規模モデルは進化の転換点に達しています。それらを使用するだけでなく、独自のツールを作成することもできます

# 論文 4: SpecInfer: 投機的推論とトークンツリー検証による生成 LLM サービングの高速化

#著者: Xupeng Miao、Gabriele Oliaro など
論文アドレス: https://arxiv.org/abs/2305.09781

要約: 最近、カーネギーメロン大学 (CMU) の Catalyst Group チームは、生成されたコンテンツの精度にまったく影響を与えることなく、軽量で小さなモデルを使用して大規模なモデルを支援できる「推論」エンジン SpecInfer をリリースしました。この場合、推論の 2 ～ 3 倍の高速化が実現されます。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

推奨事項: LLM 推論は 2.8 倍高速化、CMU 清華ヤオクラスの卒業生は「推測的」と提案「アプローチ」「推論」エンジン SpecInfer、小規模モデルは効率的な推論のために大規模モデルを活用

論文 5: 安価で迅速: 大規模言語モデルの効率的な視覚言語命令チューニング

著者: Gen Luo、Yiyi Zhou、他
論文アドレス: https://arxiv .org/pdf/2305.15023.pdf

#要約: この文書では、効果的なソリューションを実現するための、新しくて費用対効果の高いソリューションを提案します。 LLM を VL (ビジュアル言語) タスクに適応させることは、MMA と呼ばれます。大規模なニューラルネットワークを使用して画像エンコーダと LLM を接続する代わりに、MMA はアダプタと呼ばれる軽量モジュールを採用して、LLM と VL タスク間のギャップを埋めると同時に、画像モデルと言語モデルの共同最適化も可能にします。同時に、MMA には、自然言語理解機能を損なうことなく、LLM がシングルモーダル命令とマルチモーダル命令を自動的に切り替えるのに役立つルーティングアルゴリズムも装備されています。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

## 推奨事項:

トレーニング時間は 71.4% 削減され、ストレージコストは 99.9% 節約されます。アモイ大学の指導調整優れた新しいソリューション MMA により、アルパカモデルはマルチモーダリティを実現できます

論文 6: mPLUG-2: テキスト全体にわたるモジュール化されたマルチモーダル基盤モデル、画像とビデオ

要約:

マルチモーダル基本モデルの場合、特定のタスクを処理できるだけでなく、シングルモーダルタスクを処理するときに優れたパフォーマンスを発揮できることを期待しています。 Aidamo Academy チームは、既存のモデルではモーダル連携とモーダルエンタングルメントの問題のバランスがうまく取れないことが多く、それがさまざまなシングルモーダルおよびクロスモーダルの下流タスクにおけるモデルのパフォーマンスを制限していることを発見しました。これに基づいて、DAMO アカデミーの研究者は、モジュール式ネットワーク構造設計を使用して、マルチモーダルモード間のコラボレーションとエンタングルメントの問題のバランスをとる mPLUG-2 を提案しました。 30/シングルモーダルタスクよりも、同じデータ量とモデルサイズで SOTA または同等の結果を達成し、VideoQA および VideoCaption で Flamingo、VideoCoca、GITv2 などの非常に大規模なモデルを上回り、絶対的な SOTA を達成します。また、mPLUG-Owl は Alibaba Damo Academy の mPLUG シリーズの最新作であり、mPLUG シリーズのモジュール型トレーニングのアイデアを継承し、LLM を大規模なマルチモーダルモデルにアップグレードしています。 mPLUG-2の研究論文がICML 2023に採択されました。

推奨: ICML 2023 | モジュラーのアイデアに基づいて、アリババ DAMO アカデミーはマルチモーダル基本モデル mPLUG-2

を提案しました# 論文 7: レコメンダーシステムの次のステップはどこですか? ID ベースとモダリティベースのレコメンダーモデルの再考

著者: Zheng Yuan、Fajie Yuan、など
#論文アドレス: https://arxiv.org/abs/2303.13835

##要約: この論文は、マルチモーダルレコメンデーションシステム MoRec が、レコメンデーションシステムの分野における IDRec の 10 年間の支配に終止符を打つと予想されるかどうかという潜在的な問題を調査します。綿密な調査を行っています。関連する結果は SIGIR 2023 に受理されました。次の図は、ネットワークアーキテクチャを示しています。

GPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成する

推奨事項: SIGIR 2023 | 推奨システムはどこへ行くのでしょうか? 従来の ID パラダイムはどうなるでしょうか?転覆されるのか？

以上がGPT-4 などの大規模モデル用に ChatGPT 詐欺を識別するための独自のツールを作成するの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事は51cto.comで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：RLHF の「RL」は必要ですか?バイナリクロスエントロピーを使用して LLM を直接微調整する人もいますが、その効果はより優れています。次の記事：RLHF の「RL」は必要ですか?バイナリクロスエントロピーを使用して LLM を直接微調整する人もいますが、その効果はより優れています。

続きを見る