検索
ホームページテクノロジー周辺機器AIAIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

「深呼吸」 をプロンプトワードに追加すると、AI 大型モデルの数学スコアがさらに 8.4 ポイント増加します。

Google DeepMind チームの最新の発見は、この新しい「呪文」

(深呼吸する) と誰もがすでによく知っている を組み合わせて使用​​することです 」 step by step" (ステップバイステップで考えよう)、GSM8K データセットの大規模モデルのスコアは 71.8 ポイントから 80.2 ポイントに増加しました。

そして、この最も効果的なプロンプトワードは、

AI 自体によって発見されました。

深呼吸をすると冷却ファンの回転数が上がると冗談を言う人もいますAIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

人々は、新しく高給取りのエンジニアを雇った人も、仕事が長く続かない可能性があるので、落ち着いたほうがよいと考えています。AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

関連論文AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

「大きな言語モデルは最適化である」 Device》

、再びセンセーションを巻き起こしました。

具体的には、ビッグ モデルによって設計されたプロンプト ワードは、ビッグベンチ ハード データ セット上で最大 50% 改善できます。 AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

「モデルごとに最適なプロンプト ワードは異なる」AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

に注目する人もいます。

#この論文では、プロンプトワードデザインのタスクだけでなく、線形回帰や巡回セールスマン問題などの古典的な最適化タスクにおける大規模モデルの能力もテストされました

モデルが異なれば最適なプロンプトワードも異なります

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!最適化の問題はどこにでもあります。導関数と勾配に基づくアルゴリズムは強力なツールですが、実際のアプリケーションでは勾配が適用できない状況がよく発生します。

この問題を解決するために、チームはプロンプトワードによる最適化 (

PRO

mpting による

O

最適化) という新しいメソッド

OPRO

を開発しました。 。 最適化問題を形式的に定義してプログラムで解決するのではなく、自然言語を通じて最適化問題を記述し、新しい解を生成するために大規模なモデルを必要とします。大型モデル。

最適化の各ステップでは、以前に生成されたソリューションとスコアが入力として使用され、大規模モデルが新しいソリューションとスコアを生成して、それらをプロンプトの単語に追加します。次のステップで使用量を最適化します。

この論文では主に Google の AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

PaLM 2

と Bard の

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!text-bison

## を使用しています# バージョンは評価モデルとなります。

オプティマイザーとして、GPT-3.5 および GPT-4 を含む 4 つのモデルを使用します。研究結果は、異なるモデルがプロンプト ワード スタイルを設計し、適用可能なプロンプト ワード スタイルも異なることを示しています。 . GPT シリーズの AI によって設計された最適なプロンプト ワードは 「正しい答えが得られることを確認するために、段階的に解決しましょう。」

このプロンプトワードは APE 手法を使用して設計されました。この論文は ICLR 2023 に掲載され、GPT-3 (text-davinci-002) で人間が設計したバージョンを超えています。ステップバイステップ」。

Google ベースの PaLM 2 および Bard では、このベンチマーク テストでは、APE バージョンのパフォーマンスが人間のバージョンよりも悪かったです。

OPRO メソッドによって設計された新しいプロンプト ワードのうち、take a deep Breath」 「この質問を逆アセンブルします」 は PaLM で最もよく機能します。

Bard の大規模モデルのテキストバイソン バージョンでは、より詳細なプロンプト ワードを提供する傾向があります。

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

さらに、論文では次のことも示しています。大規模な数学的オプティマイザーとしてのモデルの可能性

線形回帰連続最適化問題の例。

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

#巡回セールスマン問題は、離散最適化問題の例として機能します。

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

#ヒントを与えるだけで、大規模なモデルは適切な解決策を見つけることができ、場合によっては手動で設計されたヒューリスティックと一致したり、それを超えたりすることもあります。

しかし、チームはまた、大規模なモデルはまだ従来の勾配ベースの最適化アルゴリズムを置き換えることはできないとも考えています。多数のノードを伴う巡回セールスマン問題など、問題の規模が大きい場合、OPRO 手法のパフォーマンスは理想的ではありません。

チームは、将来の改善に向けたアイデアを提案しました。彼らは、現在の大規模なモデルではエラー ケースを効果的に利用できず、単にエラー ケースを提供するだけでは大規模なモデルがエラーの原因を捉えることはできないと考えています。

有望な方向性は、エラー ケースに関するより豊富なフィードバックを組み込み、主要な特性の違いを要約することです。最適化軌道で生成された高品質キューと低品質キューの間。

この情報は、オプティマイザー モデルが過去に生成されたヒントをより効果的に改善するのに役立ち、ヒントの最適化に必要なサンプルの数をさらに削減できる可能性があります。

この論文では、多数の最適なヒント ワードが公開されています

この論文は Google と DeepMind の統合部門によるものですが、著者は主に元の Google Brain チームのメンバーであり、

Quoc Le が含まれます。周登永

同じ人はコーネル大学で博士号を取得した復丹の同窓生です。

チェンルン・ヤン、そして上海交通大学で博士号を取得して卒業した同窓生です。 .D. カリフォルニア大学バークレー校陈昕昀出身。

チームはまた、映画の推薦や映画の名前のパロディーなどの実用的なシナリオを含む、実験で得られた最良のプロンプトワードの多くを論文に提供しました。必要な場合は、

AIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!

論文アドレス: https://arxiv.org/abs/2309.03409 を参照してください。

以上がAIが独自にプロンプ​​トワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明!の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
革新を調理する:人工知能がフードサービスを変革する方法革新を調理する:人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドPythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル(VLM)の包括的なガイドビジョン言語モデル(VLM)の包括的なガイドApr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますMediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで:Walmartがファッションのトレンドを設定する前に設定します今週のAIで:Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会います生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ:科学者は紙をプラスチックに変えますプロトタイプ:科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由Apr 12, 2025 am 11:41 AM

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

DVWA

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

WebStorm Mac版

WebStorm Mac版

便利なJavaScript開発ツール