AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！-AI-php.cn

ホームページ

テクノロジー周辺機器

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

王林

Sep 22, 2023 pm 08:13 PM

aiモデル

「深呼吸」をプロンプトワードに追加すると、AI 大型モデルの数学スコアがさらに 8.4 ポイント増加します。

Google DeepMind チームの最新の発見は、この新しい「呪文」

(深呼吸する) と誰もがすでによく知っているを組み合わせて使用することです」 step by step" (ステップバイステップで考えよう)、GSM8K データセットの大規模モデルのスコアは 71.8 ポイントから 80.2 ポイントに増加しました。

そして、この最も効果的なプロンプトワードは、

AI 自体によって発見されました。

深呼吸をすると冷却ファンの回転数が上がると冗談を言う人もいます AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

人々は、新しく高給取りのエンジニアを雇った人も、仕事が長く続かない可能性があるので、落ち着いたほうがよいと考えています。 AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

関連論文 AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

「大きな言語モデルは最適化である」 Device》

、再びセンセーションを巻き起こしました。

具体的には、ビッグモデルによって設計されたプロンプトワードは、ビッグベンチハードデータセット上で最大 50% 改善できます。 AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

「モデルごとに最適なプロンプトワードは異なる」 AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

に注目する人もいます。

#この論文では、プロンプトワードデザインのタスクだけでなく、線形回帰や巡回セールスマン問題などの古典的な最適化タスクにおける大規模モデルの能力もテストされました

モデルが異なれば最適なプロンプトワードも異なります

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！最適化の問題はどこにでもあります。導関数と勾配に基づくアルゴリズムは強力なツールですが、実際のアプリケーションでは勾配が適用できない状況がよく発生します。

この問題を解決するために、チームはプロンプトワードによる最適化 (

PRO

mpting による

最適化) という新しいメソッド

OPRO

を開発しました。。最適化問題を形式的に定義してプログラムで解決するのではなく、自然言語を通じて最適化問題を記述し、新しい解を生成するために大規模なモデルを必要とします。大型モデル。

最適化の各ステップでは、以前に生成されたソリューションとスコアが入力として使用され、大規模モデルが新しいソリューションとスコアを生成して、それらをプロンプトの単語に追加します。次のステップで使用量を最適化します。

この論文では主に Google の AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

PaLM 2

と Bard の

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！ text-bison

## を使用しています# バージョンは評価モデルとなります。

オプティマイザーとして、GPT-3.5 および GPT-4 を含む 4 つのモデルを使用します。研究結果は、異なるモデルがプロンプトワードスタイルを設計し、適用可能なプロンプトワードスタイルも異なることを示しています。 . GPT シリーズの AI によって設計された最適なプロンプトワードは「正しい答えが得られることを確認するために、段階的に解決しましょう。」

このプロンプトワードは APE 手法を使用して設計されました。この論文は ICLR 2023 に掲載され、GPT-3 (text-davinci-002) で人間が設計したバージョンを超えています。ステップバイステップ」。

Google ベースの PaLM 2 および Bard では、このベンチマークテストでは、APE バージョンのパフォーマンスが人間のバージョンよりも悪かったです。

OPRO メソッドによって設計された新しいプロンプトワードのうち、「take a deep Breath」 と 「この質問を逆アセンブルします」 は PaLM で最もよく機能します。

Bard の大規模モデルのテキストバイソンバージョンでは、より詳細なプロンプトワードを提供する傾向があります。

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

さらに、論文では次のことも示しています。大規模な数学的オプティマイザーとしてのモデルの可能性

線形回帰連続最適化問題の例。

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

#巡回セールスマン問題は、離散最適化問題の例として機能します。

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

#ヒントを与えるだけで、大規模なモデルは適切な解決策を見つけることができ、場合によっては手動で設計されたヒューリスティックと一致したり、それを超えたりすることもあります。

しかし、チームはまた、大規模なモデルはまだ従来の勾配ベースの最適化アルゴリズムを置き換えることはできないとも考えています。多数のノードを伴う巡回セールスマン問題など、問題の規模が大きい場合、OPRO 手法のパフォーマンスは理想的ではありません。

チームは、将来の改善に向けたアイデアを提案しました。彼らは、現在の大規模なモデルではエラーケースを効果的に利用できず、単にエラーケースを提供するだけでは大規模なモデルがエラーの原因を捉えることはできないと考えています。

有望な方向性は、エラーケースに関するより豊富なフィードバックを組み込み、主要な特性の違いを要約することです。最適化軌道で生成された高品質キューと低品質キューの間。

この情報は、オプティマイザーモデルが過去に生成されたヒントをより効果的に改善するのに役立ち、ヒントの最適化に必要なサンプルの数をさらに削減できる可能性があります。

この論文では、多数の最適なヒントワードが公開されています

この論文は Google と DeepMind の統合部門によるものですが、著者は主に元の Google Brain チームのメンバーであり、

Quoc Le、が含まれます。周登永。

同じ人はコーネル大学で博士号を取得した復丹の同窓生です。

チェンルン・ヤン、そして上海交通大学で博士号を取得して卒業した同窓生です。 .D. カリフォルニア大学バークレー校陈昕昀出身。

チームはまた、映画の推薦や映画の名前のパロディーなどの実用的なシナリオを含む、実験で得られた最良のプロンプトワードの多くを論文に提供しました。必要な場合は、

AIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！

論文アドレス: https://arxiv.org/abs/2309.03409 を参照してください。

以上がAIが独自にプロンプトワードを設計、Google DeepMindは数学における「深呼吸」で大規模モデルを8ポイント向上できることが判明！の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

革新を調理する：人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル（VLM）の包括的なガイドApr 12, 2025 am 11:58 AM

導入鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか？あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか？

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで：Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

＃1 GoogleはAgent2Agentを起動しました物語：月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ：科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5％のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。しかし、助けが近づいています。エンジンのチーム

AIアナリストの台頭：これがAI革命で最も重要な仕事になる理由Apr 12, 2025 am 11:41 AM

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ

See all articles

ホットAIツール

ホットツール

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、