検索
ホームページテクノロジー周辺機器AIOpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

大型モデルのシーリング GPT-4 と最強の競合他社であるクロードは、ビジネス面で熾烈な競争を繰り広げているだけでなく、両社の従業員はプライベートでも「互いに戦争」しています:

決闘をする誰が勝つかを判断するための即効性のある言葉で、AI に難しいタスクを最短時間で完了させましょう。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

OpenAI 側では、先駆的な論文「Chain-of-Thought」の著者であるジェイソン・ウェイ氏も、大規模なモデルがステップに従うことができることを発見しました。考えるだけで推理力が向上する人。

彼は Google から OpenAI に転職したばかりで、今ではサークルの誰もが彼のことを「Brother Thinking Chain」と呼んでいます。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

人間プレイヤーのカリーナ グエンも単純ではありません。彼女はカリフォルニア大学バークレー校を卒業し、現在は大規模な人間とコンピューターのインタラクションの設計と構築を担当しています。インターフェース。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

コンテストのルールは非常にシンプルで、AI はプロンプトの単語を最適化することで、単語のグループを正しく並べ替えることができます。それが最初に勝ちます。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

これは興味深い対決だったというだけでなく、視聴した多くのネチズンは、この大型モデルの新機能をいくつか得られたと述べました。

心の知能指数は大規模モデルの推論能力を向上させることができます

十分に強力な推論能力を備えた大規模モデルは、構造化された方法で問題を表現し、構造化された式を使用して問題を解決できます。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

これらの結論にどのように到達したかを知りたい、またはゲーム自体に戻りたい。

プロンプトワードマスターの頂上対決

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

カリーナがクロードを促すことだけが得意だと言ったので、ジェイソンも同意しました。ホームコートアドバンテージを上げます。タイピング速度の関係で、相手に 3 分かかるようにしてください。

つまり、いくつかの交渉の後、正式にゲームが開始されました。

最初に理解すべきことは、このタスクは難しくないようですが、GPT-4 もクロードも単純なプロンプトの言葉だけでは直接完了できないということです。

(anaconda はアンカーの前にランク付けされる必要があります)

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

#ジェイソンはまずクロードにコードを書かせ、それを実行して取得しようとします。コーディングモデルに取り込みます。

ラングース、失敗しました。 (アナコンダはまだ間違った位置にいます)

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

1分後、カリーナが「もう終わった」と言うと、すぐにジェイソンの瞳孔が震えました。

カリーナ: 3 分与えられたので、追いつくために 3 分与えます。

ジェイソン: 私は今、実はパニックに陥っています。「ヒントの星の王子様」としての私の評判が危険にさらされています。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

1分後...ジェイソン・ウェイは2番目の戦略を思いつきました:

イニシャルがすべてAなので、それは関係ありません 緊急の場合は、AI に各単語の最初の文字を削除させ、残りの部分を並べ替えて元に戻します。

完全な思考連鎖プロンプトワードは次のとおりです:

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

残念ながら、これはまだ機能せず、時間切れで、ジェイソンは敗北を認めざるを得ませんでした。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

競技終了後、カリーナさんも即答した言葉を披露しました。途中の推論ステップはまったく必要ありません。ただ、 AIにそれを認めさせる方法は、タスクを理解して実行するだけです。

人間: あなたの仕事はリストをアルファベット順に並べ替えて出力することです...わかりますか?

AI: わかりました

人間: リストは次のとおりです...

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

ジェイソンは混乱しました、これは本当にうまくいきますか?そして、自分の大きなモデルの場所を見つけてみてください。

彼の方法は GPT-4 に対して実際に有効であり、正しい Python コードを記述して正しい結果を与えることができることがわかりました。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

One More Thing

試合には負けましたが、しかし、ジェイソンは科学者として、そこから得られたいくつかの結論を分析しました。

ジェイソン・ウェイは、この戦いは非常に示唆に富んだものだったと述べました。

カリーナの即時戦略は、AI にタスクの要件 (心の知能) を理解していると認めさせることです。そして私自身の戦略は、モデルにさらに推論 (IQ) を行わせることです。

双方が使用した戦略は、使い慣れた言語モデルで成功を収めています。

では、私たちは言語モデルをトレーニングしているのでしょうか、それとも言語モデルが私たちをトレーニングしているのでしょうか?

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

最後に、一部のネチズンが新しい質問を思いつきました。

もしできるならあなたがそれに「哲学的な詩」(各単語の長さが円周率の次の数字に対応する)を作らせたら、私はあなたに王の栄冠を与えるでしょう

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

(私はずっと努力してきました)数か月間)。

OpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができます

この問題の解決策は AI の EQ または IQ に依存すると思いますか?ぜひ一度試してみてはいかがでしょうか。

参考リンク: [1]https://twitter.com/_jasonwei/status/1661781745015066624

以上がOpenAI の従業員は友達と即席ワード対決をプレイします!ネチズン: 大型モデルの心の知能指数に頼ることで、実際に推論能力を高めることができますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
迅速なエンジニアリングにおける思考のグラフは何ですか迅速なエンジニアリングにおける思考のグラフは何ですかApr 13, 2025 am 11:53 AM

導入 迅速なエンジニアリングでは、「思考のグラフ」とは、グラフ理論を使用してAIの推論プロセスを構造化および導く新しいアプローチを指します。しばしば線形sを含む従来の方法とは異なります

Genaiエージェントとの電子メールマーケティングを組織に最適化しますGenaiエージェントとの電子メールマーケティングを組織に最適化しますApr 13, 2025 am 11:44 AM

導入 おめでとう!あなたは成功したビジネスを運営しています。ウェブページ、ソーシャルメディアキャンペーン、ウェビナー、会議、無料リソース、その他のソースを通じて、毎日5000の電子メールIDを収集します。次の明白なステップはです

Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apache Pinotによるリアルタイムアプリのパフォーマンス監視Apr 13, 2025 am 11:40 AM

導入 今日のペースの速いソフトウェア開発環境では、最適なアプリケーションパフォーマンスが重要です。応答時間、エラーレート、リソース利用などのリアルタイムメトリックを監視することで、メインに役立ちます

ChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますChatGptは10億人のユーザーにヒットしますか? 「わずか数週間で2倍になりました」とOpenai CEOは言いますApr 13, 2025 am 11:23 AM

「ユーザーは何人いますか?」彼は突き出した。 「私たちが最後に言ったのは毎週5億人のアクティブであり、非常に急速に成長していると思います」とアルトマンは答えました。 「わずか数週間で2倍になったと言った」とアンダーソンは続けた。 「私はそのprivと言いました

PIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaPIXTRAL -12B:Mistral AI'の最初のマルチモーダルモデル-Analytics VidhyaApr 13, 2025 am 11:20 AM

導入 Mistralは、最初のマルチモーダルモデル、つまりPixtral-12B-2409をリリースしました。このモデルは、Mistralの120億個のパラメーターであるNemo 12bに基づいて構築されています。このモデルを際立たせるものは何ですか?これで、画像とTexの両方を採用できます

生成AIアプリケーションのエージェントフレームワーク - 分析Vidhya生成AIアプリケーションのエージェントフレームワーク - 分析VidhyaApr 13, 2025 am 11:13 AM

クエリに応答するだけでなく、情報を自律的に収集し、タスクを実行し、テキスト、画像、コードなどの複数のタイプのデータを処理するAIを搭載したアシスタントがいることを想像してください。未来的に聞こえますか?これでa

金融セクターにおける生成AIの応用金融セクターにおける生成AIの応用Apr 13, 2025 am 11:12 AM

導入 金融業界は、効率的な取引と信用の可用性を促進することにより経済成長を促進するため、あらゆる国の発展の基礎となっています。取引の容易さとクレジット

オンライン学習とパッシブアグレッシブアルゴリズムのガイドオンライン学習とパッシブアグレッシブアルゴリズムのガイドApr 13, 2025 am 11:09 AM

導入 データは、ソーシャルメディア、金融取引、eコマースプラットフォームなどのソースから前例のないレートで生成されています。この連続的な情報ストリームを処理することは課題ですが、

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

SecLists

SecLists

SecLists は、セキュリティ テスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティ テスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティ テストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジング ペイロード、機密データ パターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテスト マシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。