搜尋
首頁科技週邊人工智慧OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

大模型天花板GPT-4和最強競品Claude,不光商業上競爭激烈,兩家公司的員工私下也「劍拔弩張」了起來:

約戰提示詞決鬥,看誰能在最短時間讓AI完成高難度任務。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

OpenAI一方出戰的是思維鏈(Chain-of-Thought)開山論文的一作Jason Wei,也發現讓大模型按步驟思考就能提升推理能力的人。

他剛從Google跳槽到OpenAI不久,現在圈裡都叫他「思維鏈哥」。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

Anthropic一方的選手Karina Nguyen也不簡單,畢業於UC伯克利,現在負責設計建構大模型人機互動介面。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

比賽規則很簡單,透過優化提示詞讓AI正確排序一組單詞,誰先完成誰獲勝。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

而這不光是一場有趣的對決,還有不少圍觀的網友表示從中get到了大模型的一些新特性。

情緒智商能提升大模型的推理能力

推理能力夠強的大模型能把問題用結構化的方式表達出來,並用結構化的表現形式解決問題。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

想知道這些結論是如何得出的,還是回到這場比賽本身。

提示詞大師巔峰對決

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#由於Karina表示只擅長提示Claude,Jason也同意讓出主場優勢,也因為打字速度的原因讓對面3分鐘。

總之經過一番討價還價後,比賽正式開始了!

首先要了解的是,這項任務看起來不難,但無論GPT-4或Claude都無法透過簡單提示字直接完成。

(anaconda應該排在anchor前面)

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#Jason先試著讓Claude寫一些程式碼並執行,讓它進入編碼模式。

然鵝,失敗了。 (還是anaconda的位置不對)

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

1分鐘後Karina說她完成了,Jason直接瞳孔地震。

Karina:既然是你讓了我3分鐘,那我也給你3分鐘讓你趕上。

Jason:其實現在我很恐慌,我作為「提示小王子」的聲譽岌岌可危。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

一分鐘後…Jason Wei想出了第二個策略:

既然首字母都是A就無關緊要了,那麼讓AI先把每個單字的首字母去掉,對剩下部分排序後再放回去。

完整思維鏈提示詞如下:

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#

不幸的是這仍然不起作用,時間也到了,Jason只能認輸。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

比賽結束後,Karina也展示了她的提示詞,完全不需要什麼中間推理步驟,只是先想辦法讓AI承認能理解這個任務,再執行就好了。

人類:你的任務是把清單按字母順序排列後輸出到裡…你明白了嗎?

AI:明白了

人類:清單如下…

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

Jason很困惑,這居然行得通?並嘗試在自家大模型上找回場子。

結果發現他的方法對GPT-4確實有效,GPT-4可以寫出正確的Python程式碼並給出正確結果。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#One More Thing

雖然輸了比賽,但Jason作為科學家還是從中分析出一些結論。

Jason Wei表示,這場戰鬥非常有啟示性。

Karina的提示策略是讓AI承認自己理解任務要求(情緒智商)。而自己的策略是讓模型多進行推理(智商)。

雙方使用的策略在各自習慣使用的語言模型上都取得了成功。

所以,究竟是我們在訓練語言模型,還是語言模型在訓練我們?

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

最後,還有網友又出了一個新題目:

如果你能讓它創作一首「philish 詩歌」(每個字的長度與圓周率的後續數字相對應),我願為你加冕稱王

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

(我已經嘗試了幾個月了)。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

你覺得解決這個問題要靠AI的情緒智商還是智商?不如也來親自試試。

參考連結:[1]https://twitter.com/_jasonwei/status/1661781745015066624

#

以上是OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述
本文轉載於:51CTO.COM。如有侵權,請聯絡admin@php.cn刪除
外推指南外推指南Apr 15, 2025 am 11:38 AM

介紹 假設有一個農民每天在幾週內觀察農作物的進展。他研究了增長率,並開始思考他的植物在幾週內可以生長的高度。從Th

軟AI的興起及其對當今企業的意義軟AI的興起及其對當今企業的意義Apr 15, 2025 am 11:36 AM

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

為AI前沿的不斷發展的安全框架為AI前沿的不斷發展的安全框架Apr 15, 2025 am 11:34 AM

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

生成AI的3種方法放大了企業家:當心平均值!生成AI的3種方法放大了企業家:當心平均值!Apr 15, 2025 am 11:33 AM

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

Andrew Ng的新簡短課程Andrew Ng的新簡短課程Apr 15, 2025 am 11:32 AM

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大語言模型(LLM)中的幻覺是不可避免的嗎?大語言模型(LLM)中的幻覺是不可避免的嗎?Apr 15, 2025 am 11:31 AM

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

60%的問題 -  AI搜索如何消耗您的流量60%的問題 - AI搜索如何消耗您的流量Apr 15, 2025 am 11:28 AM

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心麻省理工學院媒體實驗室將人類蓬勃發展成為AI R&D的核心Apr 15, 2025 am 11:26 AM

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用

See all articles

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
4 週前By尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
4 週前By尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
1 個月前By尊渡假赌尊渡假赌尊渡假赌

熱工具

VSCode Windows 64位元 下載

VSCode Windows 64位元 下載

微軟推出的免費、功能強大的一款IDE編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

Dreamweaver Mac版

Dreamweaver Mac版

視覺化網頁開發工具

mPDF

mPDF

mPDF是一個PHP庫,可以從UTF-8編碼的HTML產生PDF檔案。原作者Ian Back編寫mPDF以從他的網站上「即時」輸出PDF文件,並處理不同的語言。與原始腳本如HTML2FPDF相比,它的速度較慢,並且在使用Unicode字體時產生的檔案較大,但支援CSS樣式等,並進行了大量增強。支援幾乎所有語言,包括RTL(阿拉伯語和希伯來語)和CJK(中日韓)。支援嵌套的區塊級元素(如P、DIV),

Atom編輯器mac版下載

Atom編輯器mac版下載

最受歡迎的的開源編輯器