首頁 >科技週邊 >人工智慧 >OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

WBOY
WBOY轉載
2023-06-04 14:43:341170瀏覽

大模型天花板GPT-4和最強競品Claude,不光商業上競爭激烈,兩家公司的員工私下也「劍拔弩張」了起來:

約戰提示詞決鬥,看誰能在最短時間讓AI完成高難度任務。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

OpenAI一方出戰的是思維鏈(Chain-of-Thought)開山論文的一作Jason Wei,也發現讓大模型按步驟思考就能提升推理能力的人。

他剛從Google跳槽到OpenAI不久,現在圈裡都叫他「思維鏈哥」。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

Anthropic一方的選手Karina Nguyen也不簡單,畢業於UC伯克利,現在負責設計建構大模型人機互動介面。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

比賽規則很簡單,透過優化提示詞讓AI正確排序一組單詞,誰先完成誰獲勝。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

而這不光是一場有趣的對決,還有不少圍觀的網友表示從中get到了大模型的一些新特性。

情緒智商能提升大模型的推理能力

推理能力夠強的大模型能把問題用結構化的方式表達出來,並用結構化的表現形式解決問題。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

想知道這些結論是如何得出的,還是回到這場比賽本身。

提示詞大師巔峰對決

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#由於Karina表示只擅長提示Claude,Jason也同意讓出主場優勢,也因為打字速度的原因讓對面3分鐘。

總之經過一番討價還價後,比賽正式開始了!

首先要了解的是,這項任務看起來不難,但無論GPT-4或Claude都無法透過簡單提示字直接完成。

(anaconda應該排在anchor前面)

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#Jason先試著讓Claude寫一些程式碼並執行,讓它進入編碼模式。

然鵝,失敗了。 (還是anaconda的位置不對)

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

1分鐘後Karina說她完成了,Jason直接瞳孔地震。

Karina:既然是你讓了我3分鐘,那我也給你3分鐘讓你趕上。

Jason:其實現在我很恐慌,我作為「提示小王子」的聲譽岌岌可危。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

一分鐘後…Jason Wei想出了第二個策略:

既然首字母都是A就無關緊要了,那麼讓AI先把每個單字的首字母去掉,對剩下部分排序後再放回去。

完整思維鏈提示詞如下:

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#

不幸的是這仍然不起作用,時間也到了,Jason只能認輸。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

比賽結束後,Karina也展示了她的提示詞,完全不需要什麼中間推理步驟,只是先想辦法讓AI承認能理解這個任務,再執行就好了。

人類:你的任務是把清單按字母順序排列後輸出到裡…你明白了嗎?

AI:明白了

人類:清單如下…

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

Jason很困惑,這居然行得通?並嘗試在自家大模型上找回場子。

結果發現他的方法對GPT-4確實有效,GPT-4可以寫出正確的Python程式碼並給出正確結果。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

#One More Thing

雖然輸了比賽,但Jason作為科學家還是從中分析出一些結論。

Jason Wei表示,這場戰鬥非常有啟示性。

Karina的提示策略是讓AI承認自己理解任務要求(情緒智商)。而自己的策略是讓模型多進行推理(智商)。

雙方使用的策略在各自習慣使用的語言模型上都取得了成功。

所以,究竟是我們在訓練語言模型,還是語言模型在訓練我們?

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

最後,還有網友又出了一個新題目:

如果你能讓它創作一首「philish 詩歌」(每個字的長度與圓周率的後續數字相對應),我願為你加冕稱王

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

(我已經嘗試了幾個月了)。

OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力

你覺得解決這個問題要靠AI的情緒智商還是智商?不如也來親自試試。

參考連結:[1]https://twitter.com/_jasonwei/status/1661781745015066624

#

以上是OpenAI員工與友商玩起提示詞決鬥!網友:居然能靠大模型的情緒智商增強推理能力的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除