OpenAI似乎找到了解決生成式人工智慧「一本正經胡說八道」的辦法。
5月31日,OpenAI在其官網宣布,已經訓練了一個模型,能夠有助於消除生成式AI常見的「幻覺」和其他常見問題。
OpenAI表示,可以訓練獎勵模型來檢測幻覺,獎勵模型又分為結果監督(根據最終結果提供回饋)或過程監督(為思考鏈中的每個步驟提供回饋)模型。
也就是說,過程監督獎勵推理的每個正確步驟,而結果監督只是簡單地獎勵正確的答案。
OpenAI表示,相較之下,過程監督有一個重要的優勢——它直接訓練模型以產生由人類認可的思維鏈:
過程監督與結果監督相比有幾個一致性優勢。每個步驟都得到精確監督,因此它獎勵遵循一致思維鏈模型的行為。
過程監督也更有可能產生可解釋的推理,因為它鼓勵模型遵循人類批准的過程
結果監督可能會獎勵一個不一致的過程,而且通常更難審查。
OpenAI在數學資料集上測試了這兩種模型,發現過程監督方法導致了「顯著更好的性能」。
但需要注意的是,到目前為止,過程監督方法僅在數學領域進行了測試,並且需要更多的工作來觀察它如何更普遍地執行。
此外,OpenAI並沒有說明這項研究需要多長時間才能應用在ChatGPT,它仍然處於研究階段。
雖然最初的結果是好的,但OpenAI確實提到,更安全的方法會產生降低的效能,稱為對齊稅(alignment tax)。
目前的結果顯示,在處理數學問題時,過程監督不會產生對齊稅,但在一般的資訊上的情況尚不知曉。
生成式AI的「幻覺」
生成式AI問世以來,圍繞其編造假訊息、「產生幻覺」的指控從未消失,這也是目前生成式AI模型最大的問題之一。
今年2月,Google為應對微軟資助下ChatGPT,倉促推出了聊天機器人Bard,結果卻被發現在演示中出現了常識性錯誤,導致谷歌股價大跌。
導致AI出現幻覺的原因有很多種,輸入資料欺騙AI程式進行錯誤分類是其中一種。
例如,開發人員使用資料(如圖像、文字或其他類型)來訓練人工智慧系統,如果資料被改變或扭曲,應用程式將以不同的方式解釋輸入並產生不正確的結果。
幻覺可能會出現在像ChatGPT這樣的基於語言的大型模型中,這是由於不正確的轉換器解碼,導致語言模型可能會產生一個沒有不合邏輯或模糊的故事或敘述。
以上是解決AI落地的最大障礙,OpenAI找到方法了?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

軟AI(被定義為AI系統,旨在使用近似推理,模式識別和靈活的決策執行特定的狹窄任務 - 試圖通過擁抱歧義來模仿類似人類的思維。 但是這對業務意味著什麼

答案很明確 - 只是雲計算需要向雲本地安全工具轉變,AI需要專門為AI獨特需求而設計的新型安全解決方案。 雲計算和安全課程的興起 在

企業家,並使用AI和Generative AI來改善其業務。同時,重要的是要記住生成的AI,就像所有技術一樣,都是一個放大器 - 使得偉大和平庸,更糟。嚴格的2024研究O

解鎖嵌入模型的力量:深入研究安德魯·NG的新課程 想像一個未來,機器可以完全準確地理解和回答您的問題。 這不是科幻小說;多虧了AI的進步,它已成為R

大型語言模型(LLM)和不可避免的幻覺問題 您可能使用了諸如Chatgpt,Claude和Gemini之類的AI模型。 這些都是大型語言模型(LLM)的示例,在大規模文本數據集上訓練的功能強大的AI系統

最近的研究表明,根據行業和搜索類型,AI概述可能導致有機交通下降15-64%。這種根本性的變化導致營銷人員重新考慮其在數字可見性方面的整個策略。 新的

埃隆大學(Elon University)想像的數字未來中心的最新報告對近300名全球技術專家進行了調查。由此產生的報告“ 2035年成為人類”,得出的結論是,大多數人擔心AI系統加深的採用


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PhpStorm Mac 版本
最新(2018.2.1 )專業的PHP整合開發工具

WebStorm Mac版
好用的JavaScript開發工具

Atom編輯器mac版下載
最受歡迎的的開源編輯器

Dreamweaver Mac版
視覺化網頁開發工具