ChatGPT剛發布的時候,給了我們太多的震撼,模型在對話上的表現實在是太像人類了,以至於產生了語言模型具有「思考能力」的錯覺。
不過在深入了解語言模型之後,研究人員們也逐漸發現了,基於高機率語言模式的再現與期望中的「通用人工智慧」還有很大差距。
在目前的大多數研究中,大型語言模型主要是在特定提示的引導下生成思維鏈來執行推理任務,沒有考慮人類的認知框架,使得語言模型解決複雜推理問題的能力與人類之間仍然存在著顯著的差距。
人類在面對複雜的推理難題時,通常會使用各種認知能力,並且需要與工具、知識和外部環境資訊的各個方面進行交互,那語言模型能不能模擬人類的思維流程來解決複雜問題呢?
答案當然可以!首個模擬人類認知處理框架的模型OlaGPT來了!
論文連結:https://arxiv.org/abs/2305.16334
程式碼連結:https://www.php.cn/link/ 73a1c863a54653d5e184b790fee14754
OlaGPT包括多個認知模組,包括注意力、記憶、推理、學習,以及相應的調度和決策機制;受人類主動學習啟發,框架中還包括一個學習單元來記錄之前的錯誤和專家意見,並動態參考來提升解決類似問題的能力。
文中也概述了人類解決問題的常見有效推理框架,並相應地設計了思維鏈(CoT)模板;也提出了一個全面的決策機制,可以最大限度地提高模型的準確性。
在多個推理資料集上進行了嚴格評估後得到的實驗結果表明,OlaGPT超越了先前最先進的基準,證明了其有效性。
模擬人類的認知
目前的語言模型與期望中的通用人工智慧還有很大差距,主要表現為:
#1. 在某些情況下生成的內容毫無意義,或者偏離了人類的價值偏好,甚至會給出一些非常危險的建議,目前的解決方案是引入人類反饋的強化學習(RLHF)對模型輸出進行排序。
2. 語言模型的知識僅限於在訓練資料中明確提到的概念和事實。
在面對複雜問題時,語言模型也無法像人類一樣適應變化的環境、利用現有的知識或工具、反思歷史教訓、分解問題,以及使用人類在長期進化中總結出的思考模式(如類比、歸納推理和演繹推理等)來解決問題。
不過,讓語言模型模擬人腦處理問題的過程還有許多系統難題:
1. 如何系統地模仿和編碼人類認知框架中的主要模組,同時以可實現的方式根據人類的通用推理模式進行調度?
2. 如何引導語言模型像人類一樣進行主動學習,即從歷史錯誤或專家對困難問題的解決方案中學習和發展?
雖然重新訓練模型對修正後的答案進行編碼可能是可行的,但顯然成本很高且不靈活。
3. 如何讓語言模型靈活地利用人類演化出的各種思考模式,進而提升其推理表現?
一個固定的、通用的思考模式很難適應不同問題,就像人類在面對不同類型的問題時,通常會靈活地選擇不同的思考方式,如類比推理、演繹推理等。
OlaGPT
OlaGPT是一個模擬人類思維的問題解決框架,可以增強大型語言模型的能力。
OlaGPT借鑒了認知架構(cognitive architecture)理論,把認知框架的核心能力建模為注意力(attention)、記憶(memory)、學習(learning)、推理(reasoning)、行動選擇(action selction)。
研究人員根據具體實現的需要對該框架進行了微調,並提出了一個適合語言模型解決複雜問題的流程,具體包括六個模組:意圖增強模組(注意力)、記憶模組(記憶)、主動學習模組(學習)、推理模組(推理)、控制器模組(行動選擇)和投票模組。
意圖增強(Intention Enhance)
#注意力是人類認知的一個重要組成部分,識別出相關的資訊並過濾掉不相關的數據。
同樣地,研究人員為語言模型設計了相應的注意力模組,即意圖增強,旨在提取最相關的信息,並在用戶輸入和模型的語言模式之間建立更強的關聯,可以被看作是一個從使用者表達習慣到模型表達習慣的最佳化轉換器。
首先透過特定的提示詞提前獲得LLMs的問題類型,然後重構提問的方式。
例如在問題的開頭加上一句「Now give you the XX(問題類型),question and choices:」;為了方便分析,提示中還需要加入「 The answer must end with JSON format: Answer: one of options[A,B,C,D,E].”
從結果可以看出:
1. SC(self-consistency)的性能優於GPT-3.5-turbo,表明在一定程度上採用集成方法確實有助於提高大規模模型的有效性。
2. 文中提出方法的表現超過了SC,在一定程度上證明了思考模板策略的有效性。
不同思維模板的答案表現出相當大的差異,在不同的思維模板下進行投票,最終會比簡單地進行多輪投票產生更好的結果。
3. 不同思考模板的效果是不同的,循序漸進的解決方案可能更適合推理型問題。
4. 主動學習模組的表現明顯優於零樣本方法。
把具有挑戰性的案例當作筆記庫的一部分,利用隨機、檢索和組合清單可以提高效能,這是一種可行的策略。
5. 不同的檢索方案在不同的資料集上有不同的效果,總的來說,組合(combine)策略的效果更好。
6. 文中方法明顯優於其他方案,這得益於整體框架的合理設計,包括主動學習模組的有效設計;思維模板實現了對不同模型的適應,不同思維模板下的結果是不同的;控制器模組起到了很好的控製作用,選擇了與所需內容比較匹配的內容;投票模組設計的不同思維模板的集成方式是有效的。
參考資料:
https://www.php.cn/link/73a1c863a54653d5e184b790fee14754
#以上是首個模擬人類認知的思考架構OlaGPT:六大模組增強語言模型,推理能力最高提升85%的詳細內容。更多資訊請關注PHP中文網其他相關文章!

使用Gemma範圍探索語言模型的內部工作 了解AI語言模型的複雜性是一個重大挑戰。 Google發布的Gemma Scope是一種綜合工具包,為研究人員提供了一種強大的探索方式

解鎖業務成功:成為商業智能分析師的指南 想像一下,將原始數據轉換為驅動組織增長的可行見解。 這是商業智能(BI)分析師的力量 - 在GU中的關鍵作用

SQL的Alter表語句:動態地將列添加到數據庫 在數據管理中,SQL的適應性至關重要。 需要即時調整數據庫結構嗎? Alter表語句是您的解決方案。本指南的詳細信息添加了Colu

介紹 想像一個繁華的辦公室,兩名專業人員在一個關鍵項目中合作。 業務分析師專注於公司的目標,確定改進領域,並確保與市場趨勢保持戰略一致。 simu

Excel 數據計數與分析:COUNT 和 COUNTA 函數詳解 精確的數據計數和分析在 Excel 中至關重要,尤其是在處理大型數據集時。 Excel 提供了多種函數來實現此目的,其中 COUNT 和 COUNTA 函數是用於在不同條件下統計單元格數量的關鍵工具。雖然這兩個函數都用於計數單元格,但它們的設計目標卻針對不同的數據類型。讓我們深入了解 COUNT 和 COUNTA 函數的具體細節,突出它們獨特的特性和區別,並學習如何在數據分析中應用它們。 要點概述 理解 COUNT 和 COU

Google Chrome的AI Revolution:個性化和高效的瀏覽體驗 人工智能(AI)正在迅速改變我們的日常生活,而Google Chrome正在領導網絡瀏覽領域的負責人。 本文探討了興奮

重新構想影響:四倍的底線 長期以來,對話一直以狹義的AI影響來控制,主要集中在利潤的最低點上。但是,更全面的方法認識到BU的相互聯繫

事情正穩步發展。投資投入量子服務提供商和初創企業表明,行業了解其意義。而且,越來越多的現實用例正在出現以證明其價值超出


熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

禪工作室 13.0.1
強大的PHP整合開發環境

WebStorm Mac版
好用的JavaScript開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

DVWA
Damn Vulnerable Web App (DVWA) 是一個PHP/MySQL的Web應用程序,非常容易受到攻擊。它的主要目標是成為安全專業人員在合法環境中測試自己的技能和工具的輔助工具,幫助Web開發人員更好地理解保護網路應用程式的過程,並幫助教師/學生在課堂環境中教授/學習Web應用程式安全性。 DVWA的目標是透過簡單直接的介面練習一些最常見的Web漏洞,難度各不相同。請注意,該軟體中

Dreamweaver Mac版
視覺化網頁開發工具