首頁  >  文章  >  科技週邊  >  微軟推出 XOT 技術,加強語言模式的推理能力

微軟推出 XOT 技術,加強語言模式的推理能力

王林
王林轉載
2023-11-17 17:45:201093瀏覽

微软推出 XOT 技术,加强语言模型的推理能力

11 月15 日訊息,微軟近日推出了名為「Everything of Thought」(XOT)的方法,靈感來自谷歌DeepMind 的AlphaZero,利用緊湊的神經網絡,來增強AI 模型推理能力。

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

#微軟和喬治亞理工學院、華東師範大學合作開發了這個演算法,整合了強化學習(reinforcement learning)和蒙特卡羅樹搜尋(MCTS) 能力,在複雜決策環境中,進一步提高解決問題的有效性。

本站注意:微軟研究團隊表示,XOT方法可以使語言模型在不熟悉的問題上擴展,在Game of 24、8-Puzzle和Pocket Cube的嚴格測試中有明顯的提升。結果顯示,XOT明顯優於其他方法,甚至解決了其他方法失敗的問題。然而,XOT並沒有達到100%的可靠性

微软推出 XOT 技术,加强语言模型的推理能力

##XOT 框架包括以下關鍵步驟:

    預訓練階段:MCTS 模組在特定任務上進行預訓練,以學習有關有效思維搜尋的領域知識。輕量級策略和價值網絡指導搜尋。思想搜尋: 在推理過程中,預先訓練的 MCTS 模組使用策略 / 價值網絡來有效地探索和產生 LLM 的思想軌跡。
  • 思想修正:LLM 檢視 MCTS 的想法並辨識任何錯誤。修正的想法是透過額外的 MCTS 模擬產生的。
  • LLM 推理: 將修改後的想法提供給 LLM 解決問題的最終提示。
本站在此附上論文 [

PDF] 地址,有興趣的使用者可以深入閱讀。

以上是微軟推出 XOT 技術,加強語言模式的推理能力的詳細內容。更多資訊請關注PHP中文網其他相關文章!

陳述:
本文轉載於:51cto.com。如有侵權,請聯絡admin@php.cn刪除