11 月15 日訊息,微軟近日推出了名為「Everything of Thought」(XOT)的方法,靈感來自谷歌DeepMind 的AlphaZero,利用緊湊的神經網絡,來增強AI 模型推理能力。
#微軟和喬治亞理工學院、華東師範大學合作開發了這個演算法,整合了強化學習(reinforcement learning)和蒙特卡羅樹搜尋(MCTS) 能力,在複雜決策環境中,進一步提高解決問題的有效性。
本站注意:微軟研究團隊表示,XOT方法可以使語言模型在不熟悉的問題上擴展,在Game of 24、8-Puzzle和Pocket Cube的嚴格測試中有明顯的提升。結果顯示,XOT明顯優於其他方法,甚至解決了其他方法失敗的問題。然而,XOT並沒有達到100%的可靠性
##XOT 框架包括以下關鍵步驟:以上是微軟推出 XOT 技術,加強語言模式的推理能力的詳細內容。更多資訊請關注PHP中文網其他相關文章!