>기술 주변기기 >일체 포함 >Microsoft는 언어 모델의 추론 기능을 향상시키기 위해 XOT 기술을 출시합니다.

Microsoft는 언어 모델의 추론 기능을 향상시키기 위해 XOT 기술을 출시합니다.

王林
王林앞으로
2023-11-17 17:45:201157검색

微软推出 XOT 技术,加强语言模型的推理能力

11월 15일 뉴스, Microsoft는 최근 Google DeepMind의 AlphaZero에서 영감을 받아 "Everything of Thought"(XOT)라는 방법을 출시했습니다. 컴팩트한 신경망을 사용하여 AI 모델의 추론 기능을 향상시킵니다.

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

微软推出 XOT 技术,加强语言模型的推理能力

Microsoft는 Georgia Institute of Technology 및 East China Normal University와 협력하여 강화 학습(강화 학습)과 MCTS(Monte Carlo Tree Search) 기능을 통합하여 복잡한 환경에서 수행하는 이 알고리즘을 개발했습니다. 의사결정 환경을 개선하여 문제 해결의 효율성을 더욱 향상시킵니다.

이 사이트의 참고 사항: Microsoft 연구팀은 XOT 방법이 익숙하지 않은 문제에 대한 언어 모델을 확장할 수 있으며 Game of 24, 8-Puzzle 및 Pocket Cube의 엄격한 테스트에서 확실한 개선을 이뤘다고 밝혔습니다. 결과는 XOT가 다른 방법보다 훨씬 우수하며 다른 방법이 실패하는 문제도 해결한다는 것을 보여줍니다. 그러나 XOT는 100% 신뢰성을 달성하지 못합니다

微软推出 XOT 技术,加强语言模型的推理能力

XOT 프레임워크에는 다음과 같은 주요 단계가 포함됩니다.

  • 사전 훈련 단계: MCTS 모듈은 효과적인 사고 검색에 대한 도메인 지식을 배우기 위해 특정 작업에 대해 사전 훈련됩니다. 경량 전략과 가치 네트워크가 검색을 안내합니다. 아이디어 검색: 추론 중에 사전 훈련된 MCTS 모듈은 정책/가치 네트워크를 사용하여 LLM의 아이디어 궤적을 효율적으로 탐색하고 생성합니다.
  • 사고 수정: LLM은 MCTS의 아이디어를 검토하고 오류를 식별합니다. 추가적인 MCTS 시뮬레이션을 통해 개정 아이디어가 도출되었습니다.
  • LLM 추론: 문제 해결을 위해 LLM에 수정된 아이디어를 제공하기 위한 마지막 팁입니다.

이 웹사이트에는 논문 [PDF] 주소가 첨부되어 있으니 관심 있는 사용자는 자세히 읽어보실 수 있습니다.

위 내용은 Microsoft는 언어 모델의 추론 기능을 향상시키기 위해 XOT 기술을 출시합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제