>  기사  >  기술 주변기기  >  Moore Thread Kua'e 지능형 컴퓨팅 센터는 10,000개의 P 수준 부동 소수점 컴퓨팅 기능을 갖춘 카드 10,000개 규모로 확장되었습니다.

Moore Thread Kua'e 지능형 컴퓨팅 센터는 10,000개의 P 수준 부동 소수점 컴퓨팅 기능을 갖춘 카드 10,000개 규모로 확장되었습니다.

WBOY
WBOY원래의
2024-07-17 05:55:45362검색

7월 3일 본 홈페이지 소식에 따르면, 무어쓰레드(Moore Thread)는 자사의 AI 주력 제품인 KUAE 지능형 컴퓨팅 클러스터 솔루션이 현재 킬로카드 수준에서 1만 카드 규모로 확장됐다고 오늘 발표했다. Moore Thread Kua'e Wanka 지능형 컴퓨팅 클러스터는 모든 기능을 갖춘 GPU를 기반으로 Wanka 규모와 10,000 P 수준 부동 소수점 컴퓨팅 기능을 지원할 수 있는 국내 범용 가속 컴퓨팅 플랫폼을 만들기 위해 특별히 설계되었습니다. 수조 개의 매개변수와 디자인을 갖춘 대형 모델.

摩尔线程夸娥智算中心扩展至万卡规模,具备万 P 级浮点运算能力

Kuae Wanka 지능형 컴퓨팅 솔루션에는 다음과 같은 핵심 기능이 있습니다.

Wanka WanP: Kuae 지능형 컴퓨팅 클러스터는 10Exa-Flop에 도달하는 부동 소수점 컴퓨팅 성능으로 총 비디오 메모리 수준에 도달하는 10,000개 이상의 카드로 구성된 단일 클러스터 규모를 달성합니다. 용량, PB급 초고속 카드 간 상호 연결 총 대역폭, PB급 초고속 노드 상호 연결 총 대역폭입니다.

장기적이고 안정적인 훈련: Moore Thread는 Wanka 클러스터의 평균 문제 없는 실행 시간이 15일을 초과하고 최대 30일 동안 대형 모델의 안정적인 훈련을 달성할 수 있음을 자랑합니다. 평균 주간 훈련 효율은 99 이상입니다. %로 업계 평균을 훨씬 웃도는 수준입니다.

높은 MFU: Kua'e Wanka 클러스터는 대형 모델의 고효율 교육을 달성하기 위해 시스템 소프트웨어, 프레임워크, 알고리즘 및 기타 수준에서 일련의 최적화를 거쳤습니다(대형 모델의 교육 효율성을 평가하기 위한 공통 지표). ) 최대 60%까지 도달할 수 있습니다.

친환경: LLM, MoE, 멀티모달, Mamba 등과 같은 다양한 아키텍처 및 모드의 대규모 모델을 가속화할 수 있습니다. CUDA 기능 및 자동화된 마이그레이션 도구인 Musify와 완벽하게 호환되는 MUSA 프로그래밍 언어를 기반으로 하며 새 모델의 "Day0" 마이그레이션을 가속화합니다.

이 사이트는 Moore Thread가 세 가지 Wanka 클러스터 프로젝트, 즉:

  • Qinghai Zero Carbon Industrial Park Wanka 클러스터 프로젝트
  • Qinghai Plateau Kua'e Wanka 클러스터 프로젝트
  • Guangxi ASEAN Wanka 클러스터 프로젝트
를 수행한다는 사실을 알게 되었습니다.

위 내용은 Moore Thread Kua'e 지능형 컴퓨팅 센터는 10,000개의 P 수준 부동 소수점 컴퓨팅 기능을 갖춘 카드 10,000개 규모로 확장되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.