>기술 주변기기 >일체 포함 >세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다.

세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다.

PHPz
PHPz앞으로
2024-05-07 16:13:20945검색

기존 컴퓨팅을 능가할 뿐만 아니라 더 낮은 비용으로 더 효율적인 성능을 달성하는 인공 지능 모델을 상상해 보세요. 이것은 공상과학 소설이 아닙니다. DeepSeek-V2[1], 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다.

全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一

DeepSeek-V2는 경제적인 훈련과 효율적인 추론이라는 특징을 지닌 전문가(MoE) 언어 모델의 강력한 혼합입니다. 이는 236B 매개변수로 구성되며, 그 중 21B는 각 태그를 활성화하는 데 사용됩니다. DeepSeek 67B와 비교하여 DeepSeek-V2는 더 강력한 성능을 제공하는 동시에 훈련 비용을 42.5% 절감하고 KV 캐시를 93.3% 줄이며 최대 생성 처리량을 5.76배로 늘립니다.

DeepSeek은 일반 인공지능(AGI)의 본질을 탐구하는 회사로 연구, 엔지니어링, 비즈니스를 통합하는 데 전념하고 있습니다.

DeepSeek-V2의 포괄적인 기능

현재 주류 대형 모델 목록에서 DeepSeek-V2는 우수한 성능을 발휘합니다.

  • 중국의 포괄적인 기능(AlignBench) 오픈 소스 모델 중 가장 강력한 모델: GPT-4-Turbo 포함, Wenxin 4.0 등 폐쇄 소스 모델은 평가에서 동급
  • 영어 종합 능력(MT-Bench)이 1위 : 영어 종합 능력(MT-Bench)은 가장 강력한 오픈 소스 모델과 동급 LLaMA3-70B, MoE 오픈소스 최강 모델 Mixtral 8x22B를 능가
  • 지식, 수학, 추론, 프로그래밍 및 기타 목록에서 상위권을 차지
  • 128K 컨텍스트 창 지원

全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一

새로운 모델 구조

언제 AI의 잠재력은 끊임없이 탐구되고 있습니다. 파고들면서 우리는 묻지 않을 수 없습니다: 지능적 진보를 촉진하는 열쇠는 무엇입니까? DeepSeek-V2가 해답을 드립니다 - 혁신적인 아키텍처와 비용 효율성의 완벽한 조합.

"DeepSeek-V2는 개선된 버전입니다. 총 매개변수가 236B이고 활성화가 21B로 마침내 70B~110B Dense 모델의 성능에 도달했습니다. 동시에 메모리 소비는 1/5~1/에 불과합니다. 8카드 H800 머신에서는 초당 100,000개 이상의 토큰을 처리하고 초당 50,000개 이상의 토큰을 출력할 수 있습니다. 이는 기술의 비약일 뿐만 아니라 혁신입니다. "

AI 기술의 급속한 발전과 함께 오늘날 DeepSeek-V2의 등장은 기술적 혁신일 뿐만 아니라 지능형 애플리케이션의 대중화를 예고합니다. AI의 문턱을 낮추고, 더 많은 기업과 개인이 효율적인 지능형 서비스의 혜택을 누릴 수 있도록 돕습니다. 동시에 지능형 애플리케이션의 대중화를 예고하기도 합니다. AI의 문턱을 낮추고, 더 많은 기업과 개인이 효율적인 지능형 서비스의 혜택을 누릴 수 있도록 돕습니다.

중국어 기능 VS 가격

중국어 기능 측면에서 DeepSeek-V2는 AlignBench 순위에서 세계 선두를 달리고 있으며 매우 경쟁력 있는 API 가격을 제공합니다.

全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一

모델과 종이는 모두 오픈 소스입니다

DeepSeek-V2는 단순한 모델이 아니라 더 스마트한 세상을 여는 열쇠입니다. 더 낮은 비용과 더 높은 성능으로 AI 애플리케이션의 새로운 장을 엽니다. DeepSeek-V2의 오픈 소스는 더 많은 사람들의 혁신 정신을 고취하고 인류 지능의 미래를 공동으로 촉진할 것이라는 믿음의 가장 좋은 증거입니다.

  • 모델 가중치: https://huggingface.co/deepseek-ai
  • 오픈 소스 주소: https://github.com/deepseek-ai/DeepSeek-V2

AI가 끊임없이 진화하는 오늘날의 세상에서, DeepSeek에 대해 어떻게 생각하시나요? V2가 우리 세상을 어떻게 변화시킬까요? 관심이 있으시면 chat.deepseek.com을 방문하여 DeepSeek-V2가 가져온 기술 변화를 직접 경험해보세요.

참고자료

[1]

DeepSeek-V2:https://www.php.cn/link/b2651c9921723afdfd04ed61ec302a6b

위 내용은 세계에서 가장 강력한 오픈 소스 MoE 모델이 여기에 있습니다. 중국의 기능은 GPT-4와 비슷하며 가격은 GPT-4-Turbo의 거의 1%에 불과합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제