Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.-일체 포함-php.cn

집

기술 주변기기

일체 포함

Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.

尊渡假赌尊渡假赌尊渡假赌

Mar 03, 2025 pm 07:05 PM

Deepseek은 #OpenSourceweek의 2 일째에 여기에 있으며 오늘 그들은 MOE 모델 교육 및 추론을위한 오픈 소스 EP 커뮤니케이션 라이브러리 인 Deepep을 소개했습니다. 지금까지 나는 Deepseek과 Openai, Meta 등의 10 억 달러 규모의 모델에 대한 그들의 답변에 완전히 깊은 인상을 받았습니다. 이제 그들은 AGI를 탐험 할 때 빌딩 블록을 오픈 소싱하고 있습니다. 5 개의 리포지토리 (이미 릴리스 된 2 개)를 통해 AI의 투명성, 커뮤니티 협력 및 발전에 대한 약속을 보여주고 있습니다.

DeepSeek의 1 일차 팀에서 FlashMla를 발표하면 여기에서 읽을 수 있습니다 - DeepSeek #OpenSourceweek 1 일 : FlashMla의 출시.

오늘, 우리는 Deepep에 대해 자세히 이야기 할 것입니다.

릴리스의 주요 하이라이트

효율적이고 최적화 된 전부 커뮤니케이션 NVLINK 및 RDMA 를 통한 인트라 노드 및 인턴 노드 지원 훈련 및 추론을위한 고 처리량 커널 추론 디코딩을위한 저지성 커널 기본 FP8 디스패치 지지대

계산-의사 소통 중첩

에 대한 유연한 GPU 리소스 제어

Moe는 변압기 모델에서 어떻게 작동합니까?
OpenSourcing Deepep은 게임 체인저이며 그것이 제공하는 것인가?

NVLINK 및 RDMA를 사용한 인트라 노드 및 인트라 노드 지원을 효율적이고 최적화 한 전부 커뮤니케이션 및 internode 지원을위한 고도로 렌즈 프리 릴 선사 rdma

Deepep 자신을 시도해보십시오
결론
- Deepep : MOE 및 전문가 병렬성을위한 최적화 된 커뮤니케이션 라이브러리 Deepep은 MOE (Mix-of-Experts) 및 EP (Expert Parallism)를 위해 특별히 설계된 고성능 커뮤니케이션 라이브러리입니다. 이 회사는 매우 효율적인 모든 GPU 커널 (Moe Dispatch and Combine)이라고 불리는 탁월한 처리량과 최소한의 대기 시간을 제공합니다. 또한 Deepep은 FP8을 포함한 저렴한 계산을 지원하여 딥 러닝 워크로드의 유연성을 보장합니다. DeepSeek-V3 용지에 도입 된 그룹 제한 게이팅 알고리즘을 보완하기 위해 Deepep은 비대칭 도메인 대역폭 전달을 위해 맞춤형 특수 커널을 제공합니다. 이 커널은 NVLINK 및 RDMA와 같은 다른 하드웨어 도메인간에 데이터 전송을 최적화하여 교육 및 추론 프리 릴 작업 모두에 대한 처리량을 최대화합니다. 또한 라이브러리에는 스트리밍 멀티 프로세서 (SM) 사용을위한 내장 컨트롤이 포함되어 있습니다. 특히 디코딩 중에 초대형 대기 시간을 요구하는 추론 시나리오의 경우 Deepep은 전용 RDMA 전용 커널 세트를 통합하여 통신 지연을 크게 줄입니다. 또한 SM 리소스를 소비하지 않고 계산과의 커뮤니케이션을 중복시키기 위해 혁신적인 후크 기반 접근 방식을 사용하여 최적의 효율성을 확보합니다. 왜 DeepSeek가 그것을 opensourcing 하는가? Deepseek의 기술을 오픈 소스로 결정하는 것은 모든 사람이 최첨단 AI를 이용할 수 있도록하는 것입니다. 혁신을 공유함으로써 의료, 기후 과학 또는 방어에 관계없이 산업 전반의 개발자, 연구원 및 비즈니스에 힘을 발휘하여 경계를 높이고 더욱 고급 솔루션을 구축 할 수 있습니다. Open Access는 협업 속도를 높이고 AI 개발이 선택된 소수로 제한되지 않도록합니다. Deepep은“MOE 모델 교육 및 추론을위한 최초의 오픈 소스 EP 커뮤니케이션 라이브러리”입니다. 그리고 가장 중요한 부분? DeepSeek의 도구는 Github에서 구할 수 있으므로 누구나 기술을 쉽게 탐색하고 기여하며 개선 할 수 있습니다. 이제 전문가 (MOE)의 혼합이 무엇인지 이해합시다 전문가 (Moe)의 혼합물이란 무엇입니까?
  
  모델의 크기는 품질을 결정하는 데 중요한 역할을합니다. 고정 계산 예산을 사용하면 일반적으로 더 많은 단계를 위해 더 작은 모델보다는 더 큰 단계로 더 큰 모델을 훈련시키는 것이 더 효과적입니다. 이곳은 전문가 (MOE) 의 혼합물이 작용하는 곳입니다. 모델은 계산 효율을 최적화하면서 모델을 크게 확장 할 수 있습니다. .
  MOE는 계산 중에 매개 변수의 서브 세트 만 선택적으로 활성화하여 모델 교육 및 추론을 최적화하도록 설계된 신경망 아키텍처입니다. 이를 통해 계산 비용의 비례 적 증가없이 훨씬 더 큰 모델을 사용할 수 있습니다.
  moe는 주로 두 가지 주요 구성 요소 로 구성됩니다
  스파스 MOE 계층 -이들은 전통적인 조밀 한 피드 포워드 네트워크 (FFN) 레이어를 대체합니다. 단일 FFN 대신 MOE 계층은 여러 전문가 (예 : 8 개의 별도 네트워크)로 구성됩니다. 각 전문가는 독립형 신경망, 일반적으로 FFN으로 기능하지만 경우에 따라 이러한 전문가는 더 복잡한 구조물이거나 계층 적 Moes가 될 수 있습니다.
  . 라우터 또는 게이트 네트워크 -이 메커니즘은 어떤 토큰이 어떤 전문가에게 할당되는지를 결정합니다. 예를 들어, 주어진 순서에서, 하나의 토큰은 Expert 2로 향할 수 있고, 다른 토큰은 Expert 1에 의해 처리 될 수 있습니다. MoE의 주요 설계 선택은 전문가들 사이에 토큰이 어떻게 배포 되는가입니다. 라우팅 메커니즘은 나머지 모델과 함께 교육을받는 학습 가능한 매개 변수에 의해 관리됩니다. 변압기 모델에서 MOE는 어떻게 작동합니까? 표준 변압기 모델에서 모든 토큰은 조밀 한 FFN 층을 통해 처리됩니다. 그러나, MOE 모델에서,이 조밀 한 FFN 층은 여러 전문가와 게이팅 메커니즘으로 구성된 MOE 층으로 대체된다. 추론 및 훈련 중에,이 전문가의 하위 집합만이 토큰 당 활성화되어 모델 용량을 유지하면서 전반적인 계산이 줄어 듭니다. Moe 모델의 이점 효율적인 사전 여파
- 더 빠른 추론 - 모델 매개 변수의 일부만이 주어진 시간에 사용되므로 추론은 동등한 총 크기의 밀집된 모델에 비해 상당히 더 효율적입니다.

위 내용은 Deepep은 DeepSeek에서 오픈 소스 주 2 일째에 출시되었습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

AI를 사용하면 회사가 SEO에서 GEO로 전환합니다.May 05, 2025 am 11:09 AM

AI 애플리케이션이 폭발적으로 증가함에 따라 기업은 기존 검색 엔진 최적화 (SEO)에서 생성 엔진 최적화 (GEO)로 이동하고 있습니다. Google은 변화를 이끌고 있습니다. "AI 개요"기능은 10 억 명 이상의 사용자에게 제공되어 사용자가 링크를 클릭하기 전에 전체 답변을 제공합니다. [^2] 다른 참가자들도 빠르게 상승하고 있습니다. Chatgpt, Microsoft Coplot 및 Perplexity는 전통적인 검색 결과를 완전히 우회하는 새로운 "답변 엔진"범주를 만들고 있습니다. 이 AI 생성 답변에 비즈니스가 나타나지 않으면 잠재 고객이 전통적인 검색 결과에서 높은 순위를 차지한 경우에도 잠재 고객이 귀하를 찾지 못할 수 있습니다. SEO에서 GEO까지 - 이것은 정확히 무엇을 의미합니까? 수십 년 동안

이 경로 중 어느 경로에 대한 큰 베팅은 오늘날의 AI가 소중한 AGI가되도록 밀어 넣을 것입니다.May 05, 2025 am 11:08 AM

인공 일반 정보 (AGI)의 잠재적 경로를 탐색합시다. 이 분석은 AI 전진에 대한 진행중인 Forbes 칼럼의 일부이며, AGI 및 인공 초 지성 (ASI)을 달성하는 복잡성을 탐구합니다. (관련 예술 참조

챗봇을 훈련합니까, 아니면 그 반대도 마찬가지입니까?May 05, 2025 am 11:07 AM

인간 컴퓨터 상호 작용 : 섬세한 적응 춤 AI 챗봇과 상호 작용하는 것은 상호 영향의 섬세한 춤에 참여하는 것과 같습니다. 귀하의 질문, 응답 및 선호도는 귀하의 요구를 더 잘 충족시키기 위해 시스템을 점차적으로 형성합니다. 현대 언어 모델은 명백한 피드백 메커니즘과 암시 적 패턴 인식을 통해 사용자 선호도에 적응합니다. 그들은 당신의 커뮤니케이션 스타일을 배우고, 선호도를 기억하며, 당신의 기대에 맞게 그들의 반응을 점차적으로 조정합니다. 그러나 디지털 파트너를 훈련시키는 동안 반대 방향으로 똑같이 중요한 일이 일어나고 있습니다. 이러한 시스템과의 상호 작용은 우리 자신의 의사 소통 패턴, 사고 과정 및 대인 관계에 대한 기대치를 미묘하게 재구성하고 있습니다. AI 시스템과의 상호 작용은 대인 관계 상호 작용에 대한 우리의 기대를 재구성하기 시작했습니다. 우리는 즉각적인 반응에 적응했고

California는 AI를 빠른 트랙 산불 복구 허가에 탭합니다May 04, 2025 am 11:10 AM

AI는 산불 복구 허가를 간소화합니다 기계 학습 및 컴퓨터 비전을 활용하는 호주 기술 회사 인 Archistar의 AI 소프트웨어는 지역 규정 준수를위한 건축 계획 평가를 자동화합니다. 이 예비 검증은 중요합니다

미국이 에스토니아의 AI 기반 디지털 정부로부터 배울 수있는 것May 04, 2025 am 11:09 AM

에스토니아의 디지털 정부 : 미국의 모델? 미국은 관료적 비 효율성과의 투쟁이지만 에스토니아는 설득력있는 대안을 제공합니다. 이 소규모 국가는 AI가 구동하는 거의 100% 디지털화 된 시민 중심 정부를 자랑합니다. 이것은 아닙니다

생성 AI를 통한 결혼 계획May 04, 2025 am 11:08 AM

결혼식을 계획하는 것은 기념비적 인 일이며, 종종 가장 조직화 된 커플조차도 압도적입니다. AI의 영향에 관한 진행중인 Forbes 시리즈의 일부인이 기사 (여기 링크 참조)는 생성 AI가 결혼 계획에 혁명을 일으킬 수있는 방법을 탐구합니다. 결혼식 pl

Digital Defense AI 에이전트는 무엇입니까?May 04, 2025 am 11:07 AM

기업은 AI 에이전트를 판매하기 위해 점점 더 활용하는 반면 정부는 다양한 기존의 작업에이를 활용합니다. 그러나 소비자 옹호자들은 개인이 자주 조정 된 사람들에 대한 방어로 자신의 AI 에이전트를 소유해야 할 필요성을 강조합니다.

생성 엔진 최적화에 대한 비즈니스 리더 안내서 (GEO)May 03, 2025 am 11:14 AM

Google은 이러한 변화를 이끌고 있습니다. "AI 개요"기능은 이미 10 억 명 이상의 사용자에게 제공되며, 누군가가 링크를 클릭하기 전에 완전한 답변을 제공합니다. [^2] 다른 플레이어들도 빨리지면을 얻고 있습니다. Chatgpt, Microsoft Copilot 및 PE

See all articles

핫 AI 도구

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

AI 옷 제거제

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

mPDF

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.

Atom Editor Mac 버전 다운로드

가장 인기 있는 오픈 소스 편집기

SecList

SecLists는 최고의 보안 테스터의 동반자입니다. 보안 평가 시 자주 사용되는 다양한 유형의 목록을 한 곳에 모아 놓은 것입니다. SecLists는 보안 테스터에게 필요할 수 있는 모든 목록을 편리하게 제공하여 보안 테스트를 더욱 효율적이고 생산적으로 만드는 데 도움이 됩니다. 목록 유형에는 사용자 이름, 비밀번호, URL, 퍼징 페이로드, 민감한 데이터 패턴, 웹 셸 등이 포함됩니다. 테스터는 이 저장소를 새로운 테스트 시스템으로 간단히 가져올 수 있으며 필요한 모든 유형의 목록에 액세스할 수 있습니다.