집 >기술 주변기기 >일체 포함 >545%! DeepSeek 최초 공개 비용 이익 마진 전문가 : 이미 미국에서 100 억 달러 이상의 회사 인 경우

545%! DeepSeek 최초 공개 비용 이익 마진 전문가 : 이미 미국에서 100 억 달러 이상의 회사 인 경우

원래의: 2025-03-12 13:30:02838검색

중국 AI 스타트 업인 Deepseek은 지난 토요일 (1 일)에 "오픈 소스"였으며, DeepSeek-V3/R1 추론 시스템이 완전히 드러났으며, 이는 추론 시스템의 핵심 최적화 솔루션을 처음으로 공개하여 비용 이익률과 같은 주요 데이터를 공개했습니다.

Deepseek은 지난 토요일에 Zhihu 플랫폼에 대한 첫 번째 기사를 발표하여 모델 추론 비용 분야의 세부 사항을 발표하고 모든 토큰이 DeepSeek-R1의 가격에 따라 계산되면 이론적 인 총 수익은 560 달러이며, 이는 545%입니다.

DeepSeek의 공식 공개에 따르면 DeepSeek V3 및 R1의 모든 서비스는 H800 GPU를 사용합니다. 교육과 함께 일관된 정확도, 즉 매트릭스 계산 및 디스패치 전송을 사용하여 일관된 훈련과 일관된 FP8 형식을 채택하고 일관된 BF16을 일관된 BF16과 함께 일관된 훈련과 결합하여 서비스 효과를 보장합니다.

지난 24 시간의 통계주기 (2025 년 2 월 27 일 ~ 2 월 28 일)에서 GPU 임대 비용이 US $ 2로 계산되면 평균 일일 비용은 87,072 달러이며, 모든 입력/출력 토큰은 R1 (16 만, 16 개)에 대한 가격이 $ 1에 달합니다 NT $ 18.65 million), 비용 이자율은 545%로 높습니다.

위의 데이터를 읽은 후 Menloventures Investor Deedy는 500%를 초과하는 이익률의 비즈니스 효율성이 미국에서 100 억 달러 이상의 미국 달러 가치가 될 것이라고 지적했습니다.

중국의 실리콘 기반 휴대 전화의 창립자 인 Yuan Jinhui도 처음으로 자신의 감정을 표명했습니다. "Deepseek의 대규모 배치의 비용과 이점에 대한 공식 공개는 다시 많은 사람들의 인식을 전복했습니다."

DeepSeek의 높은 이익률은 혁신적인 추론 시스템 설계에서 비롯됩니다. 혁신적인 추론 시스템 설계, 3 가지 기술 기둥, 즉 대규모 크로스 노드 전문가 병렬 처리 (EP), 컴퓨팅 통신 중첩 및로드 밸런싱 최적화. EP는 모델 희소성에 대한 처리량 및 응답 속도를 향상시킵니다 (8/256 전문가 만 층당 시작) EP 전략은 전체 배치 크기를 확장하여 각 전문가가 충분한 컴퓨팅 부하를 얻고 GPU 활용을 크게 향상 시키며 배포 단계 및 18 개의 노드에서 4 개의 노드 및 18 개의 노드와 같은 배포 장치를 동적으로 조정합니다.

요컨대, EP는 "다원자 공동 작업"과 같으며 계산을 위해 모델의 "전문가"를 여러 GPU로 분산시키고, 배치 크기를 크게 개선하고, GPU 컴퓨팅 성능을 압박하며, 전문가를 분산시키고, 메모리 압력을 줄이고, 더 빨리 응답합니다.

Deepseek는 엔지니어링 수준에서 비용을 더욱 압축하고, 야간 자원 할당을 제공하고, 피크 일 동안의 추론 서비스를 전적으로 지원하며, 밤에 유휴 노드는 하드웨어 활용을 극대화하며, 캐시 적중률은 56.3%를 통해 중복 계산을 감소시킵니다. 소비.

일부 분석가들은 DeepSeek가 공개 한 데이터는 기술 경로의 상업적 타당성을 확인할뿐만 아니라 업계의 효율적인 수익성을위한 벤치 마크를 설정한다고 말합니다. 추론 가격 이점의 관점에서, DeepSeek-R1의 API 가격은 OpenAI O3-Mini의 약 1 ~ 절반에 불과하며, 저렴한 전략은 시장 침투를 가속화합니다.

다른 분석가들은 DeepSeek의 "투명한"공개는 기술적 강점과 비즈니스 잠재력을 보여줄뿐만 아니라 업계에 명확한 신호를 보냅니다.

그러나 DeepSeek은 공식적으로 V3가 가격이 낮아졌고 유료 서비스는 시간의 일부만 설명했으며 밤에는 할인이 있었기 때문에 실제로 매출이 많지 않았다는 것을 공식적으로 인정했습니다.

Citic Securities는 모델 교육 비용을 줄이는 데있어 DeepSeek의 모범 사례가 기술 거인이 최첨단 모델의 탐색 및 연구를 가속화하는보다 경제적 인 방법을 채택하여 많은 AI 응용 프로그램을 잠금 해제하고 구현할 수 있도록해야한다고 생각합니다. 유닛 컴퓨팅 전력 비용의 감소에 해당하는 Jevins Paradox뿐만 아니라 알고리즘 훈련에 의해 가져온 스케일 수익의 증가 효과는 모두 중간 및 단기 차원 기술 거인이 AI 컴퓨팅 전력 분야에 지속적으로 투자하고 있으며, 스케일 투자는 여전히 높은 수준의 사건이 될 것임을 나타냅니다.

위 내용은 545%! DeepSeek 최초 공개 비용 이익 마진 전문가 : 이미 미국에서 100 억 달러 이상의 회사 인 경우의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

batch Token 循环事件算法负载均衡

성명：

이전 기사：콩 빵과 딥스 크의 차이점은 무엇입니까?다음 기사：콩 빵과 딥스 크의 차이점은 무엇입니까?