중국 스타트 업 Deepseek은 Openai의 chatgpt의 성능을 발전시키는 데 도움이되는 새로운 AI 챗봇으로 가장 큰 실리콘 밸리 플레이어를 기절 시켰습니다. Apple의 App Store에서 미국, 영국, 중국 및 기타 여러 국가에서 가장 많이 다운로드 된 무료 앱입니다. 일반적인 챗봇처럼 작동합니다. 쿼리를 입력하고 오픈 소스 모델이 답을 생성합니다. 기본 DeepSeek-V3 모델에는 6,710 억 개의 매개 변수가있어 문제를 해결하기 전에 앱을 "생각"할 수 있습니다.
OpenAi의 모델과 달리 DeepSeek은 로컬로 실행할 수 있습니다. 고성능 컴퓨터 및 많은 GPU 가속 서버. 이 회사는 모델이 특정 벤치 마크에서 OpenAI의 O1 모델과 일치한다고 주장합니다. 다른 많은 AI 챗봇과 달리 DeepSeek는 또한 그 추론과 그것이 어떻게 대답을 도출했는지를 투명하게 보여줍니다. 그러나 중국어 앱으로서 DeepSeek은 Tiananmen Square와 같은 특정 주제를 검열합니다.
1 월 20 일에 출시 된 앱은 Google의 Play Store에서도 제공됩니다. DeepSeek은 AII 모델을 일치 시키거나 일치하는 능력에 갑자기 인기를 얻었습니다. 월요일에 발표 된 연구 논문은 비용 효율적인 교육 DeepSeek-V3이 얼마나되는지를 보여줍니다. NVIDIA H800 칩은 R1을 훈련시켜 16,000 개 이상의 NVIDIA 칩을 열어 OpenAI에서 주요 모델을 훈련시킵니다. DeepSeek은 AI 교육에 필요한 최첨단 GPU의 수가 급격히 감소하면 R1을 훈련시키는 데 560 만 달러를 지출 할 수 있다고 말했다. 이것을 OpenAI와 대조하여, 비교적 크기의 GPT-4 모델을 훈련시키는 데 1 억 달러가 넘는 지출. 그러나 회사는 라이벌에 비해 Deepseek의 에너지 소비를 정량화하지 않았습니다.r1 자체는 DeepSeek의 V3 큰 언어 모델 (LLM)을 기반으로하며,이 회사는 OpenAI의 GPT-4O 및 Anthropic의 Claude 3.5 Sonnet과 일치한다고 말합니다. Deepseek의 업적은 AI 훈련에 사용되는 정교한 Nvidia 칩에 대한 무역 제재를 부과하는 미국 정부에 비추어 인상적입니다. NVIDIA, OpenAi, Meta 및 Microsoft와 같은 가장 큰 AI 플레이어는 AI 데이터 센터에서 수십억의 조정에 소비하는 데있어 이번 주 AI에서 미국의 리드에 대해 질문하는 많은 헤드 라인을 보게 될 것입니다.
.위 내용은 Chatgpt에는 새로운 라이벌이 있습니다. Deepseek를 만나십시오의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!