올해 3월, 급증하는 AI 트렌드에 맞서 '실리콘밸리 검왕'이 일본의 태도를 바꾸고 솔선해 무대에 섰고, AI 전용 GPU를 탑재한 DGX 클라우드 출시를 알렸다. "임대"를 위한 클라우드.
과거에는 클라우드 컴퓨팅 회사가 컴퓨팅 파워 판매를 담당했습니다. 그들은 여러 모델의 그래픽 카드와 인공 지능 가속기를 구매하고 하드웨어 성능이나 사용 시간을 기준으로 가격을 책정한 다음 다운스트림 고객에게 임대합니다.
이 과정에서 NVIDIA는 GPU를 클라우드 컴퓨팅 플랫폼에 판매하거나 AI 회사에 직접 판매합니다. 예를 들어 최초의 NVIDIA DGX 슈퍼컴퓨터는 2016년 Huang이 직접 OpenAI에 전달했습니다. 컴퓨팅 성능은 기껏해야 직접 판매되지 않았습니다. "삽 판매자".
DGX가 클라우드로 이동하는 경우 NVIDIA는 여전히 클라우드 플랫폼에서 호스팅해야 하지만 본질적으로 경계를 넘었습니다.
늘 뒤쳐져 있던 엔비디아가 이번에는 왜 전면에 나섰나?
Nvidia는 의심할 여지 없이 이번 AI 붐의 가장 큰 수혜자입니다. 어쩌면 전혀 수혜자가 아닐 수도 있습니다.
AI 훈련에 사용되는 GPU 칩 가격이 칩당 A100과 H100의 해외 가격이 각각 15,000달러, 40,000달러로 올랐습니다. A100 8개와 80G 저장 공간을 갖춘 국내 AI 서버의 가격도 올랐습니다. 지난해 중순부터 8만개/개로 급증해 현재 165만개/개로 늘었다.
그러나 모든 돈이 NVIDIA의 주머니로 흘러 들어간 것은 아니며, 프리미엄은 채널에 의해 빼앗겨갔습니다. 핵심은 NVIDIA를 사고 팔 수 있는 방법이 없다는 것입니다.
DGX Cloud가 이런 상황에서 탄생하게 되었는데, 핵심 가격이 굉장히 저렴한 것 같습니다. 8개의 H100 GPU 모듈이 탑재된 DGX Cloud의 월 패키지 요금은 US$37,000에 불과하며 이는 H100 단일 가격과 동일합니다.
컴퓨팅 파워와 자금이 시급하지만 예산이 부족한 AI 기업들에게 DGX Cloud는 의심할 여지없이 졸릴 때 하늘에서 떨어지는 베개와도 같습니다. NVIDIA에게 클라우드 컴퓨팅 파워를 판매하면 돈을 벌 수 있을 뿐만 아니라 결속력도 가질 수 있습니다. 고객.
그러나 겉으로는 윈윈인 듯한 상황 뒤에는 AI로 시작되는 비밀스러운 전쟁이 숨겨져 있습니다.
동일한 컴퓨팅 성능
산업 특성상 클라우드 컴퓨팅 파워를 기반으로 한 오늘날의 AIGC는 과거의 암호화폐 자산 채굴과 매우 유사하지만, 필요한 리소스는 후자보다 훨씬 높습니다.
Guosheng Securities는 "Web3 관점에서 본 AIGC 컴퓨팅 성능의 진화"에서 암호화폐 자산 채굴과 AIGC 산업의 유사점과 차이점을 비교한 적이 있습니다.
1 AIGC 산업의 전력 소비는 약 1.6~7.5년 내에 현재 비트코인 채굴 산업의 전력 소비를 초과할 것입니다. 주요 추진 요인은 모델 매개변수, 일일 활동 및 모델 수 측면에서 GPT 대규모 언어 모델의 급속한 성장입니다.
2 비트코인 채굴과 유사하게 AIGC 산업에서 컴퓨팅 파워를 기반으로 하는 콘텐츠는 치열한 경쟁을 벌이고 있습니다. 고품질의 콘텐츠를 지속적이고 신속하게 생산해야만 참가자가 얻는 사용자의 관심이 줄어들지 않을 수 있습니다.
이는 AIGC 산업의 두 가지 주요 특징, 즉 높은 비용과 지속 가능성으로 이어집니다.
그 중 비용 측면은 단순한 전력 소비 이상입니다. 물론 전력 소비는 매우 직관적인 증거로 사용될 수 있습니다. 예를 들어, Baidu가 추론 추론을 훈련하기 위해 사용하는 Yangquan 슈퍼컴퓨팅 센터는 시간당 64,000kW·h(도)를 소비합니다. 상용 전력 소비 기준 0.45위안/kW·h에 따르면 연간 전기 요금은 2억 5천만 달러에 이릅니다.
컴퓨팅 성능에 대한 투자로 인해 더 큰 비용이 발생합니다.
ChatGPT를 예로 들면 일상 활동과 밀접한 관련이 있는 추론 프로세스에 필요한 컴퓨팅 파워는 고려되지 않습니다. 계산에 따르면 1,750억 개의 매개변수가 있는 GPT-3의 한 번의 교육이 필요합니다. NVIDIA A100 그래픽 카드 약 6,000개. 상호 연결 손실을 고려하면 약 수만 개의 A100이 필요합니다.
A100 칩 하나에 10만 위안을 기준으로 하면 대규모 훈련에는 약 10억 달러의 투자가 필요하며 이는 일반 제조업체가 감당할 수 없는 수준입니다. GPT-4의 모델 매개변수는 더 크고 훈련을 위한 식별자도 더 많으며 필요한 컴퓨팅 성능도 더 큽니다.
그리고 더 큰 AIGC 모델이 출시되면서 필요한 컴퓨팅 성능도 급증했습니다.
OpenAI의 계산에 따르면 2012년부터 2018년까지 AI 훈련에 필요한 컴퓨팅 성능은 약 3~4개월마다 두 배로 증가하여 총 300,000배 증가했습니다(동시에 무어의 법칙은 7배만 증가했지만). 머리 훈련 모델에 필요한 요구 사항은 매년 10배씩 증가하며 전체적인 증가도 기하급수적으로 증가합니다.
이때 클라우드 컴퓨팅 성능의 장점이 반영됩니다. 8개 단어로 요약할 수 있습니다. 부분으로 나누고 요청 시 지불합니다.
클라우드 컴퓨팅 파워를 통해 AIGC 대형 모델 제조업체는 NVIDIA A100 그래픽 카드와 같은 하드웨어를 구매하지 않고도 클라우드 컴퓨팅 파워 플랫폼에서 제공하는 컴퓨팅 파워를 직접 임대할 수 있습니다. 이를 통해 스타트업이나 비선진 모델 제조업체도 진출을 시도할 수 있습니다. AIGC 필드.
이러한 "부분 분할" 접근 방식도 업계 체인의 모든 당사자에게 유익합니다.
1) 업스트림 컴퓨팅 파워 제조업체의 경우 컴퓨팅 하드웨어가 비수기에 진입하고 재고가 증가할 때 클라우드 컴퓨팅 파워를 판매하여 수입 변동을 완화하고 성수기 동안 "라이브" 전력을 예약하며 적시에 수요를 충족할 수 있습니다. 매너 반등하는 시장 수요
2) 미드스트림 클라우드 서비스 제공업체의 경우 고객 흐름을 늘리는 데 도움이 됩니다.
3) 다운스트림 컴퓨팅 파워 수요자의 경우 컴퓨팅 파워 사용의 한계점을 최소화하고 모두를 위한 AIGC 시대의 도래를 이끌 수 있습니다.AIGC 대형 모델 제조업체가 더 많은 리소스를 이전하려는 경우 클라우드 플랫폼과 더욱 긴밀하게 협력할 수도 있습니다. 이와 관련하여 대표적인 사례가 바로 Microsoft Cloud와 OpenAI의 협력입니다. 두 사람의 협력은 단순히 컴퓨팅 파워 임대에 그치지 않고 자산과 제품의 통합까지 깊숙이 들어갑니다.
또한 대형 모델 대회에서는 명백한 하드웨어 투자 비용 외에도 눈에 보이지 않는 시간 비용도 있습니다.
일반적으로 대형 모델의 컴퓨팅 성능 요구 사항은 두 단계로 나누어집니다. 하나는 ChatGPT와 유사한 대형 모델을 훈련하는 과정이고, 다른 하나는 이 모델을 상용화하는 추론 과정입니다.
이 프로세스가 오래 지속될수록 더 큰 모델에 더 좋습니다. 그래서 이제 NVIDIA DGX Cloud를 보면 Lao Huang이 한 일을 이해하는 것이 어렵지 않습니다.
클라우드 방식을 활용해 AI 훈련에 사용되는 GPU 가격을 낮추고, 컴퓨팅 파워에 동등한 접근권을 가진 중소기업을 확보한 뒤, 대규모 모델 훈련의 지속가능성 요인인 '실리콘밸리'를 기반으로 고객을 결속시킨다. 검왕'은 일석이조의 두 마리 토끼를 잡는다.
NVIDIA가 혜택을 받는 것은 아닐 수도 있습니다
지난해 12월부터 엔비디아 A100의 가격은 5개월 만에 37.5% 올랐고, 같은 기간 A800의 가격은 20.0% 올랐다.급등하는 GPU 가격으로 인해 AIGC가 대형 모델을 훈련할 수 있는 문턱이 높아진 것은 의심할 여지가 없지만, 선두 제조업체의 경우 가격 인상에 관계없이 GPU를 구입해야 합니다. 그러나 허리 회사의 경우 가격이 오르지 않으면 이를 악물고 주문할 수 있습니다. 일단 가격이 오르면 Wang Huiwen이 사업을 시작하기 위해 받은 자금 5천만 달러에만 의존할 수 없습니다. 훈련에 필요한 모든 그래픽 카드를 구입할 수도 있습니다.
그래서 Lao Huang이 이때 DGX Cloud를 꺼낸 것은 마치 고급 자동차 렌트 회사를 여는 것과 같아서, 여유가 없는 사람들도 렌트할 수 있도록 하는 것이었습니다.
물론, 이에 대한 또 다른 고려 사항은 경쟁사보다 앞서서 더 많은 중소 고객을 결속시키는 것입니다.
OpenAI 외에도 이번 AI 열풍에서 가장 눈에 띄는 AI 기업은 바로 Midjourney와 Authropic입니다. 전자는 최근 QQ 채널과 협력해 국내 사업을 시작한 AI 드로잉 애플리케이션이다. 후자의 창업자는 OpenAI 출신이며, 대화형 로봇인 Claude가 ChatGPT를 직접 벤치마킹한다.
두 회사에는 한 가지 공통점이 있습니다. 슈퍼컴퓨터를 만들기 위해 Nvidia GPU를 구입하지 않고 대신 Google의 컴퓨팅 서비스를 사용했다는 것입니다.
본 서비스는 Google 자체 연구에 중점을 두고 4096 TPU v4를 통합한 슈퍼컴퓨팅 시스템을 통해 제공됩니다.
자체 개발 칩에 참여하는 또 다른 거대 기업은 이 AI 물결의 선두주자인 Microsoft입니다. Athena라는 이 칩은 고급 5nm 공정을 사용하고 TSMC에서 제조한다는 소문이 있습니다.
분명히 이 칩의 목표는 값비싼 A100/H100을 대체하고, OpenAI용 컴퓨팅 성능 엔진을 제공하며, 결국 Microsoft의 Azure 클라우드 서비스를 통해 Nvidia의 우위를 점하는 것입니다.
클라우드 컴퓨팅 회사의 중상모략에 더해, Nvidia의 주요 고객인 Tesla도 혼자 가고 싶어합니다.
2021년 8월 머스크는 자신의 D1 칩 3,000개로 구축한 슈퍼컴퓨팅 Dojo ExaPOD를 외부 세계에 선보였습니다. 그중 D1 칩은 TSMC가 제조하고 7nm 공정을 사용하여 Dojo를 컴퓨팅 성능 측면에서 세계 5번째로 큰 컴퓨터로 만듭니다.
이에 비해 금지 조치로 영향을 받는 국내 기업들도 대안을 갖고 있지만 단기적으로는 여전히 Nvidia에 크게 의존하고 있습니다.
국산 칩은 이렇게 높은 정보 세분성이 필요하지 않은 클라우드 추론 작업을 할 수 있지만, 현재 대부분은 초고성능 컴퓨팅 성능이 필요한 클라우드 훈련을 처리할 수 없습니다.
Suiyuan Technology, Biren Technology, Tianshu Zhixin, Cambrian 및 기타 회사는 자체 클라우드 제품을 출시했으며 이론적 성능 지표는 약하지 않습니다.
이전에 노출된 정보에 따르면 Baidu가 추론을 훈련하기 위해 사용하는 Yangquan 슈퍼컴퓨팅 센터 Wen Xinyiyan은 A100 외에도 Baidu가 자체 개발한 Kunlun 코어, Cambrian의 Siyuan 590 등 일부 국내 생산 제품을 사용하고 있다고 합니다. Siyuan은 2023년 조달 계획의 약 10~20%를 차지합니다.
그 중 Wen Xinyiyan의 칩 레이어 코어 기능은 자체 개발한 XPU-R 아키텍처, 7nm 프로세스 및 GDDR6 고속 비디오 메모리를 사용하는 Kunlun Core 2세대 AI 칩에서 비롯되어 다양성과 성능이 크게 향상되었습니다. 256 TOPS@ INT8 및 128 TFLOPS@FP16의 컴퓨팅 파워 레벨은 이전 세대보다 2~3배 더 높습니다.
올해 3월 Robin Li는 Yabuli 중국 기업가 포럼에서 Kunlun 칩이 이제 대형 모델 추론에 매우 적합하며 향후 교육에도 적합할 것이라고 공유했습니다.
에필로그
RIVA128을 시작으로 NVIDIA는 놀라운 시장 관찰 능력을 보여주었습니다. 지난 10여 년 동안 암호화폐 채굴부터 메타버스, AI 붐에 이르기까지 NVIDIA는 그래픽 카드 고객을 게이머에서 거대 기술 기업으로 확대하는 추세를 활용해 왔습니다.
전쟁이 확산되면서 Nvidia의 시장 가치도 2위 칩 회사에서 전체 업계 1위로 급등했습니다. 그러나 황런순은 AI 아이폰의 시대가 도래했는데, 노키아가 애플에게 패하더라도 엔비디아가 어떻게 무적일 수 있겠는가라고 말했다.
참고자료
[1] AIGC의 롱 옵션: AI 클라우드 컴퓨팅 파워, 궈성증권
[2] Web3, 국성증권의 관점에서 본 AIGC 컴퓨팅 파워 진화론
[3] NVIDIA 제국의 균열, 위안촨 연구소
[4] 클라우드 컴퓨팅 파워 마이닝은 이제 비트코인에 진입하는 가장 안정적인 방법일지도 모릅니다, 오데일리 플래닛 데일리
[5] 바이두의 “원신이옌” 전문 해석, 유니콘 싱크탱크
[6] 대형모델 시대, 국산 GPU '폭발', 디지털 시대 호황
[7] NVIDIA Jensen Huang: AI 슈퍼컴퓨팅 기능은 중국 클라우드 서비스 제공업체를 통해 제공될 것이며, AI iPhone이 온다! 중국 비즈니스 뉴스
[8] AI 컴퓨팅 파워 산업 체인 개요: 기술 반복은 병목 현상의 돌파구를 촉진하고 AIgc 시나리오의 증가는 컴퓨팅 파워, Essence Securities에 대한 수요를 촉진합니다
위 내용은 클라우드 컴퓨팅 파워를 넘어, AI와 함께하는 비밀전쟁이 시작된다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!