>  기사  >  기술 주변기기  >  인공지능 붐으로 인해 컴퓨팅 파워가 부족해지면서 마이크로소프트는 새로운 서버 임대 계획을 내놓는다.

인공지능 붐으로 인해 컴퓨팅 파워가 부족해지면서 마이크로소프트는 새로운 서버 임대 계획을 내놓는다.

WBOY
WBOY앞으로
2023-04-13 14:49:031060검색

ChatGPT의 지속적인 인기로 인해 칩 부족이 발생했습니다. ChatGPT의 컴퓨팅 요구를 처리할 컴퓨팅 성능이 충분하지 않아 OpenAI 서버에 과부하가 걸렸습니다. 마지막 대규모 칩 부족은 가상화폐에 대한 미친 채굴로 인해 발생했습니다. 그러나 생성적 인공지능에 대한 수요가 지속적으로 증가함에 따라 이번에도 컴퓨팅 파워 부족 현상은 상당 기간 지속될 수 있다.

인공지능 붐으로 인해 컴퓨팅 파워가 부족해지면서 마이크로소프트는 새로운 서버 임대 계획을 내놓는다.

Microsoft는 생성 인공 지능 애플리케이션을 위한 코드명 Hopper인 Nvidia의 최신 H100 GPU가 다수 포함된 ND H100 v5라는 새로운 가상 머신 제품으로 이러한 격차를 메우기를 희망합니다.

데이터를 더 깊이 파고들어 관계를 구축하고 추론하고 답변을 예측할 수 있는 생성 AI를 연구하는 회사에 더 높은 컴퓨팅 속도를 제공하는 것이 아이디어입니다. Generative AI는 아직 초기 단계에 있지만 ChatGPT와 같은 앱의 인기는 이미 이 기술의 잠재력을 입증하고 있습니다.

그러나 이 기술에는 엄청난 컴퓨팅 성능도 필요하며 Microsoft는 이를 Azure 클라우드 서비스에 도입하고 있습니다.

제너레이티브 AI 애플리케이션의 크기로 확장되는 가상 머신 제공은 칩 제조업체의 Quantum-2 InfiniBand 기술로 상호 연결된 수천 개의 H100 GPU로 확장됩니다.

Azure의 H100 가상 머신 가격은 즉시 발표되지 않았습니다. 가상 머신의 가격은 구성에 따라 다르며, CPU 코어 96개, 스토리지 900GB, A100 GPU 8개를 갖춘 완전히 로드된 A100 가상 머신의 가격은 월 $20,000에 가깝습니다.

지난해 ChatGPT가 처음 출시되었을 때 NVIDIA GPU는 심각한 테스트에 직면했습니다. 계산은 Nvidia A100 GPU로 구축된 OpenAI 슈퍼컴퓨터에 의해 수행됩니다.

그러나 ChatGPT에 대한 수요가 엄청나게 증가하여 서버가 금세 압도당했고, 사용자들은 서버가 제때에 응답하고 쿼리 작업을 처리하지 못한다고 불평했습니다.

H100은 이미 의료, 로봇 공학 및 기타 산업에서 사용되고 있는 생성 AI에 필요한 속도 격차를 줄일 수 있습니다. 다양한 개발 회사에서는 라스트 마일 격차를 메우고 ChatGPT와 같이 AI를 간단하고 유용하게 만드는 인터페이스를 배포하려고 합니다.

Nvidia와 Microsoft는 이미 H100을 사용하여 인공지능 슈퍼컴퓨터를 구축하고 있습니다. GPU는 CUDA(CUDA는 Nvidia의 병렬 프로그래밍 프레임워크)로 코딩된 애플리케이션과 가장 잘 작동하도록 설계되었습니다. 제품에는 GPU 환경에 인공 지능 모델 GPT-3을 배포하는 데 도움이 되는 Triton 추론 서버도 포함되어 있습니다.

Microsoft는 제품에 인공 지능을 완전히 포함시키기 시작했습니다. ChatGPT의 대규모 언어 모델인 GPT-3.5의 사용자 정의 버전이 Bing 검색 엔진에 구현되었습니다. Microsoft는 Bing AI에 대해 DevOps(개발 운영) 스타일의 반복적 접근 방식을 취하고 있습니다. 이 방식에서는 모델을 사용할 때 사용자에 대해 학습하여 애플리케이션을 빠르게 업데이트할 수 있습니다. Microsoft 365 Copilot은 인공 지능이 내장된 최초의 OFFICE 제품군입니다. WORD, PPT, EXCEL과 같은 친숙한 소프트웨어는 새로운 기능으로 기존의 작업 방식을 변화시킬 것입니다. 그리고 이 모든 것의 이면에는 컴퓨팅 파워의 지원이 불가분의 관계에 있습니다.

새로운 Azure Virtual Machine 기본 구성은 NVIDIA의 독점 NVLink 4.0 상호 연결을 통해 8개의 H100 Tensor Core GPU를 상호 연결할 수 있습니다. 이 구성은 Quantum-2 상호 연결을 통해 추가 GPU로 확장될 수 있습니다. 이 서버에는 Intel의 4세대 Xeon(Sapphire Rapids) 확장 가능 프로세서가 탑재되어 있으며 PCIe Gen5를 통해 GPU와 데이터를 주고받을 수 있습니다.

위 내용은 인공지능 붐으로 인해 컴퓨팅 파워가 부족해지면서 마이크로소프트는 새로운 서버 임대 계획을 내놓는다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제