2022년에는 AI/ML 분야에서 획기적인 발전이 많이 있었습니다. Google, Meta, Microsoft와 같은 거대 기술 기업은 양자 컴퓨팅에서 생성 인공 지능에 이르기까지 새로운 혁신에 큰 진전을 이루고 있습니다.
예를 들어, 가장 큰 혁신 중 일부에는 국제 수학 올림피아드 문제를 해결하기 위한 Meta의 HyperTreeProofSearch(HTPS), 표현형 간의 공변량 효과 간의 관계를 시뮬레이션하고 게놈을 개선하기 위한 DeepMind의 Alpha Fold 및 Meta AI의 ESMFold가 있습니다. 폭넓은 연관 연구(GWAS) 등이 있습니다.
다음으로 2023년 전망 몇 가지를 살펴보겠습니다.
ChatGPT는 뛰어난 대화 기능으로 인터넷을 휩쓸었습니다. 이는 1,760억 개의 매개변수를 갖고 더 큰 모델 크기에 의존하는 OpenAI의 GPT-3을 기반으로 구축되었습니다. GPT-3의 매개변수가 2배, 3배, 심지어 10배인 다른 LLM도 있지만 DeepMind 또는 Meta(SLM(Small Language Model)라고도 함)의 일부 모델은 논리적 추론 및 예측에서 GPT-3보다 더 많은 매개변수를 갖습니다. 여러 작업에.
모델의 크기를 줄이는 것 외에도 GPT-4와 같은 대형 모델은 약 100조 개의 매개변수를 가질 것으로 예상됩니다. 현재 가장 큰 모델은 1조 6천억 개의 매개변수를 가진 구글 스위치 트랜스포머(Google Switch Transformer) 모델이기 때문에 그 도약폭은 엄청날 것이다.
그러나 지연 시간과 예측 가능성을 높이기 위해 향후 몇 년 동안 기존 모델이 특정 목적에 맞게 미세 조정될 수 있습니다. 최근 OpenAI는 DaVinci 업데이트를 사용하여 GPT-3를 미세 조정했습니다.
텍스트-이미지 생성은 2022년 차트를 깨뜨릴 트렌드입니다. DALL-E, Stable Diffusion 및 Midjourney와 같은 모델은 AI 생성 예술을 실험하려는 매니아들 사이에서 1위를 차지합니다. 대화는 텍스트에서 이미지, 텍스트, 비디오, 텍스트, 무엇이든 빠르게 이동했으며 3D 모델도 생성할 수 있는 여러 모델이 생성되었습니다.
언어 모델이 확장되고 전파 모델이 개선됨에 따라 텍스트 대 모든 것의 추세는 더욱 높아질 것으로 예상됩니다. 공개적으로 사용 가능한 데이터 세트를 사용하면 생성 AI 모델의 확장성이 향상됩니다.
이 데이터 세트는 설명 가능한 인공 지능에 대한 섹션을 소개합니다. 여기서는 이러한 생성 모델을 훈련하는 데 사용되는 각 이미지의 속성이 중요합니다.
인공지능 생성 트렌드를 따라잡은 기업들이 이를 클라우드 서비스로 제공하기 시작했습니다. LLM과 GPT-3 및 DALL-E와 같은 생성 모델이 공개적으로 사용 가능해짐에 따라 기업에서 이를 서비스로 제공하는 것이 점점 더 쉬워졌고 이로 인해 FastSaaS가 탄생했습니다.
최근 Shutterstock은 DALL-E 2를 플랫폼에 통합할 계획이고 Microsoft VS Code는 Copilot을 확장 기능으로 추가했으며 TikTok은 앱 내 텍스트-이미지 AI 생성기를 발표했으며 Canva는 플랫폼에서 AI 생성 기능을 출시했습니다. .
슈퍼컴퓨터를 구축하여 업무를 생성하고 기업에 서비스를 제공하는 추세입니다. 이러한 데이터 세트와 생성 모델이 계속 증가함에 따라 슈퍼컴퓨터에 대한 수요가 증가하고 있으며 앞으로도 더욱 증가할 것으로 예상됩니다. FastSaaS에 대한 경쟁으로 인해 더 나은 고성능 컴퓨팅에 대한 필요성이 다음 단계입니다.
NVIDIA와 Microsoft는 최근 클라우드 기반 슈퍼컴퓨팅 플랫폼인 Quantum-2를 만들기 위해 협력했습니다. 지난 10월 Tesla는 Dojo 슈퍼컴퓨터가 Tesla가 개발한 칩을 사용하여 완전히 처음부터 제작되었다고 발표했습니다. 머지않아 기업 고객에게 액세스를 제공할 수 있을 것으로 보입니다. 또한 Cerebras는 1엑사플롭 이상의 AI 컴퓨팅 성능을 제공하는 1,350만 코어의 AI 슈퍼컴퓨터인 Andromeda를 출시했습니다. 최근 Jasper는 더 나은 성능을 달성하기 위해 Cerebras와 파트너십을 맺었습니다.
무어의 법칙에서 예측한 대로 칩 크기가 감소함에 따라 처리 능력이 증가합니다. 따라서 슈퍼컴퓨터가 대형 모델을 실행하려면 더 작은 칩이 필요하며 이미 칩이 점점 작아지는 것을 목격하고 있습니다.
최근 몇 년 동안 칩 업계는 소형화를 추진해 왔으며 제조업체는 칩을 더 작고 더 작게 만드는 방법을 끊임없이 모색하고 있습니다. 예를 들어 M2 칩과 A16의 경우 Apple은 각각 5nm와 4nm 칩을 사용합니다. TSMC는 2023년에 3nm 칩을 개발하여 AI/ML 알고리즘 개발의 효율성과 성능을 향상시킬 것으로 예상됩니다.
NVIDIA, Google, Microsoft와 같은 기업이 클라우드에 하드웨어 서비스를 제공함에 따라 양자 컴퓨팅 분야에서 더 많은 혁신이 일어날 것입니다. 이를 통해 소규모 기술 회사는 무거운 하드웨어 없이도 AI/ML 모델을 교육, 테스트 및 구축할 수 있습니다.
의료, 금융 서비스 등 다른 많은 분야에서 사용이 증가할 것이므로 개발자는 향후 몇 년 동안 양자 컴퓨팅의 증가를 확실히 포함해야 합니다.
최근 발표에서는 유럽에서 가장 빠른 슈퍼컴퓨터에 양자 컴퓨터를 연결해 기존 컴퓨터와 양자 컴퓨터를 결합해 문제를 더 빠르게 해결했다고 합니다. 마찬가지로 Nvidia는 하이브리드 양자 클래식 컴퓨터를 위한 최초의 플랫폼인 QODA(Quantum-Optimised Device Architecture)도 출시했습니다.
IBM은 최근 연례 Quantum Summit 2022에서 양자 하드웨어 및 소프트웨어를 발표하여 433큐비트(qubit) 프로세서를 사용하는 양자 중심 슈퍼컴퓨팅에 대한 획기적인 비전을 설명했습니다. 글로벌 인공지능 서밋(Global Artificial Intelligence Summit)에서 IBM은 내년에 다양한 분야에서 추가적인 혁신을 위한 파괴자가 될 1,000큐비트 시스템을 선보일 것이라고 발표했습니다.
위 내용은 2023년 TOP5 인공지능 개발 동향의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!