Canva의 사진
2023년 초, ChatGPT의 폭발적인 인기로 인해 생성 AI 애플리케이션에 대한 업계의 관심이 빠르게 높아졌고, 대형 AI 모델에 대한 경쟁이 심화되었습니다.
중요한 참여자로서 Alibaba Cloud는 4월 11일에 개최된 Alibaba Cloud Summit에서 Tongyi Qianwen 대형 모델을 처음 출시했습니다. 6월 1일 직후, Alibaba Cloud는 Tongyi 대규모 모델의 진행 상황을 발표했으며, 오디오 및 비디오 콘텐츠에 초점을 맞춘 새로운 AI 제품인 'Tongyi Listening'이 공식 출시되어 대중에게 공개된 중국 최초의 대규모 모델 애플리케이션 제품이 되었습니다. 이는 Alibaba Cloud의 대규모 모델 언어 모델이 프런트엔드 애플리케이션을 향한 또 다른 큰 진전을 이루었음을 의미합니다. 동시에 AI 기반 대형 모델 애플리케이션 출시는 현재 논란이 되고 있는 '대형 모델 난투전'에 블록버스터급 흥행을 기록하는 것과 다름없다.
천모델전쟁이 곧 발발합니다
최근 몇 달간 마이크로소프트, 구글, 아마존 등 실리콘밸리 주요 기업들이 대형 모델과 AIGC 진전을 발표하며 AI 검색엔진, AI 사무용 소프트웨어 등 일련의 애플리케이션을 통해 AI 대회를 론칭하면서 국내 인터넷 클라우드 기업들도 차례로 군대가 공격했습니다. 대형 제조업체뿐만 아니라 수많은 스타트업, VC/PE 기관, 다양한 업계의 거대 기업들이 AI 대형 모델 트랙에 쏟아져 파이 한 조각을 얻으려고 노력하고 있습니다. 불완전한 통계에 따르면 현재 대규모 AI 모델 출시 계획을 발표한 대기업은 50개 남짓이며, 그 외에도 수많은 참여자가 있다.
구조적인 관점에서 "BATH" 등으로 대표되는 인터넷 기술 기업은 중요하면서도 시나리오, 컴퓨팅 파워, 풀스택 기술 역량 등 종합적인 강점으로 인해 업계 1위 자리에 굳건히 자리잡고 있습니다. SenseTime, China Telecom, JD.com, 360 등과 같은 2차 산업 기업은 관련 분야에서의 영향력에 의존하여 Meituan을 포함한 다양한 산업 거대 기업이 업계 2위를 차지했습니다. 공동 창업자 Wang Huiwen, 전 Sogou CEO Wang Xiaochuan과 같은 유명한 기업가는 지식, 제도적 지원 및 관련 배경을 갖추고 있지만 아직 초기 단계이기 때문에 일시적으로 대형 AI 난투에서 3계급에 위치합니다. 모델.
분류의 관점에서 각 기업은 일반 대형 모델과 특수 대형 모델을 중심으로 고유한 포지셔닝과 업무 분업을 가지고 있습니다. 업계 관계자에 따르면 현재 국내 대형 모델은 크게 두 가지 범주로 나눌 수 있다. 하나는 알리바바, 바이두 등 기본 수준 기업에 초점을 맞춘 GPT를 벤치마킹하는 일반 대형 모델이고, 다른 하나는 개방형 기반이다. 금융, 의료, 운송 및 기타 분야에서 사용되는 대형 수직 모델과 같은 수직 산업의 기업을 중심으로 플랫폼에서 대형 수직 모델을 교육합니다. 전자의 높은 기술 요구 사항과 높은 비용으로 인해 많은 업계에서는 일반 대형 모델 회사와 협력하여 자체 조건에 따라 자체 산업에 적합한 수직형 대형 모델을 교육하기 시작했습니다.
산업 체인의 관점에서 보면 컴퓨팅 성능 제조업체, 클라우드 서비스 제조업체, 프런트 엔드 애플리케이션 제조업체가 모두 참여하고 있으며 시스템은 완전하고 밀접하게 연결되어 있으며 범위가 넓습니다. 현재 컴퓨팅 파워 제조사 엔비디아(NVIDIA), 클라우드 서비스 제공사 알리바바 클라우드(Alibaba Cloud), 킹소프트 오피스(Kingsoft Office), UFIDA, 윈콩 테크놀로지(Yuncong Technology) 등 프런트엔드 애플리케이션 제조사를 포함해 모두 AI 대형 모델의 기술 연구개발과 시나리오 구현에 적극적으로 참여하고 있다. 요컨대, 현재 대형 AI 모델을 둘러싼 난전이 갑자기 뜨거워지고 있는 것입니다.
Tongyi Tingwu가 대형 모델 애플리케이션의 첫 번째 샷을 출시했습니다
대형 AI 모델과 관련된 수준의 관점에서 보면 주로 애플리케이션 계층, 모델 계층, 프레임워크 계층 및 칩 계층의 네 가지 수준으로 나눌 수 있습니다. 현재 시장에 나와 있는 대부분의 회사는 여전히 모델 계층에 있으며 프레임워크 레이어와 칩 레이어에 대한 연구에 있어서는 현재 업계에서 프런트엔드 애플리케이션을 사용할 수 없습니다. 업계 최초의 공개 베타 대규모 모델 응용 제품인 Tongyi Tingwu의 시연 효과는 매우 분명합니다.
한편으로는 기반 기술에 비해 애플리케이션 프런트엔드에 가까운 기술의 가치는 더욱 상상적일 것입니다. 모든 기술 발전의 역사를 살펴보면 기술의 핵심 가치는 응용의 대중성과 사용자 문제를 해결하는 정도에 있다는 것을 어렵지 않게 발견할 수 있습니다. 이로 인해 이러한 책임과 임무를 수행하는 프런트엔드 애플리케이션에는 상상의 여지가 더 큰 경우가 많습니다.
Alibaba Cloud가 6월 1일 출시한 Tongyi Listening을 예로 들어보겠습니다. Alibaba의 Tongyi 대형 모델과 연결하여 그 역할은 단순한 오디오 및 비디오 전사 도구가 아니라 효율적인 AI입니다. 오디오 및 비디오 시나리오에 참여하는 사람들을 위한 보조자입니다. 자동 메모 작성, 인터뷰 정리, PPT 추출 등 다양한 오피스 서비스를 제공하며, 오디오와 비디오를 그래픽 콘텐츠로 변환하고, 장별로 요약하고, 의견 전문을 요약하는 기능도 실현할 수 있습니다. "인간과 같은" 효율적인 검색 및 분류 능력을 가지고 있습니다.
또한 세분화된 시나리오에서는 Chrome 플러그인을 열 수 있는 등 많은 "보물" 기능도 있습니다. 외국어 학습자와 청각 장애가 있는 사용자는 이중 언어 플로팅 자막 표시줄을 사용하여 언제든지 자막 없이 동영상을 시청할 수 있습니다. 일정이 충돌할 때 Tingwu는 전문가를 위한 "회의 대리인"이 될 수도 있으며, 소리가 음소거되면 AI가 회의를 대신하여 핵심 사항을 정리할 수 있습니다. Tingwu Reviews가 주최한 Q&A를 통해 뉴미디어 실무자가 비디오 후반 작업을 용이하게 하는 파일을 통해 기자, 분석가, 변호사, HR 및 기타 그룹이 인터뷰를 보다 효율적으로 구성할 수 있습니다. 즉, 특정 장면의 문제를 해결하는 능력 측면에서 기존 오디오 및 비디오 애플리케이션의 성능을 뛰어넘었으며, 이전 사용자 경험의 상한선도 새롭게 단장한 것으로 업계에 큰 반향을 불러일으킬 것이 분명합니다.
한편, Alibaba Cloud 자체에서는 Tongyi Qianwen 대형 모델이 방금 출시되었으며 AI 대형 모델을 기반으로 하는 기술 애플리케이션을 빠르게 시작할 수 있습니다. 이는 Alibaba Cloud AI 대형 모델이 실제로 상대적으로 우수하다는 것을 보여줍니다. 성숙하고 AI 응용 기능을 갖추고 있습니다.
모델 레이어부터 애플리케이션 레이어까지, AI 대형 모델부터 대형 모델 애플리케이션의 탄생까지, 겉으로는 단순해 보이지만 실제로 구현하기는 쉽지 않습니다. 일반적으로 수직적 응용은 일반 대형 모델의 기술적 기반을 기반으로 구현되며, 일반 대형 모델을 제외하면 일반적으로 구현이 불가능하며, 이를 위해서는 기반이 되는 일반 대형 모델이 충분히 성숙해야 합니다. 상대적으로 사용하기 쉽고 기존 제품의 기능을 뛰어넘는 애플리케이션을 출시하는 것은 매우 어렵습니다. Tongyi Tingwu를 예로 들면, 업계의 모든 플레이어가 Tongyi Tingwu의 기술적 강점을 공유하는 것은 아닙니다.
전체 시스템 AI 인프라가 승리의 열쇠입니다
대형 AI 모델 자체에 필요한 수천억 개의 매개변수 훈련 요구 사항의 관점에서 보면, 그 발전의 어려움과 복잡성은 외부 세계가 상상하는 것보다 훨씬 더 클 수 있습니다. 장기적으로는 풀스택 AI 대형모델 기술역량과 인프라 역량을 갖춘 기업만이 더 발전할 수 있을 것이다.
우선, 생성 AI의 개발 속도가 외부 기대치를 훨씬 뛰어넘기 때문에 단일 링크의 진행이 전체 대형 모델 훈련을 촉진하는 데 미치는 영향은 제한적입니다. OpenAI의 계산에 따르면 2012년부터 AI 모델 훈련 컴퓨팅 성능에 대한 전 세계 수요가 3~4개월 만에 두 배로 증가했으며 연간 성장률은 최대 10배에 이릅니다. 그러나 무어의 법칙에 따르면 칩 컴퓨팅 성능은 18~24개월마다 두 배로 증가할 수 있습니다. 이는 칩 성능이 대규모 AI 모델의 개발 요구 사항을 따라잡지 못한다는 것을 의미합니다. 관련 분야의 경우, CPU 기반 컴퓨팅 시스템은 대규모 모델 훈련을 위한 고대역폭 및 저지연 네트워크 전송 요구 사항을 충족하기 어렵습니다. 이러한 문제는 단일 컴퓨팅 성능에 의존하여 단기적으로 효과적일 수 없습니다. ", 그리고 경제적이지 않을 수 있습니다. 우리는 이러한 변화에 더 잘 대처하기 위해 알고리즘, 컴퓨팅 성능, 프레임워크 등의 다단계 전체 시스템 지원에 의존해야 합니다.
둘째, 범용 대형 모델을 개발하는 데 필요한 대규모 컴퓨팅 성능, 높은 추론 훈련 비용, 높은 데이터 볼륨 요구 사항으로 인해 임계값 자체가 매우 높으며 풀 스택 대형 모델 개발, 시나리오가 없습니다. 실행 능력, 생태적 개방성. 제한된 능력을 갖춘 기업은 빠른 이직률을 유지하기 어렵고 쉽게 제거될 수 있습니다. 업계 관계자의 분석에 따르면, 외부 상용화를 위해 수출할 수 있는 성공적인 범용 대형 모델을 만들기 위해 제조업체는 풀스택 대형 모델 교육 및 R&D 역량, 비즈니스 시나리오 구현 경험, AI 보안 거버넌스 대책 및 생태적 개방성 등 핵심 핵심 장점이 있으며, 일반 기업이 이러한 역량을 완전히 갖추기는 어렵습니다.
Alibaba Cloud는 아시아 1위이자 세계 3위의 클라우드 컴퓨팅 서비스 제공업체로서 중국에서 가장 강력한 컴퓨팅 성능 지원 시스템을 보유하고 있습니다. 예를 들어, Alibaba Cloud Feitian Cloud 운영 체제는 100,000개 단위의 단일 클러스터 규모와 1,000억 개의 파일의 컴퓨팅 용량을 달성할 수 있습니다. Feitian 지능형 컴퓨팅 플랫폼은 자체 개발한 네트워크 아키텍처로 90%의 병렬 효율성을 달성할 수 있습니다. 10,000개의 카드 규모의 AI 클러스터는 정체 없는 고성능 클러스터 통신 기능을 제공합니다. Alibaba Cloud의 자체 딥 러닝 플랫폼 PAI는 컴퓨팅 리소스 활용도를 3배 이상, AI 훈련 효율성을 11배, 추론 효율성을 6배 높일 수 있습니다. . 또한 Alibaba Cloud는 대규모 모델 개발 비용을 줄이고 알고리즘 측면에서 AI 포용성을 돕기 위해 중국 최대 AI 모델 서비스 커뮤니티인 "Magic"을 구축하는 데 앞장섰습니다. 모달 기능, 초대형 모델 및 범용 통합 모델은 많은 기술 측면에서 중국 최초의 계층에 속합니다. 이것이 Ali Tongyi의 대형 모델이 빠르게 "원에서 벗어날" 수 있는 핵심 이유입니다.
셋째, 비즈니스 가능성의 관점에서 전체 시스템 AI 인프라 역량을 갖춘 기업은 MaaS(Model as a Service)가 도래한 후 더 큰 비즈니스 가치를 갖게 될 것이며 시장 경쟁 측면에서 더 큰 "기동 여지"를 갖게 될 것입니다. . Alibaba Cloud를 예로 들면, 일반 대형 모델 서비스를 제공하여 플랫폼 서비스 수수료를 받을 수 있을 뿐만 아니라 컴퓨팅 파워를 임대하고 교육 플랫폼을 홍보하여 임대료를 얻을 수도 있습니다. 시장 경쟁에서는 상황에 따라 제품 가격을 유연하게 조정하여 운영 문제를 해결할 수 있습니다.
업계는 AI HP 시대를 맞이하고 있습니다
AI 대형 모델 애플리케이션의 탄생과 함께 깊은 AI 포괄성을 특징으로 하는 새로운 시대가 점차 시작되고 있습니다. AI는 산업체에 깊숙이 내장되어 있으며 되돌릴 수 없는 산업 트렌드가 될 것입니다.
한편으로는 일반 대형 모델의 높은 문턱과 수직 분야의 광범위한 차별화 요구로 인해 전용 대형 모델과 일반 대형 모델을 기반으로 한 산업용 애플리케이션이 향후 주류 애플리케이션 방향이 될 것으로 판단됩니다. 수천 가지 산업에 AI 진입. 앞서 언급한 바와 같이 범용 대형 모델의 문턱이 높다는 것은 국내외 소수의 기업만이 범용 대형 모델을 만들 수 있다는 것을 의미한다. 게다가 AI 모델이 대형화되면서 AI 산업은 경이적인 입장에서 움직이고 있다. "수제 작업장"으로 구성된 산업이 강화되기 위해서는 산업 생산을 완료하기 위해 고성능, 저비용의 체계적인 인프라가 필요합니다.
이러한 능력이 없는 중소기업이 많을 뿐만 아니라, 다양한 업계의 선두 기업이라 할지라도 0에서 1까지 대규모 모델 훈련을 최적화하는 것 자체는 모든 계층에 충분히 낮은 수준의 AI 인프라가 필요하기 때문에 경제적이지 않습니다. 비용. 그리고 기존 제조업체의 경우 계속해서 이 분야에 참여하여 "바퀴를 재발명"할 필요가 없습니다. 대조적으로, 대형 수직 모델의 훈련 비용은 상대적으로 낮고, 전문 분야에서 풍부한 데이터 시나리오를 보유한 일부 회사는 대형 수직 모델을 구축하기 위한 더 나은 조건과 더 나은 데이터 품질을 갖추고 있으며, 그들이 출시하는 제품은 수직 산업에 더 잘 적응합니다. 따라서 다양한 수직 산업의 GPT는 향후 주류 대형 모델 애플리케이션이 되어 AI가 업계에 빠르게 침투할 수 있습니다.
반면, 대규모 AI 모델 개발의 단기적인 병목 현상은 컴퓨팅 성능이고 장기적으로는 데이터입니다. 따라서 고품질 프런트 엔드 애플리케이션은 기업이 충분한 데이터 자산을 축적하고 성능을 향상시키는 데 도움이 될 수 있습니다. 장기적인 경쟁력을 확보하고 산업 응용 혜택 프로세스의 대중화를 가속화합니다. 현재 대형 모델의 빠른 반복과 진화로 인해 참여하는 모든 플레이어는 대규모 모델 훈련에 필요한 컴퓨팅 성능 지원을 보장하기 위해 지속적으로 컴퓨팅 리소스를 축적하고 칩, 클라우드 서비스 등 다양한 측면에서 구성을 최적화해야 합니다. 그러나 장기적으로 볼 때 대규모 AI 모델 훈련을 위한 알고리즘은 계속해서 최적화되고 조정되고 있습니다. 향후 알고리즘의 획기적인 발전으로 인해 컴퓨팅 성능은 더 이상 병목 현상이 되지 않을 수 있으며 고품질 데이터 리소스는 부족해질 것입니다. 자원. , 더 많은 관심을 받게 될 것입니다.
대형 AI 모델을 기반으로 한 업계 최초의 애플리케이션인 Tongyi Tingwu의 출시는 Alibaba가 고품질 데이터 리소스의 축적을 가속화하고, 산업 포용성 프로세스를 가속화하며, 장기적인 발전을 위한 좋은 기반을 마련하는 데 도움이 될 것입니다.
위 내용은 Tongyi Tingwu 탄생 비하인드, AI 대형 모델 대응 애플리케이션 첫 촬영의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!