해외에서 GPT-3.5가 출시된 지 1년도 채 되지 않아, 중국에서 Wenxinyiyan이 출시된 지 반년도 채 지나지 않아 중국은 '100대 모델 대결'에 돌입했습니다. 참가자에는 대규모 제조업체와 수많은 신생 기업이 모두 포함됩니다. 하지만 대형 모델 경쟁이 치열하고, 기업 사용자의 눈썰미가 좋지 않으면 함정에 빠져 프로젝트가 무산될 가능성이 크다.
Wenxin Large Models, Tongyi Qianwen, Pangu Large Models 등과 같은 일부 주요 제조업체의 대형 모델 간의 격차가 점차 확대되고 있습니다. SuperCLUE의 최신 평가 목록에 따르면 Wen Xinyiyan은 GPT-3.5turbo를 능가했으며 GLM-130B 등 국내 대형 모델도 목록 상위권에 올랐습니다. 국산 대형 모델은 양적으로 세계에서 중요한 부분을 차지하게 되었고, 품질 면에서도 가장 앞선 GPT-4를 빠르게 따라잡고 있습니다.
업계에서는 '100개 모델 대결' 이면에 대형 모델 기술 혁신이 산업 디지털화를 촉진하고 수조 달러의 시장 가치를 창출할 것으로 낙관하고 있다. 현재 관점에서 볼 때 Wen Xinyiyan과 Tongyi Qianwen으로 대표되는 '주요 제조업체가 생산한' 대형 모델은 기술 수준에서 지배적인 위치를 차지하고 있으며, 산업 생태계를 구축함으로써 더 많은 프로젝트 협력을 확보했습니다.
대형 제조사에서 생산하는 대형 모델이 스타트업 기업보다 더 강력하고 고객들에게 더 인기가 많은 이유는 무엇일까요? 저자가 생각하는 이유는 크게 세 가지로 나뉜다.
우선 대형 모델은 결국 산업 시나리오에 적용되어야 하며, 이는 단순한 '일회성 거래'가 아니다. 더 큰 안정성, 보안성 및 신뢰성의 상징으로 주요 제조업체는 일반적으로 AI 기술 기반이 충분히 축적되어 있습니다. 기업 고객은 애플리케이션 수준에 집중하는 경향이 있으며 반드시 기본 AI 기술을 강력하게 축적한 것은 아닙니다. 바이두(Baidu), 알리바바(Alibaba), 화웨이(Huawei) 등 주요 제조사들은 실제 전투에서 테스트된 AI 기반을 구축했다. 스타트업을 보면 기술 혁신에 있어 눈부신 성과와 돌파구가 많다. 그러나 풀스택 AI 기술 기반 축적이라는 관점에서 보면 말이다. 장기적이고 안정적인 고객 서비스, 전반적인 성능과 배터리 수명은 여전히 의문입니다.
둘째, 대형 제조업체는 대형 모델 기술의 반복 개발에 투자할 수 있는 포괄적인 힘이 더 강해졌습니다. 예를 들어, Baidu는 전체 그룹을 동원하여 Wenxin Yiyan을 개발할 수 있습니다. Wenxin Big Model 3.5의 최신 버전은 버전 3.0보다 추론 속도가 17배 빠르고 모델 효과가 50% 이상 향상되었습니다. 반면, 광년 떨어진 가장 인기 있는 스타트업 회사는 반년도 채 안 되어 메이투안에 "매각"하기로 결정했습니다. 오픈소스 기술을 기반으로 개발된 일부 대형 모델에는 기반 기술 축적과 자율 개발 역량이 부족합니다.
시장 조사업체 IDC가 최근 발표한 '2023년 AI 대형 모델 기술 역량 평가 보고서'에 따르면 바이두원신 대형 모델 3.5는 '알고리즘 모델'과 '산업 커버리지' 등 12개 지표에서 7점 만점을 기록했다. 전체 점수에서 1위를 차지했으며 2위를 차지한 Alibaba Tongyi Large Model은 11개 지표 중 6개 지표에서 만점을 받았으며 '서비스 역량'에서 만점을 받은 유일한 제조업체였습니다.
셋째, 산업 시나리오에서의 대형 모델 구현, 후속 서비스 제공, 운영 및 유지 관리 등은 대형 제조업체에게는 "숙달하기 쉽지만" 신생 기업에게는 어려운 과제입니다. 대형 제조업체는 수직 산업과 주요 고객에게 전담 서비스 팀을 제공하여 고객이 신기술 수용에 대한 걱정을 덜도록 할 수 있습니다. 그러나 신생 기업은 오픈 소스 기술을 기반으로 개발된 대형 모델 제품 애플리케이션에 대한 경험이 부족한 경우가 많습니다. 모든 측면에서 서비스를 잘 수행해야 합니다.
결론적으로 대형 모델은 다양한 기술적 매개변수뿐만 아니라 업계의 구현, 업계의 '노하우' 및 성공적인 경험도 살펴봅니다. 현재 주요 제조업체가 생산하는 제품은 기술 개발, 산업 응용 및 서비스 측면에서 지배적인 위치를 차지하고 있습니다. 물론, '100모델 전쟁'은 10년 전의 '100개 연대 전쟁'이 아닐 수도 있고, 결국 승자는 2명뿐일 수도 있다. 대형 모델은 아직 개발 초기 단계로, GPT-4를 능가할 가능성과 유럽, 미국의 경쟁 제품이 더 많아지는 등 앞으로 가능성이 더 많다.
위 내용은 기업이 대형 모델의 "구덩이에 진입"하는데 왜 대형 제조업체에서 생산하도록 권장합니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!