>기술 주변기기 >일체 포함 >정밀 저격수 라마 3.1? Mistral AI 오픈 소스 Large 2, 123B는 Llama 405B와 비슷합니다.

정밀 저격수 라마 3.1? Mistral AI 오픈 소스 Large 2, 123B는 Llama 405B와 비슷합니다.

WBOY
WBOY원래의
2024-07-25 14:24:56966검색

AI 경주는 이전과는 비교할 수 없을 정도로 가속화되고 있으며 어제 Meta가 새로운 오픈 소스 Llama 3.1 모델을 출시한 후 프랑스 AI 스타트업 Mistral AI가 경쟁에 합류했습니다.

지금 Mistral AI는 차세대 주력 오픈 소스 모델인 Mistral Large 2를 발표했습니다. 이 모델은 1,230억 개의 매개변수를 갖고 있으며 코드 생성, 수학, 수학 측면에서 OpenAI 및 Meta의 최신 최첨단 모델과 동등합니다. 추론, 그리고 더.

Llama 3.1 405B 출시에 이어 Mistral Large 2 출시로 갑자기 오픈소스 대형 모델의 궤적이 활기를 띠게 되었는데, 이 모델의 특징은 - "충분히 크다"입니다.

구체적으로는 Mistral Large 2의 매개변수 수가 Llama 3.1의 4,050억에 비해 낮지만 둘의 성능은 거의 비슷합니다. 그리고 여러 벤치마크에서 GPT-4o 및 Anthropic의 Claude 3.5 Sonnet과 비교할 수 있습니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

올해 2월 Mistral AI는 원래 대형 모델을 출시했습니다. 이 모델의 컨텍스트 창에는 32,000개의 토큰이 포함되어 있습니다. 모델의 새 버전은 이를 기반으로 구축되었으며 128,000(대략 동일)의 더 큰 컨텍스트 창을 갖습니다. 책) 300페이지 책) - OpenAI의 GPT-4o 및 GPT-4o mini 및 Meta의 Llama 3.1과 일치합니다.

현재 Mistral Large 2는 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 아랍어, 힌디어, 러시아어, 중국어, 일본어, 한국어를 포함한 수십 가지 언어와 Python, Java, C, C++, 자바스크립트, 배시.

Mistral AI는 새로운 모델이 계속해서 비용 효율성, 속도 및 성능의 경계를 넓히는 동시에 사용자에게 고성능 AI 애플리케이션을 구축할 수 있는 고급 기능 호출 및 검색을 포함한 새로운 기능을 제공할 것이라고 지적합니다.

단, 미스트랄 라지 2는 공개되어 있지만 연구 및 비상업적 용도로 제한되어 있다는 점은 주목할 만합니다. 개방형 가중치를 제공하므로 제3자가 필요에 따라 모델을 미세 조정할 수 있습니다. 본 계약은 사용자의 사용 조건에 대한 중요한 제한 사항입니다. Mistral Large 2의 자체 배포가 필요한 상업적 사용을 위해서는 Mistral AI 상용 라이선스를 사전에 취득해야 합니다.

성능

여러 평가 지표에서 미스트랄 라지 2는 성능과 서비스 비용 측면에서 새로운 기준을 세웠습니다. 특히 MMLU에서는 사전 훈련된 버전이 84.0%의 정확도를 달성했습니다.

코드 및 추론

Mistral AI는 Codestral 22B 및 Codestral Mamba에 대한 이전 경험을 바탕으로 코드의 상당 부분에 대해 Mistral Large 2를 교육했습니다.

Mistral Large 2는 이전 세대 Mistral Large보다 훨씬 뛰어난 성능을 발휘하며 GPT-4o, Claude 3 Opus 및 Llama 3 405B와 같은 최고 모델과 동등합니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

Mistral AI는 모델의 추론 능력을 향상시키기 위해 많은 노력을 기울였습니다. 핵심 포인트 중 하나는 모델이 '환각'을 생성하는 경향을 최소화하거나 합리적으로 보이지만 실제로는 부정확하거나 잘못된 정보를 생성하는 것입니다. 무관하다. 이는 모델을 보다 세심하고 예리하게 반응하도록 미세 조정하여 신뢰할 수 있고 정확한 출력을 제공함으로써 달성됩니다.

또한 Mistral Large 2는 해결책을 찾을 수 없거나 자신감 있는 답변을 제공할 만큼 충분한 정보가 없는 경우 이를 인정합니다. 이러한 정확성 추구는 향상된 추론 및 문제 해결 기능을 보여주는 다음 그래프와 함께 수학 벤치마크의 향상된 모델 성능에 반영됩니다. >​                             ' s ' ' s ' s ' s 코드 생성 벤치마크의 성능 정확도(모든 모델은 모두 동일한 평가 프로세스를 통해 벤치마킹됩니다). L Multipl-E의 성능 정확도(Paper를 제외하고 모든 모델은 동일한 평가 프로세스로 테스트됨)

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

                          GSM8K(8샷) 및 MATH(0샷, CoT 없음) 세대 벤치마크의 성능 정확도(모든 모델은 동일한 평가 프로세스를 통해 벤치마킹되었습니다).

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

준수 및 정렬 지침

Mistral AI는 Mistral Large 2의 명령 따르기 및 대화 기능을 크게 향상시켰습니다. 새로운 Mistral Large 2는 특히 정확한 지침을 따르고 길고 여러 차례 대화를 처리하는 데 능숙합니다. T MT-Bench, Wild Bench, Arena Hard 벤치마크 테스트에서의 성능은 다음과 같습니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

범용 정렬 테스트에서의 모델 성능 (모든 모델은 동일한 평가 PIPELINE으로 테스트됨) 일부 벤치마크에서는 더 긴 답변을 생성하면 평점이 향상되는 경향이 있습니다. 그러나 많은 상용 애플리케이션에서는 간결한 모델 생성이 상호 작용 속도를 높이고 추론 비용을 낮추기 때문에 단순성이 중요합니다.

그래서 Mistral AI는 생성하는 콘텐츠가 최대한 간결하고 간결하도록 많은 노력을 기울입니다.

다음 그림은 MT Bench 벤치마크 질문에서 다양한 모델이 생성한 응답의 평균 길이를 보여줍니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

Language Diversity

오늘날 많은 상용 애플리케이션 시나리오에는 다국어 문서 처리가 포함됩니다. Mistral Large 2는 특히 영어, 프랑스어, 독일어, 스페인어, 이탈리아어, 포르투갈어, 네덜란드어, 러시아어, 중국어, 일본어, 한국어, 아랍어 및 힌디어로 된 대량의 다국어 데이터에 대해 훈련되었습니다.

다음은 이전 Mistral Large, Llama 3.1 모델 및 Cohere의 Command R+

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

                                                      언어 MMLU 성능(기본 사전 훈련 모델로 측정)

도구 사용 및 함수 호출

Mistral Large 2는 향상된 함수 호출 및 검색 기술을 갖추고 있으며, 병렬 및 순차 함수 호출을 능숙하게 수행하도록 훈련되었습니다. 복잡한 비즈니스 애플리케이션을 위한 강력한 엔진이 될 수 있습니다.

아래 그림은 함수 호출 측면에서 Mistral Large 2와 다른 주류 모델의 정확도 비교를 보여줍니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

Mistral Large 2를 사용해 보세요

사용자는 mistral-large라는 이름의 la Plateforme에서 Mistral Large 2를 사용할 수 있습니다. -2407이며 le Chat에서 테스트되었습니다. 해당 버전은 24.07(Mistral은 모든 모델에 대해 YY.MM 버전 번호 지정 시스템을 사용함)이고 API 이름은 mistral-large-2407입니다.

HuggingFace에서 호스팅되는 교육 모델의 가중치가 제공됩니다.

Weight 링크: https://huggingface.co/mistralai/Mistral-Large-Instruct-2407

Mistral AI는 la Plateforme의 제품을 두 가지 일반 모델인

Mistral Nemo

와 Mistral Large로 통합하고 있습니다. 전문 모델: Codestral 및 Embed. Plateforme에 따라 이전 모델을 단계적으로 폐지함에 따라 모든 Apache 모델(Mistral 7B, Mixtral 8x7B 및 8x22B, Codestral Mamba, Mathstral 포함)은 Mistral AI SDK(mistral-inference 및 mistral-finetune Fine tune)를 사용하여 계속 배포 및 배포할 수 있습니다. 오늘부터 그들은 Plateforme에 맞게 미세 조정 기능을 확장했습니다. 이제 Mistral Large, Mistral Nemo 및 Codestral에서 작업합니다.

또한 Mistral AI는 클라우드 서비스 제공업체와 협력하고 있으며 Mistral Large 2는 곧 이러한 플랫폼에서 제공될 예정입니다. Mistral AI는 Google Cloud Platform과의 파트너십을 확장하여 Managed API를 통해 Mistral AI의 모델을 Vertex AI로 가져왔습니다. 그동안 Amazon Bedrock, Azure AI Studio 및 IBM watsonx.ai에서도 찾을 수 있습니다.

精准狙击Llama 3.1?Mistral AI开源Large 2,123B媲美Llama 405B

참조링크:

https://mistral.ai/news/mistral-large-2407/

https://venturebeat.com/ai/mistral- 충격-새로운-오픈-모델-미스트랄-대형-2-take-on-llama-3-1/

https://techcrunch.com/2024/07/24/mistral-releases- 대형-2-메타-openai-ai-모델/

위 내용은 정밀 저격수 라마 3.1? Mistral AI 오픈 소스 Large 2, 123B는 Llama 405B와 비슷합니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.