>  기사  >  기술 주변기기  >  Mistral은 Microsoft와 협력하여 "소규모 언어 모델"에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral은 Microsoft와 협력하여 "소규모 언어 모델"에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

WBOY
WBOY앞으로
2023-12-17 14:15:35550검색

최근 '작은 언어 모델'이 갑자기 화제가 됐습니다

월요일, 방금 4억 1,500만 달러의 자금 조달을 완료한 프랑스 AI 스타트업 Mistral이 Mixtral 8x7B 모델을 출시했습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

이 오픈 소스 모델은 크기가 크지 않고 메모리 100GB 이상의 컴퓨터에서 실행할 수 있을 만큼 작지만 일부 벤치마크 테스트에서 GPT-3.5와 연결될 수 있으므로 빠르게 개발자들 사이에서 인기를 얻었고 많은 칭찬을 받았습니다.

Mixtral 8x7B라고 불리는 이유는 특정 작업을 처리하도록 훈련된 다양한 소형 모델을 결합하여 작업 효율성을 높이기 때문입니다.

이 "희소 전문가 혼합" 모델은 구현하기가 쉽지 않습니다. OpenAI는 MoE 모델을 제대로 실행하지 못해 올해 초 모델 개발을 포기해야 했다고 합니다.

다음 날 Microsoft는 Phi-2 소형 모델의 새 버전을 출시했습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Phi-2에는 27억 개의 매개변수만 있는데, 이는 Mistral보다 훨씬 작고 휴대폰에서 실행하기에 충분합니다. 이에 비해 GPT-4의 매개변수 크기는 최대 1조에 달합니다.

Phi-2는 엄선된 데이터 세트로 학습되며 데이터 세트의 품질도 충분히 높기 때문에 모바일의 컴퓨팅 성능이 전화는 제한되어 있으므로 모델이 정확한 결과를 생성할 수 있습니다.

Microsoft나 다른 소프트웨어 제조업체가 소형 모델을 어떻게 사용할지는 확실하지 않지만, 가장 분명한 이점은 AI 애플리케이션을 대규모로 실행하는 비용을 줄이고 생성 AI 기술의 애플리케이션 범위를 크게 넓힌다는 것입니다.

이것은 중요한 이벤트입니다

Mistral-medium 코드 생성이 GPT-4를 완전히 능가합니다

최근 Mistral-medium이 내부 테스트를 시작했습니다

오픈 소스 Mistral을 비교한 블로거- 코드 Medium 및 GPT-4의 생성 기능을 비교하면 결과에 따르면 Mistral-medium은 GPT-4보다 강력한 코드 생성 기능을 갖고 있지만 비용은 GPT-4의 30%에 불과합니다!

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

총 가격은 다음과 같습니다.

Mistral은 효율적으로 작동하며 수행된 작업의 품질도 매우 높습니다.

2) 토큰은 긴 설명 출력에 낭비되지 않습니다

3) 제공된 제안은 매우 구체적입니다

먼저 피보나치 소수의 PyTorch 데이터 세트를 생성하기 위한 cuda 최적화 코드를 작성하세요

Mistral-Medium에서 생성된 코드는 심각하고 완전합니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

GPT-4에서 생성된 코드는 거의 괜찮습니다.

토큰을 많이 낭비하지만 유용한 정보를 출력하지 않습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

그러면 GPT-4는 뼈대 코드만 제공하고 구체적인 관련 코드는 제공하지 않습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

두 번째 질문은 효율적인 Python 코드를 작성하여 약 10억 개의 대규모 Apache HTTP 액세스 파일을 SqlLite 데이터베이스로 가져온 다음 이를 사용하여 sales.html 및 product.html에 대한 액세스 히스토그램을 생성하는 것입니다.

Mistral 출력은 다음과 같습니다. 매우 좋습니다. 로그 파일이 CSV 형식이 아니지만 수정이 매우 간단합니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

이전에 이 블로거는 여러 코드 생성 모델을 테스트했으며 GPT-4가 항상 1위를 차지했습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.현재 강력한 경쟁자인 미스트랄-매체가 드디어 등장하여 왕좌에서 밀려났습니다

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

단 두 가지 사례만 공개되었지만 블로거가 여러 가지 질문을 테스트한 결과 결과는 비슷했습니다.

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

Mistral-medium이 코드 생성 품질 측면에서 더 나은 경험을 제공한다는 점을 고려하여 모든 곳의 코드 어시스턴트에 통합되어야 한다고 제안했습니다.

누군가 1000개 토큰당 입력 및 출력을 계산했습니다. Mistral-medium의 비용은 GPT-4에 비해 70% 직접적으로 절감되는 것으로 나타났습니다!

실제로 토큰 수수료를 70% 절약하는 것은 큰 일입니다. 또한 간결한 출력을 통해 비용을 더욱 절감할 수 있습니다

Mistral은 Microsoft와 협력하여 소규모 언어 모델에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.

위 내용은 Mistral은 Microsoft와 협력하여 "소규모 언어 모델"에 혁명을 가져왔습니다. Mistral의 중간 크기 코드 기능은 GPT-4를 능가하고 비용은 2/3로 절감됩니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
이 기사는 51cto.com에서 복제됩니다. 침해가 있는 경우 admin@php.cn으로 문의하시기 바랍니다. 삭제