Mixtral 8x22b로 시작합니다-일체 포함-php.cn

집

기술 주변기기

일체 포함

Mixtral 8x22b로 시작합니다

William Shakespeare

Mar 07, 2025 am 09:02 AM

Mistral ai의 Mixtral 8x22b : 주요 오픈 소스 LLM 에 대한 깊은 다이빙 2022 년 Openai의 Chatgpt 도착은 기술 거인들 사이에서 경쟁력있는 대형 언어 모델 (LLM)을 개발하기 위해 경쟁을 일으켰습니다. Mistral AI는 주요 경쟁자로 부상하여 2023 년에 획기적인 7B 모델을 시작하여 크기가 작지만 기존의 모든 오픈 소스 LLM을 능가했습니다. 이 기사는 Mistral AI의 최신 업적 인 Mixtral 8x22B를 탐구하며, 아키텍처를 검토하고 검색 증강 세대 (RAG) 파이프 라인에서의 사용을 보여줍니다. . 믹스 트랄 8x22b의 구별 기능 2024 년 4 월에 출시 된 믹스 트랄 8x22B는 1,410 억 개의 매개 변수를 자랑하는 전문가 (SMOE) 아키텍처의 희소 혼합을 사용합니다. 이 혁신적인 접근법은 의 상당한 장점을 제공합니다 타의 추종을 불허하는 비용 효율성 :

Smoe Architecture는 탁월한 성능 대비 비율을 제공하여 오픈 소스 필드를 이끌고 있습니다. 아래 그림과 같이, 비슷한 모델보다 훨씬 적은 활성 매개 변수를 사용하여 고성능 수준을 달성합니다.

고성능 및 속도 : 1410 억 매개 변수를 보유하고있는 동안 드문 활성화 패턴은 추론 중에 390 억을 사용하여 Llama 2 70b와 같은 70 억 파라미터 밀리미터 밀리미자 모델의 속도를 초과합니다.

오픈 소스 LLM의 드문 기능인 Mixtral 8x22B는 64k-token 컨텍스트 창을 제공합니다.

Getting Started With Mixtral 8X22B 허용 라이센스 :

> 모델은 Apache 2.0 라이센스에 따라 릴리스되어 접근성과 미세 조정의 용이성을 촉진합니다.

믹스 트랄 8x22b 벤치 마크 성능 Mixtral 8x22b는 다양한 벤치 마크에서 LLAMA 70B 및 명령 R과 같은 주요 대안을 지속적으로 성능이 우수합니다. 다국어 기능 : 벤치 마크 결과에서 보여준 것처럼 영어, 독일어, 프랑스어, 스페인어 및 이탈리아어에 능숙합니다.
추론과 지식의 우수한 성과 : 는 공동 감각 추론 벤치 마크 (ARC-C, Hellaswag, MMLU)에서 탁월하며 강력한 영어 이해력을 보여줍니다.
예외적 인 수학 및 코딩 기술 : Mixtral 8x22b 수학 및 코딩 작업의 경쟁자를 크게 능가합니다.
스모제 아키텍처 이해 스모이 아키텍처는 전문가 팀과 유사합니다. Smoe는 모든 정보를 처리하는 단일 대형 모델 대신에 특정 작업에 중점을 둔 작은 전문가 모델을 사용합니다. 라우팅 네트워크는 정보를 가장 관련성이 높은 전문가에게 지시하여 효율성과 정확성을 향상시킵니다. 이 접근법은 몇 가지 주요 장점을 제공합니다

효율성 향상 :
계산 비용을 줄이고 처리 속도를 높입니다 강화 확장 성 :
훈련이나 추론에 영향을주지 않고 전문가를 쉽게 추가하십시오. 정확도가 높아짐 :
- SMOE 모델과 관련된 도전에는 훈련 복잡성, 전문가 선택 및 높은 메모리 요구 사항이 포함됩니다. 믹스 트랄 8x22b 로 시작하는 것 Mixtral 8x22B 사용에는 미스트랄 API : 가 포함됩니다 계정 설정 :
Conda를 사용하여 가상 환경을 설정하고 필요한 패키지 (Mistralai, Python-Dotenv, ipykernel)를 설치하십시오. API 키를 .env 파일에 단단히 저장하십시오

채팅 클라이언트 사용 :
:
MISTRALLIENT OBTER 및 ChatMESSAGE 클래스를 사용하여 모델과 상호 작용하십시오. 스트리밍은 더 긴 응답을 위해 사용할 수 있습니다.
1. 믹스 트랄 8x22b 응용 프로그램 텍스트 생성을 넘어 Mixtral 8x22b는 다음을 가능하게합니다
  임베딩 생성 :
  시맨틱 분석을 위해 텍스트의 벡터 표현을 만듭니다. paraphrase detection : 는 삽입 거리를 사용하여 유사한 문장을 식별합니다 Rag Pipelines : 는 외부 지식 소스를 통합하여 응답 정확도를 높입니다.
  기능 호출 :
  구조화 된 출력에 대한 사전 정의 된 함수를 트리거합니다 이 기사는 Mixtral 8x22B 및 Mistral API를 사용하여 임베딩 생성, 역설 탐지 및 기본 래그 파이프 라인 구축의 상세한 예를 제공합니다. 이 예제는 샘플 뉴스 기사를 사용하여 텍스트를 청크하고, 임베딩을 생성하고, 유사성 검색을 위해 FAISS를 사용하고, 믹스 트랄 8x22B가 검색된 컨텍스트에 따라 질문에 답변하는 프롬프트를 구성합니다. .
  결론 mixtral 8x22b는 오픈 소스 LLM에서 상당한 발전을 나타냅니다. Smoe Architecture, 고성능 및 허용 라이센스는 다양한 응용 프로그램에 유용한 도구입니다. 이 기사는 기능과 실질적인 사용에 대한 포괄적 인 개요를 제공하여 제공된 자원을 통해 잠재력을 더욱 탐색 할 수 있도록 장려합니다.

위 내용은 Mixtral 8x22b로 시작합니다의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명

본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

관련 기사

에이전트 걸레를 사용하여 지능형 FAQ 챗봇을 만드는 방법May 07, 2025 am 11:28 AM

AI 에이전트는 이제 크고 작은 기업의 일부입니다. 병원의 양식 작성 및 법률 문서 확인에서 비디오 장면 분석 및 고객 지원 처리에 이르기까지 모든 종류의 작업에 대한 AI 에이전트가 있습니다. 동료

공황에서 권력으로 : AI 시대에 리더가 배워야하는 어떤 지도자May 07, 2025 am 11:26 AM

인생은 좋다. 예측 가능 - 당신의 분석적 마음이 그것을 선호하는 방식으로. 당신은 오늘 사무실에 들려 마지막 순간의 서류를 마무리했습니다. 그 후 바로 당신은 파트너와 아이들을 햇볕이 잘 드는 휴가를 보내고 있습니다.

AGI를 예측하는 증거 수렴이 AI 전문가들의 과학적 합의를 능가 할 것이라고 왜May 07, 2025 am 11:24 AM

그러나 과학적 합의에는 딸꾹질과 gotchas가 있으며, 아마도 더 신중한 접근 방식은 양심으로도 알려진 증거의 수렴을 사용하는 것일 것입니다. 그것에 대해 이야기합시다. 혁신적인 AI 혁신에 대한이 분석은 나의

Studio Ghibli Dilemma - 생성 시대의 저작권 AIMay 07, 2025 am 11:19 AM

Openai 나 Studio Ghibli는이 이야기에 대한 의견 요청에 응답하지 않았습니다. 그러나 그들의 침묵은 창조적 인 경제에서 더 넓고 복잡한 긴장을 반영합니다. 생성 AI 시대에 저작권은 어떻게 기능해야합니까? 같은 도구와 함께

Mulesoft는 아연 도금 에이전트 AI 연결을위한 믹스를 공식화합니다May 07, 2025 am 11:18 AM

콘크리트와 소프트웨어는 모두 필요한 경우 강력한 성능을 위해 아연 도금 될 수 있습니다. 둘 다 스트레스 테스트를 할 수 있으며, 둘 다 시간이 지남에 따라 균열과 균열로 고통받을 수 있으며, 둘 다 분해되어 두 기능의 생산 인 "새로운 빌드"로 재현 할 수 있습니다.

Openai는 Windsurf를 구매하기 위해 30 억 달러의 계약을 체결 한 것으로 알려졌다May 07, 2025 am 11:16 AM

그러나 많은보고는 매우 표면 수준에서 멈 춥니 다. Windsurf가 무엇인지 알아 내려고한다면 Google 검색 엔진 결과 상단에 표시되는 신디케이트 된 콘텐츠에서 원하는 것을 얻지 못할 수도 있습니다.

모든 미국 어린이를위한 필수 AI 교육? 250 명 이상의 CEO가 예라고 말합니다May 07, 2025 am 11:15 AM

주요 사실 공개 서한에 서명 한 리더에는 Adobe, Accenture, AMD, American Airlines, Blue Origin, Cognizant, Dell, Dropbox, IBM, LinkedIn, Lyft, Microsoft, Salesforce, Uber, Yahoo 및 Zoom과 같은 유명 회사의 CEO가 포함됩니다.

우리의 안주 위기 : AI 속임수 탐색May 07, 2025 am 11:09 AM

이 시나리오는 더 이상 투기 소설이 아닙니다. 통제 된 실험에서 Apollo Research는 GPT-4가 불법적 인 내부자 거래 계획을 실행 한 다음 조사관에게 거짓말을하는 것을 보여주었습니다. 에피소드는 두 개의 곡선이 상승하고 있음을 생생하게 상기시켜줍니다.

See all articles

핫 AI 도구

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

Eclipse용 SAP NetWeaver 서버 어댑터

Eclipse를 SAP NetWeaver 애플리케이션 서버와 통합합니다.

mPDF는 UTF-8로 인코딩된 HTML에서 PDF 파일을 생성할 수 있는 PHP 라이브러리입니다. 원저자인 Ian Back은 자신의 웹 사이트에서 "즉시" PDF 파일을 출력하고 다양한 언어를 처리하기 위해 mPDF를 작성했습니다. HTML2FPDF와 같은 원본 스크립트보다 유니코드 글꼴을 사용할 때 속도가 느리고 더 큰 파일을 생성하지만 CSS 스타일 등을 지원하고 많은 개선 사항이 있습니다. RTL(아랍어, 히브리어), CJK(중국어, 일본어, 한국어)를 포함한 거의 모든 언어를 지원합니다. 중첩된 블록 수준 요소(예: P, DIV)를 지원합니다.