찾다
기술 주변기기일체 포함QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

Qwen은 다른 모델을 조용히 추가하고 있습니다. 각 모델에는 너무 큰 기능과 크기가 너무 커져서 양자화되어 무시할 수 없습니다. QVQ, Qwen2.5-VL 및 Qwen2.5-Omni 이후 Qwen 팀은 이제 최신 모델 인 QWEN3을 발표했습니다. 이번에는 OpenAi의 O1, Gemini 2.5 Pro, DeepSeek R1 등과 같은 최고 모델과 경쟁하는 1,60 억 개의 매개 변수 모델에서 2,350 억 매개 변수 모델에 이르기까지 8 개의 다른 모델을 출시했습니다. 이 블로그에서는 QWEN3 모델을 자세히 살펴보고 기능, 아키텍처, 교육 프로세스, 성능 및 응용 프로그램을 이해합니다. 시작합시다.

목차

  • QWEN3 란 무엇입니까?
    • QWEN3 모델 소개
  • QWEN3의 주요 기능
    • 하이브리드 접근
    • 유연한 생각
    • MCP 및 에이전트 지원
    • 예비 및 사후 훈련 향상
    • 접근성 기능
  • QWEN3 모델 : 실습 응용 프로그램
    • 과제 1 : 복잡한 논리적 추론
    • 작업 2 : 코딩
    • 작업 3 : 이미지 분석
  • QWEN3 : 벤치 마크 성능
  • QWEN3 모델에 액세스하는 방법은 무엇입니까?
  • QWEN3 모델의 응용
  • 결론

QWEN3 란 무엇입니까?

Alibaba Group이 개발 한 Qwen3은 코딩, 추론 및 언어 처리와 같은 다양한 작업에서 뛰어나도록 설계된 3 세대 Qwen 모델입니다. QWEN3 패밀리는 235B, 30B, 32B, 14B, 8B, 4B, 1.7B 및 0.6 B 파라미터로 구성된 8 가지 모델로 구성됩니다. 모든 모델은 멀티 모달 의미이며 텍스트, 오디오, 이미지 및 비디오 입력을 취할 수 있으며 자유롭게 사용할 수 있습니다.

이 모델은 O1, O3-Mini, Grok 3, Gemini 2.5 Pro 등과 같은 최고 계층 모델과 경쟁합니다. 실제로이 최신 시리즈의 Qwen 모델은 인기있는 모델을 능가 할뿐만 아니라 비슷한 매개 변수 범주에서 기존 Qwen 시리즈 모델보다 크게 개선되었습니다. 예를 들어, QWEN-30B-A3B (30 억 활성화 된 매개 변수를 가진 300 억 파라미터) 모델은 320 억 개의 매개 변수가 모두 활성화 된 QWQ-32B 매개 변수 모델을 능가합니다.

QWEN3 모델 소개

QWEN3 시리즈에는 8 개의 모델이 제공되며 그 중 2 개는 MOE (Mix-of-Expert) 모델이며 다른 6 개는 조밀 한 모델입니다. 다음 표는 이러한 모든 모델에 대한 세부 사항으로 구성됩니다.

모델 이름 총 매개 변수 활성화 된 매개 변수 (MOE 모델의 경우) 모델 유형
QWEN3-235B-A22B 235 억 22 억 Moe (전문가 혼합)
QWEN3-30B-A3B 300 억 30 억 Moe (전문가 혼합)
QWEN3-32B 32 억 N/A 밀집한
QWEN3-14B 14 억 N/A 밀집한
QWEN3-8B 80 억 N/A 밀집한
QWEN3-4B 40 억 N/A 밀집한
Qwen3-1.7b 17 억 N/A 밀집한
Qwen3-0.6b 0.6 억 N/A 밀집한

QWEN3-235B-A22B 및 QWEN3-30B-A3B 네트워크의 다른 부분 또는 "전문가"와 같은 MOE 모델에서 다양한 입력에 따라 활성화되어 매우 효율적입니다. QWEN3-14B와 같은 조밀 한 모델에서는 모든 입력에 대해 모든 네트워크 부품이 활성화됩니다.

QWEN3의 주요 기능

다음은 QWEN3 모델에 대한 주요 하이라이트입니다.

1. 하이브리드 접근법

(i) 사고 모드 : 이 모드는 다단계 추론, 논리적 공제 또는 고급 문제 해결과 관련된 복잡한 작업을 처리 할 때 유용합니다. 이 모드에서 QWEN3 모델은 주어진 문제를 작고 관리 가능한 단계로 분류하여 답변에 도달합니다.

(ii) 생각이없는 모드 : 이 모드는 실시간 대화, 정보 검색 또는 간단한 Q & A와 같은 빠르고 효율적인 응답을 요구하는 작업에 이상적입니다. 이 모드에서 QWEN3 모델은 기존 지식 또는 간단한 웹 검색을 기반으로 답글을 신속하게 생성합니다.

이 접근 방식은 LLMS 기능을 더 잘 활용하고 신중한 토큰을 사용할 수 있으므로이 하이브리드 접근 방식은 이제 모든 최고 성능 LLMS에서 인기를 얻고 있습니다.

QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

2. Flexibile 사고

최신 QWEN3 시리즈 모델은 사용자에게 사고의 "깊이"를 제어 할 수 있도록합니다. 이것은 주어진 문제에 사용하려는 "사고"리소스 수준을 선택할 때 사용자가 선택할 수있는 첫 번째 기능입니다. 이를 통해 사용자는 주어진 작업에 대한 예산을 더 잘 관리 할 수 ​​있습니다. 비용과 품질 사이의 최적의 균형을 달성 할 수 있습니다.

3. MCP 및 에이전트 지원

그는 QWEN3 모델은 코딩 및 에이전트 기능에 최적화되었습니다. 또한 MCP (Model Context Protocol)에 대한 지원이 향상되었습니다. QWEN3 모델은 외부 환경과 더 나은 상호 작용 기능을 보여줌으로써 그렇게합니다. 또한 개선 된 "도구 호출"능력으로 포장되어 지능형 에이전트를 구축하는 데 필수적입니다. 실제로 그들은 Qwen 모델을 사용하여 지능형 에이전트를 생성 할 수있는 별도의 도구 인 "Qwen-Agent"를 발표했습니다.

4. 예비 및 사후 훈련

(i) 사전 훈련 : 사전 교체 과정은 3 단계 프로세스였습니다. 첫 번째 단계는 4K 컨텍스트 길이의 30 조 토큰 이상의 훈련과 관련이있었습니다. 두 번째 단계에는 STEM, 코딩 및 추론 작업에 대한 교육이 포함되었으며, 최종 단계에는 긴 컨텍스트 데이터를 사용하여 컨텍스트 길이를 32k 토큰으로 확장하는 것이 포함되었습니다.

(ii) 교육 후 : 하이브리드 "사고"접근법을 지원하는 QWEN3 모델은 4 단계 추론 프로세스를 지원합니다. 4 단계는 긴 고려한 (COT) 콜드 스타트, 추론 기반 강화 학습 (RL), 사고 모드 융합 및 마지막으로 일반 강화 학습을 포함했습니다. 가벼운 모델의 훈련에는 기본 모델의 증류가 포함되었습니다.

QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

5. 접근성 기능

(i) 열린 무게 : 모든 QWEN3 모델은 Apache 2.0 라이센스에 따라 개방형 무게입니다. 즉, 사용자는 주요 제한없이 이러한 모델을 다운로드, 사용 및 수정할 수 있습니다.

(ii) 다국어 지원 : 이 모델은 현재 119 개 이상의 언어와 방언을 지원하므로 언어 ​​포괄성에 초점을 맞추는 몇 안되는 최신 LLM 중 하나입니다.

QWEN3 모델 : 실습 응용 프로그램

이제 모든 기능에 대해 자세히 논의 했으므로 이제 QWEN3 모델의 기능을 탐색해야합니다. 다음 세 가지 작업에서 QWEN3-235B-A22B, QWEN3-30B-A3B 및 QWEN3-32B의 다음 세 가지 모델을 테스트합니다.

  1. 복잡한 논리적 추론
  2. 코딩
  3. 이미지 분석

시작합시다.

과제 1 : 복잡한 논리적 추론

프롬프트 : “우주 비행사는 지구의 프레임에서 측정 된대로 0.8C (80% 빛의 80%)에서 지구에서 먼별로 이동합니다. 여행의 중간 지점에서 우주 비행사는 블랙홀 근처에서 우주를 우회하여 강한 중력 시간 팽창이 발생합니다. 우주 비행사에서 1 년 동안 지속됩니다. 그러나 그 지역에서는 시간이 지남에 비해 시간이 지남에 비해 시간이 지남에 비해 시간이 지어집니다.

우주 비행사는 우회를 포함하여 6 년만이 여행 중에 그들을 위해 6 년이 지났다고 주장했다.

특수 상대성 이론과 중력 시간 팽창 원리를 사용하여 우주 비행사의“6 년만 통과 된”주장이 알려진 상대 론적 영향과 일치하는지 평가하십시오. 균일 한 움직임과 블랙홀 근처에서 경험이있는 시간을 고려할 때 단계별 설명을 제공하십시오.”

모델 : QWEN3-30B-A3B

산출:

검토:

이 모델이 얼마나 빨리 작동하는지 인상적입니다! 문제를 단계별로 해결하고 각 단계를 간단하게 설명합니다. 그런 다음이 모델은 문제 문과 관련된 세부 계산을 제공 한 다음 결과를 결정적으로 생성합니다. 결과를 추가로 설명하고 모든 포인트가 효과적으로 커버되도록합니다.

작업 2 : 코딩

프롬프트 : "사용자는 날씨, 행사, 시간 및 가격대를 기반으로 자신에게 가장 적합한 복장을 제안하는 데 도움이되는 웹 페이지를 만듭니다."

모델 : QWEN3-235B-A22B

산출:

QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

검토:

이 모델은 모든 관련 입력으로 웹 페이지의 코드를 빠르게 생성했으며 Qwenchat 인터페이스 내에서 "아티팩트"기능을 사용하여 코드를 쉽게 테스트 할 수있었습니다. 코드가 구현 된 후 생성 된 웹 페이지에 세부 사항을 추가하고 몇 초 안에 내 요구 사항에 따라 의상 권장 사항을 얻었습니다! 이 모델은 정확도로 속도를 보여주었습니다.

작업 3 : 이미지 분석

프롬프트 : “다음 이미지를 분석하고 모델을“LiveCodebench”벤치 마크에서 성능의 하강 순서로 배열하십시오.

모델 : QWEN3-32B

산출:

검토:

이 모델은 이미지 분석에서 훌륭합니다. 두 이미지를 빠르게 스캔 한 다음이를 기반으로 한 모델은 우리가 요청한 형식으로 결과를 제공합니다. 이 모델의 가장 중요한 부분은 전체 정보를 얼마나 빨리 처리하고 출력을 생성하는지입니다.

QWEN3 : 벤치 마크 성능

마지막 섹션에서는 3 가지 다른 작업에서 3 가지 QWEN3 모델의 성능을 보았습니다. 세 가지 모델 모두 잘 수행되었으며 문제 해결에 대한 접근 방식으로 나를 놀라게했습니다. 이제 Qwen 시리즈의 다른 Top 모델 및 이전 모델과 비교하여 Qwen 모델의 벤치 마크 성능을 살펴 보겠습니다.

QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

OpenAI-O1, DeepSeek-R1, Grok 3, Gemini 2.5 Pro-QWEN-235B-A22B와 같은 최상위 계층 모델과 비교할 때 명확한 챔피언이므로 정당하게 그렇게합니다. 코딩 및 다국어 언어 지원 벤치 마크에서 훌륭한 성능을 제공합니다.

실제로 컴팩트 한 모델 QWEN3-32B도 여러 모델을 능가 할 수 있었기 때문에 많은 작업에 비용 효과적인 선택이되었습니다.

QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등

QWEN3 모델 : QWEN3-30B-A3B 및 QWEN3-4B는 이전 모델과 비교할 때 기존 모델의 대부분을 능가합니다. 이 모델은 더 나은 성능을 제공 할뿐만 아니라 비용 효율적인 가격으로 QWEN3 모델은 이전 버전보다 한 단계 더 올라갑니다.

또한 읽기 : Kimi K1.5 vs Deepseek R1 : Best of the Best Chinese LLMS

QWEN3 모델에 액세스하는 방법은 무엇입니까?

QWEN3 모델에 액세스하려면 다음 방법 중 하나를 사용할 수 있습니다.

  1. Qwenchat을 엽니 다

    Qwenchat으로 향하십시오.

  2. 모델을 선택하십시오

    화면 중앙의 왼쪽에있는 드롭 다운이있는 드롭 다운에서 작업하려는 모델을 선택하십시오.

  3. 훈련 후 및 미리 훈련 된 모델에 액세스합니다

    사후 훈련 된 모델과 미리 훈련 된 대응 물에 액세스하려면 포옹 얼굴, Modelscope 및 Kaggle로 가십시오.

  4. 모델 배포

    배포를 위해 SGLANG 및 VLLM과 같은 프레임 워크를 사용할 수 있습니다.

  5. 로컬로 모델에 액세스합니다

    이 모델에 로컬에 액세스하려면 Ollama, Lmstudio, MLX, LLAMA.CPP 및 KTRANSFORMERS와 같은 도구를 사용하십시오.

QWEN3 모델의 응용

QWEN3 모델은 인상적이며 다음과 같은 작업에 큰 도움이 될 수 있습니다.

  1. 에이전트 빌딩 : QWEN3 모델은 AI 에이전트를 개발하기에 이상적인 선택이 될 수있는 향상된 기능 부호 기능으로 개발되었습니다. 그런 다음이 에이전트는 금융, 의료, HR 등과 관련된 다양한 작업을 도와 줄 수 있습니다.
  2. 다국어 작업 : QWEN3 모델은 다양한 언어로 교육을 받았으며 여러 언어에서 지원이 필요한 도구를 개발하는 데 큰 부가 가치가 있습니다. 여기에는 실시간 언어 번역, 언어 분석 및 처리와 같은 작업이 포함될 수 있습니다.
  3. 모바일 애플리케이션 : 작은 크기의 QWEN3 모델은 같은 범주의 다른 SLM보다 훨씬 우수합니다. 이들은 LLM 지원으로 모바일 애플리케이션을 개발하는 데 사용될 수 있습니다.
  4. 복잡한 문제에 대한 의사 결정 지원 : 모델에는 예측, 자산 계획 및 자원 관리와 같은 복잡한 문제를 해결하는 데 도움이되는 사고 모드가 제공됩니다.

결론

OpenAI 및 Google과 같은 최고 회사의 각 최신 LLM이 매개 변수를 추가 한 세계에서 QWEN3 모델은 모델 중 가장 작은 모델에도 효율성을 가져옵니다. 이들은 모든 사람을 위해 자유롭게 시도 할 수 있으며 개발자가 놀라운 응용 프로그램을 만들도록 공개적으로 제공되었습니다.

이 모델이 획기적입니까? 어쩌면 그렇지는 않지만 더 나은가요? 확실히 그래! 또한 유연한 사고로 이러한 모델을 사용하면 사용자가 작업의 복잡성에 따라 리소스를 할당 할 수 있습니다. 나는 항상 Qwen 모델 릴리스를 기대합니다. 왜냐하면 그들이하는 일은 품질과 기능을 포장하고 대부분의 최고 모델이 여전히 달성 할 수 없었던 결과를 펀치하기 때문입니다.

위 내용은 QWEN3 모델 : 액세스 방법, 기능, 응용 프로그램 등의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
7 강력한 AI 프롬프트 모든 프로젝트 관리자가 지금 마스터 해야하는 경우7 강력한 AI 프롬프트 모든 프로젝트 관리자가 지금 마스터 해야하는 경우May 08, 2025 am 11:39 AM

Chatgpt와 같은 챗봇에서 예시 된 Generative AI는 프로젝트 관리자에게 워크 플로를 간소화하고 프로젝트가 일정과 예산 내에서 유지되도록 강력한 도구를 제공합니다. 그러나 올바른 프롬프트를 제작하는 데 효과적으로 사용됩니다. 정확하고 세부 사항

AI 자체의 도움이되는 도움을 통해 애매한 AGI의 잘못 정의 된 의미 정의AI 자체의 도움이되는 도움을 통해 애매한 AGI의 잘못 정의 된 의미 정의May 08, 2025 am 11:37 AM

인공 일반 지능 (AGI)을 정의하는 과제는 중요합니다. AGI 진보에 대한 주장에는 종종 정의 된 연구 방향에 맞게 정의 된 정의와 함께 명확한 벤치 마크가 부족합니다. 이 기사는 정의에 대한 새로운 접근법을 탐구합니다

IBM은 2025 년이 생성 AI에서 Watsonx.data의 역할을 보여줍니다IBM은 2025 년이 생성 AI에서 Watsonx.data의 역할을 보여줍니다May 08, 2025 am 11:32 AM

IBM WATSONX.DATA : 엔터프라이즈 AI 데이터 스택을 간소화합니다 IBM은 Watsonx.data를 정확하고 확장 가능한 생성 AI 솔루션의 전달을 가속화하기위한 기업을위한 중추 플랫폼으로 위치합니다. 이것은 불만을 단순화하여 달성됩니다

휴머노이드 로봇 기계의 부상이 가까워지고 있습니다.휴머노이드 로봇 기계의 부상이 가까워지고 있습니다.May 08, 2025 am 11:29 AM

AI와 재료 과학의 혁신으로 인해 로봇 공학의 급속한 발전은 새로운 휴머노이드 로봇 시대를 안내 할 준비가되어 있습니다. 수년 동안 산업 자동화는 주요 초점 이었지만 로봇의 기능은 빠르게 exp입니다.

Netflix Revamps Interface-AI 검색 도구와 Tiktok와 같은 디자인 데뷔Netflix Revamps Interface-AI 검색 도구와 Tiktok와 같은 디자인 데뷔May 08, 2025 am 11:25 AM

10 년 만에 Netflix 인터페이스의 가장 큰 업데이트 : 더 똑똑하고 개인화 된 다양한 콘텐츠 수용 Netflix는 10 년 만에 사용자 인터페이스의 최대 개정을 발표했으며, 새로운 모습뿐만 아니라 각 쇼에 대한 더 많은 정보를 추가하고, "주변"및보다 유연한 구조와 같은 모호한 개념을 이해할 수있는 더 스마트 한 AI 검색 도구를 소개하여 비디오 게임, 라이브 이벤트, 스포츠 이벤트 및 기타 새로운 유형의 컨텐츠를 더 잘 보여줍니다. 트렌드를 따라 잡기 위해 모바일의 새로운 수직 비디오 구성 요소를 사용하면 팬이 트레일러와 클립을 쉽게 스크롤하거나 전체 쇼를 보거나 다른 사람들과 콘텐츠를 공유 할 수 있습니다. 이것은 무한한 스크롤과 매우 성공적인 짧은 비디오 웹 사이트 ti를 상기시킵니다.

AGI보다 오래 전에 : 당신에게 도전 할 3 개의 AI 이정표AGI보다 오래 전에 : 당신에게 도전 할 3 개의 AI 이정표May 08, 2025 am 11:24 AM

인공 지능에서 일반 정보 (AGI)에 대한 논의가 커지면 인공 지능이 인간 지능을 능가 할 때 어떤 일이 발생하는지 생각해 보았습니다. 이 순간이 가까운지 또는 멀리 떨어져 있는지 여부는 당신이 물어 보는 사람에 달려 있지만, 그것이 우리가 집중해야 할 가장 중요한 이정표라고 생각하지 않습니다. 어떤 초기 AI 이정표가 모든 사람에게 영향을 미칩니 까? 어떤 이정표가 달성 되었습니까? 내가 생각한 세 가지가 있습니다. 인공 지능은 인간의 약점을 능가합니다 2022 년 영화 "Social Dilemma"에서 Humane Technology Center의 Tristan Harris는 인공 지능이 인간의 약점을 능가했다고 지적했다. 이것이 무엇을 의미합니까? 이것은 인공 지능이 인간을 사용할 수 있음을 의미합니다.

TransUnion의 플랫폼 변환 및 AI 야망에 대한 Venkat AchantaTransUnion의 플랫폼 변환 및 AI 야망에 대한 Venkat AchantaMay 08, 2025 am 11:23 AM

TransUnion의 CTO 인 Ranganath Achanta는 2021 년 후반 Neustar 인수 후 회사에 합류 한 이후 상당한 기술 변화를 주도했습니다. 다양한 부서의 7,000 명 이상의 직원들에 대한 그의 리더십

AI에 대한 신뢰가 높아지면 생산성이 뒤 따릅니다AI에 대한 신뢰가 높아지면 생산성이 뒤 따릅니다May 08, 2025 am 11:11 AM

신뢰 구축은 비즈니스에서 성공적인 AI 채택을 위해 가장 중요합니다. 이것은 비즈니스 프로세스 내에서 인적 요소를 고려할 때 특히 사실입니다. 다른 사람과 마찬가지로 직원은 AI와 그 구현에 대한 우려를 주었다. Deloitte 연구원은 SC입니다

See all articles

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

Dreamweaver Mac版

Dreamweaver Mac版

시각적 웹 개발 도구

WebStorm Mac 버전

WebStorm Mac 버전

유용한 JavaScript 개발 도구

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 영어 버전

SublimeText3 영어 버전

권장 사항: Win 버전, 코드 프롬프트 지원!

MinGW - Windows용 미니멀리스트 GNU

MinGW - Windows용 미니멀리스트 GNU

이 프로젝트는 osdn.net/projects/mingw로 마이그레이션되는 중입니다. 계속해서 그곳에서 우리를 팔로우할 수 있습니다. MinGW: GCC(GNU Compiler Collection)의 기본 Windows 포트로, 기본 Windows 애플리케이션을 구축하기 위한 무료 배포 가능 가져오기 라이브러리 및 헤더 파일로 C99 기능을 지원하는 MSVC 런타임에 대한 확장이 포함되어 있습니다. 모든 MinGW 소프트웨어는 64비트 Windows 플랫폼에서 실행될 수 있습니다.