>기술 주변기기 >일체 포함 >DeepSeek ' S Janus Pro 7B vs Openai 's Dall-E 3 : 어느 것이 더 낫습니까?

DeepSeek ' S Janus Pro 7B vs Openai 's Dall-E 3 : 어느 것이 더 낫습니까?

Joseph Gordon-Levitt
Joseph Gordon-Levitt원래의
2025-03-08 09:10:14799검색

Deepseek의 Janus Pro-7b : 강력한 오픈 소스 이미지 생성 모델 최근의 헤드 라인은 시장 변동과 정치적 변화에 의해 지배되었지만, 한 가지 중요한 발전이 나왔다 : Deepseek AI의 Janus Pro-7b. 중국 AI 회사 의이 최첨단 이미지 생성 모델은 이미 다양한 벤치 마크에서 OpenAi의 Dall-E 3을 능가했으며 안정적인 확산을 능가했습니다. 주요 차별화 요소? 오픈 소스입니다! 이 블로그 게시물은 몇 가지 작업에서 Dall-E 3에 대한 DeepSeek의 Janus Pro-7B를 비교하여 어떤 모델이 최고를 통치하는지를 결정합니다. 목차

Deepseek Janus Pro 란 무엇입니까?

<: :> Janus Pro : 성능 벤치 마크

Janus-Pro : 훈련 방법론 및 건축 Janus pro 7b vs. dall-e 3 : 헤드 투 헤드 비교 작업 1 : 게임 결과 예측 작업 2 : 이미지 방출 백 스토리
    작업 3 : 이미지 생성 챌린지
  • 작업 4 : MEME 해석 최종 평결 : Janus Pro 7b vs. Dall-e 3
  • 결론 자주 묻는 질문
  • Deepseek Janus Pro 란 무엇입니까?
  • DeepSeek AI가 개발 한 Janus Pro는 정교한 멀티 모달 대형 언어 모델 (LLM)입니다. 전임자 인 Janus 모델을 바탕으로 다중 모드 이해와 텍스트-이미지 생성에 최적화 된 분리 된 아키텍처를 자랑합니다. Janus Pro는 3 단계 프로세스를 통해 다중 모드, 텍스트 및 미적 데이터를 포함하는 다양한 데이터 세트에 대해 교육을받은 복잡하고 상세한 프롬프트를 해석하는 데 탁월합니다. 현재 Janus-Pro-1B와 Janus-Pro-7B의 두 가지 버전으로 다양한 응용 프로그램에 확장 성을 제공합니다. <: :> Janus Pro : 성능 벤치 마크
  • 20 개가 넘는 벤치 마크에서 엄격한 테스트는 Janus Pro의 인상적인 기능을 보여줍니다.
  • 텍스트 투 이미지 생성 :
  • Geneval :
  • 는 Dall-E 3 (0.67) 및 안정적인 확산 3 배지 (0.74)를 능가하는 0.80 점수를 달성했습니다. dpg-bench :
  • 는 84.19%의 전체 정확도를 자랑하여 복잡한 프롬프트와의 능력을 보여줍니다.
  • 다중 모드 이해 :
  • MMMU (Multimodal Machine 이해) :
  • 41.0%, 성능이 우수한 Tokenflow-XL (38.7%) mme (멀티 모달 평가) :
  • 추론과 맥락적인 이해가 현저한 개선을 보여 주었다.
  • Janus-Pro : 훈련 방법론 및 건축 Janus-Pro의 개발은 디퍼링 된 아키텍처를 활용하는 3 단계 훈련 과정과 관련이 있습니다.
훈련 단계 :

    어댑터 프리 트레인 : 이미지 어댑터와 헤드는 Imagenet과 같은 데이터 세트를 사용하여 픽셀 종속성 모델링에 중점을 둔 사전에 사전에 사전에 사전입니다. 통합 사전 조정 :
  1. 멀티 모달 데이터 통합은 다양한 작업을위한 모델을 준비하여 단일 목적 데이터 세트에 대한 의존도를 줄입니다. 감독 된 미세 조정 : > 모델은 5 : 1 : 4의 교정 데이터 비율을 사용하여 정제되었습니다 (멀티 모달, 텍스트 및 텍스트-이미지 데이터). 아키텍처 개요 :
  2. 듀얼 인코더 : 멀티 모달 이해 및 텍스트-이미지 생성을위한 개별 인코더는 간섭을 최소화하고 작업 별 성능을 최적화합니다. 중앙 집중식 디코딩 모듈 : 공유 디코더는 정확한 출력에 대한 두 인코더의 통찰력을 통합합니다. 매개 변수 효율성 : 확장 가능한 아키텍처 (1B 및 7B 매개 변수 버전)는 다양한 계산 요구에 적응합니다. Janus pro 7b vs. dall-e 3 : 헤드 투 헤드 비교 이 비교는 Openai의 Dall-E 3 (Chatgpt를 통해 액세스)에 대해 Deepseek의 Janus Pro-7b (포옹을 통해 액세스 할 수 있음)를 구입합니다. 다양한 작업에서 결과를 분석 해 봅시다.
  3. 작업 1 : 게임 결과 예측
  4. 프롬프트 : "이미지의 점수를 기준으로 어느 팀이 이길 가능성이 더 높습니까?" (결과는 원본과 유사한 테이블에 요약되어 제공된 점수의 정확성과 해석을 비교합니다.) 작업 2 : 이미지 방출 백 스토리
프롬프트 : "이 이미지의 배경 이야기를 설명하십시오."

(결과는 원본과 유사한 표에 요약되어 백 스토리 해석의 정확도와 깊이를 비교합니다.) 작업 3 : 이미지 생성 챌린지

프롬프트 : "깊고 파란 눈과 금발 머리를 가진 소녀의 이미지를 생성하고, 거울을보고, 한 손은 얼굴 아래에, 다른 한 손은 그녀의 옆구리에 깜박 거리는 전구에 불을 붙입니다.
    (두 모델 모두에서 생성 된 이미지 포함.) 작업 4 : MEME 해석
  • 프롬프트 : "이 밈을 설명하십시오." (밈 설명의 정확성과 명확성을 비교하여 원본과 유사한 테이블에 요약되어 있습니다.) 최종 평결 : Janus Pro 7b vs. Dall-e 3
  • (각 작업의 승자를 요약 한 테이블)

    결론 Janus Pro-7b는 오픈 소스 이미지 생성 및 멀티 모달 LLM 분야에 상당한 기여를합니다. Dall-E 3은 현재 광범위한 교육 데이터 및 통합으로 인해 특정 실제 응용 프로그램에서 우위를 차지하고 있지만 Janus Pro-7B의 오픈 소스 특성과 특정 영역에서 강력한 성능은 연구원과 개발자에게 귀중한 도구입니다. 추가 개발은 미래에 강력한 경쟁자로 만들겠다고 약속합니다.

    자주 묻는 질문

    (원래 FAQ 섹션을 유지 관리)

위 내용은 DeepSeek ' S Janus Pro 7B vs Openai 's Dall-E 3 : 어느 것이 더 낫습니까?의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

성명:
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.