ホームページ >テクノロジー周辺機器 >AI >Deepseek' s Janus Pro 7b vs OpenaiのDall-E 3:どちらが良いですか?
DeepseekのJanus Pro-7B:強力なオープンソース画像生成モデル
最近の見出しは市場の変動と政治的変化に支配されていますが、1つの重要な発展が明らかになりました:Deepseek AIのJanus Pro-7B。中国のAI企業のこの最先端の画像生成モデルは、すでにOpenaiのDall-E 3とさまざまなベンチマークで安定した拡散を上回っています。 重要な差別化要因?オープンソースです!このブログ投稿では、DeepseekのJanus Pro-7BをDall-E 3といくつかのタスクで比較して、どのモデルが統治するかを判断します。
目次20を超えるベンチマークにわたる厳格なテストは、Janus Proの印象的な機能を明らかにしています。
テキストからイメージの生成:
geneval:は0.80のスコアを達成し、dall-e 3(0.67)および安定した拡散3培地(0.74)を上回りました。
スコア41.0%、Tokenflow-XL(38.7%)を上回る mme(マルチモーダル評価):
推論と文脈的理解の顕著な改善を示しました。デュアルエンコーダー:マルチモーダルの理解とテキストから画像の生成用の個別のエンコーダー干渉を最小限に抑え、タスク固有のパフォーマンスを最適化します。
タスク2:画像のバックストーリーを解き放ちます
プロンプト:「この画像の背後にあるバックストーリーを説明してください。」
(結果は元の表に類似したテーブルにまとめられており、バックストーリー解釈の精度と深さを比較しています。)
タスク3:画像生成チャレンジプロンプト:「深い青い目と金髪の髪を持つ少女の画像を生成し、鏡を見て、片方の手、顔の下、もう一方の手は、弾丸のある球根に照らされます。」 (両方のモデルで生成された画像を含める。)
タスク4:ミームの解釈
プロンプト: "このミームを説明してください
(結果と同様のテーブルにまとめられた結果、ミームの説明の精度と明確さを比較してください。) 最終評決:Janus Pro 7b vs. Dall-e 3
(各タスクの勝者を要約するテーブル。)
Janus Pro-7Bは、オープンソースの画像生成とマルチモーダルLLMの分野に大きく貢献しています。 Dall-E 3は現在、広範なトレーニングデータと統合により特定の実際のアプリケーションの優位性を保持していますが、Janus Pro-7Bのオープンソースの性質と特定の分野での強力なパフォーマンスは、研究者と開発者にとって貴重なツールになります。 さらなる開発は、将来それを手ごわい競争相手にすることを約束します。
よくある質問(元のFAQセクションを維持します。)
以上がDeepseek' s Janus Pro 7b vs OpenaiのDall-E 3:どちらが良いですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。