オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

王林

Apr 10, 2024 pm 03:16 PM

パラメータgpt-4karpathy

GPT-4を超えるオープンソースモデルが登場！

大型モデル分野の最新バトルレポート:

1,040 億パラメーターのオープンソースモデル Command R が 6 位に上昇し、GPT-4-0314 と同点となり、GPT-4-0613 を上回りました。。

オープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

これは、大型モデルの分野で GPT-4 を破った初の無差別級モデルでもあります。

大規模なモデルアリーナは、マスター Karpathy が信頼する唯一のテストベンチマークの 1 つです。

AI ユニコーン Cohere のコマンド R。この大規模モデルのスタートアップの共同創設者兼 CEO は、『トランスフォーマー』（小麦の刈り取り者と呼ばれる）の最年少著者、エイダンゴメスにほかなりません。

この戦闘レポートが公開されるとすぐに、大規模なモデルコミュニティで白熱した議論の波が再び起こりました。

誰もが興奮している理由は単純で、基本的な大型モデルが 1 年間展開されてきたためですが、予想外に、そのパターンは 2024 年にも発展し、変化し続けます。

HuggingFace の共同創設者である Thomas Wolf 氏は次のように述べています:

大規模モデル分野の状況は最近劇的に変化しました:

Anthropic の Claude 3 作品はクローズドソースモデルにあります。彼らの間で先頭に立ってください。

Cohere の Command R は、オープンソースモデルの中で最も強力になりました。

予想外なことに、2024 年には、人工知能チームはオープンソースとクローズドソースの両方のルートで急速に開発されるでしょう。

さらに、Cohere Machine Learning ディレクターの Nils Reimers 氏も注目に値することを指摘しました。

Command の最大の特徴R は、組み込みの RAG (Retrieval Enhanced Generation) が完全に最適化されていますが、大規模モデルの分野では、RAG などのプラグイン機能はテストに含まれていませんでした。

RAG 最適化モデルがオープンソースの王座に上り詰める

Cohere の公式の位置づけでは、Command R は「RAG 最適化」です。モデル" 。

つまり、1,040 億個のパラメータを持つこの大規模モデルは、幻覚の生成を減らす検索強化生成テクノロジ向けに深く最適化されており、エンタープライズレベルのワークロードにより適しています。

以前に起動した Command R と同様に、Command R のコンテキストウィンドウの長さは 128k です。

さらに、Command R には次の機能もあります:

英語、中国語、フランス語、ドイツ語などを含む 10 言語をカバー;
使用可能複雑なタスクを完了するためのツールビジネスプロセスの自動化

テスト結果から判断すると、Command R は、多言語、RAG、ツールの使用という 3 つの側面において GPT-4 ターボのレベルに達しています。

しかし、投入コストの観点から見ると、Command R の価格は GPT-4 ターボのわずか 1/3 です。

出力コストの点では、コマンド R は GPT-4 ターボの 1/2 です。

多くのネチズンの注目を集めているのはこれです:

しかし、大型模型競技場など人間の主観的な評価においては目を引くパフォーマンスにもかかわらず、一部のネチズンは依然としていくつかの異なる意見を表明しました。

HumanEval では、Command R のコーディング能力は GPT-3.5 をも超えておらず、2 つのテストセットでそれぞれ 32 位と 33 位にランクされています。

最新バージョンのGPT-4ターボがハラハラすることなく1位を獲得しました。

さらに、最近本格的な論文に掲載されている精神薄弱者ベンチマークでコマンド R の中国語能力を簡単にテストしました。

どう評価しますか?

Command R のオープンソースは学術研究のみを目的としており、商用利用は無料ではないことに注意してください。

One More Thing

最後に、小麦刈りの男について詳しく話しましょう。

円卓のトランスフォーマー騎士団の最年少であるエイダン・ゴメスは、研究チームに参加したときまだ学部生でした——

しかし、彼は3年生のときにヒントンの実験に参加しました。トロント大学のこんな部屋です。

2018 年、Kaomaizi はオックスフォード大学に入学し、論文パートナーと同様に CS の博士号取得に向けて勉強を始めました。

しかし、2019 年、Cohere の設立に伴い、彼はついに学校を中退し、AI 起業家の波に加わることを選択しました。

Cohere は主に企業向けに大規模モデルソリューションを提供しており、現在の評価額は 22 億米ドルに達しています。

参考リンク：
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/ link/93fc5aed8c051ce4538e052cfe9f8692

以上がオープンソースモデルが初めてGPT-4を獲得！アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

ほとんどが使用されています10 Power BIチャート - 分析VidhyaApr 16, 2025 pm 12:05 PM

Microsoft PowerBIチャートでデータ視覚化の力を活用する今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。データの視覚化は、このギャップを橋渡しし、生データを変換するi

AIのエキスパートシステムApr 16, 2025 pm 12:00 PM

エキスパートシステム：AIの意思決定力に深く飛び込みます医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。それが人工知能の専門家システムの力です。これらのシステムはプロを模倣します

3人の最高の雰囲気コーダーがこのAI革命をコードで分解するApr 16, 2025 am 11:58 AM

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

滑走路AIのGen-4：AIモンタージュはどのように不条理を超えることができますかApr 16, 2025 am 11:45 AM

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

5日間のISRO AI無料コースを登録する方法は？ - 分析VidhyaApr 16, 2025 am 11:43 AM

ISROの無料AI/MLオンラインコース：地理空間技術の革新へのゲートウェイインド宇宙研究機関（ISRO）は、インドのリモートセンシング研究所（IIRS）を通じて、学生と専門家に素晴らしい機会を提供しています。

AIのローカル検索アルゴリズムApr 16, 2025 am 11:40 AM

ローカル検索アルゴリズム：包括的なガイド大規模なイベントを計画するには、効率的なワークロード分布が必要です。従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。この記事では、Hill ClimbingとSimulについて説明します

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますApr 16, 2025 am 11:37 AM

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

プロンプト：ChatGptは偽のパスポートを生成しますApr 16, 2025 am 11:35 AM

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます

See all articles

ホットAIツール

ホットツール

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。