検索
ホームページテクノロジー周辺機器AIオープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ

GPT-4を超えるオープンソースモデルが登場!

大型モデル分野の最新バトルレポート:

1,040 億パラメーターのオープンソース モデル Command R が 6 位に上昇し、GPT-4-0314 と同点となり、GPT-4-0613 を上回りました。 。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

これは、大型モデルの分野で GPT-4 を破った初の無差別級モデルでもあります。

大規模なモデル アリーナは、マスター Karpathy が信頼する唯一のテスト ベンチマークの 1 つです。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

AI ユニコーン Cohere のコマンド R。この大規模モデルのスタートアップの共同創設者兼 CEO は、『トランスフォーマー』(小麦の刈り取り者と呼ばれる)の最年少著者、エイダン ゴメスにほかなりません。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

この戦闘レポートが公開されるとすぐに、大規模なモデル コミュニティで白熱した議論の波が再び起こりました。

誰もが興奮している理由は単純で、基本的な大型モデルが 1 年間展開されてきたためですが、予想外に、そのパターンは 2024 年にも発展し、変化し続けます。

HuggingFace の共同創設者である Thomas Wolf 氏は次のように述べています:

大規模モデル分野の状況は最近劇的に変化しました:

Anthropic の Claude 3 作品はクローズド ソース モデルにあります。彼らの間で先頭に立ってください。

Cohere の Command R は、オープンソース モデルの中で最も強力になりました。

予想外なことに、2024 年には、人工知能チームはオープンソースとクローズドソースの両方のルートで急速に開発されるでしょう。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

さらに、Cohere Machine Learning ディレクターの Nils Reimers 氏も注目に値することを指摘しました。

Command の最大の特徴R は、組み込みの RAG (Retrieval Enhanced Generation) が完全に最適化されていますが、大規模モデルの分野では、RAG などのプラグイン機能はテストに含まれていませんでした。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

RAG 最適化モデルがオープン ソースの王座に上り詰める

Cohere の公式の位置づけでは、Command R は「RAG 最適化」です。モデル" 。

つまり、1,040 億個のパラメータを持つこの大規模モデルは、幻覚の生成を減らす検索強化生成テクノロジ向けに深く最適化されており、エンタープライズ レベルのワークロードにより適しています。

以前に起動した Command R と同様に、Command R のコンテキスト ウィンドウの長さは 128k です。

さらに、Command R には次の機能もあります:

  • 英語、中国語、フランス語、ドイツ語などを含む 10 言語をカバー;
  • 使用可能複雑なタスクを完了するためのツール ビジネス プロセスの自動化

テスト結果から判断すると、Command R は、多言語、RAG、ツールの使用という 3 つの側面において GPT-4 ターボのレベルに達しています。

しかし、投入コストの観点から見ると、Command R の価格は GPT-4 ターボのわずか 1/3 です。

出力コストの点では、コマンド R は GPT-4 ターボの 1/2 です。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

多くのネチズンの注目を集めているのはこれです:

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

しかし、大型模型競技場など人間の主観的な評価においては目を引くパフォーマンスにもかかわらず、一部のネチズンは依然としていくつかの異なる意見を表明しました。

HumanEval では、Command R のコーディング能力は GPT-3.5 をも超えておらず、2 つのテスト セットでそれぞれ 32 位と 33 位にランクされています。

最新バージョンのGPT-4ターボがハラハラすることなく1位を獲得しました。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

さらに、最近本格的な論文に掲載されている精神薄弱者ベンチマークでコマンド R の中国語能力を簡単にテストしました。

オープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだ写真

どう評価しますか?

Command R のオープンソースは学術研究のみを目的としており、商用利用は無料ではないことに注意してください。

One More Thing

最後に、小麦刈りの男について詳しく話しましょう。

円卓のトランスフォーマー騎士団の最年少であるエイダン・ゴメスは、研究チームに参加したときまだ学部生でした——

しかし、彼は3年生のときにヒントンの実験に参加しました。トロント大学のこんな部屋です。

2018 年、Kaomaizi はオックスフォード大学に入学し、論文パートナーと同様に CS の博士号取得に向けて勉強を始めました。

しかし、2019 年、Cohere の設立に伴い、彼はついに学校を中退し、AI 起業家の波に加わることを選択しました。

Cohere は主に企業向けに大規模モデル ソリューションを提供しており、現在の評価額は 22 億米ドルに達しています。

参考リンク:
[1]https://www.php.cn/link/3be14122a3c78d9070cae09a16adcbb1[2]https://www.php.cn/ link/93fc5aed8c051ce4538e052cfe9f8692

以上がオープンソースモデルが初めてGPT-4を獲得!アリーナの最新戦闘レポートは白熱した議論を巻き起こしている、カルパシー: これが私が信頼する唯一のリストだの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
ほとんどが使用されています10 Power BIチャート - 分析Vidhyaほとんどが使用されています10 Power BIチャート - 分析VidhyaApr 16, 2025 pm 12:05 PM

Microsoft PowerBIチャートでデータ視覚化の力を活用する 今日のデータ駆動型の世界では、複雑な情報を非技術的な視聴者に効果的に伝えることが重要です。 データの視覚化は、このギャップを橋渡しし、生データを変換するi

AIのエキスパートシステムAIのエキスパートシステムApr 16, 2025 pm 12:00 PM

エキスパートシステム:AIの意思決定力に深く飛び込みます 医療診断から財務計画まで、あらゆることに関する専門家のアドバイスにアクセスできることを想像してください。 それが人工知能の専門家システムの力です。 これらのシステムはプロを模倣します

3人の最高の雰囲気コーダーがこのAI革命をコードで分解する3人の最高の雰囲気コーダーがこのAI革命をコードで分解するApr 16, 2025 am 11:58 AM

まず第一に、これがすぐに起こっていることは明らかです。さまざまな企業が、現在AIによって書かれているコードの割合について話しており、これらは迅速なクリップで増加しています。すでに多くの仕事の移動があります

滑走路AIのGen-4:AIモンタージュはどのように不条理を超えることができますか滑走路AIのGen-4:AIモンタージュはどのように不条理を超えることができますかApr 16, 2025 am 11:45 AM

映画業界は、デジタルマーケティングからソーシャルメディアまで、すべてのクリエイティブセクターとともに、技術的な岐路に立っています。人工知能が視覚的なストーリーテリングのあらゆる側面を再構築し始め、エンターテイメントの風景を変え始めたとき

5日間のISRO AI無料コースを登録する方法は? - 分析Vidhya5日間のISRO AI無料コースを登録する方法は? - 分析VidhyaApr 16, 2025 am 11:43 AM

ISROの無料AI/MLオンラインコース:地理空間技術の革新へのゲートウェイ インド宇宙研究機関(ISRO)は、インドのリモートセンシング研究所(IIRS)を通じて、学生と専門家に素晴らしい機会を提供しています。

AIのローカル検索アルゴリズムAIのローカル検索アルゴリズムApr 16, 2025 am 11:40 AM

ローカル検索アルゴリズム:包括的なガイド 大規模なイベントを計画するには、効率的なワークロード分布が必要です。 従来のアプローチが失敗すると、ローカル検索アルゴリズムは強力なソリューションを提供します。 この記事では、Hill ClimbingとSimulについて説明します

OpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますOpenaiはGPT-4.1でフォーカスをシフトし、コーディングとコスト効率を優先しますApr 16, 2025 am 11:37 AM

このリリースには、GPT-4.1、GPT-4.1 MINI、およびGPT-4.1 NANOの3つの異なるモデルが含まれており、大規模な言語モデルのランドスケープ内のタスク固有の最適化への動きを示しています。これらのモデルは、ようなユーザー向けインターフェイスをすぐに置き換えません

プロンプト:ChatGptは偽のパスポートを生成しますプロンプト:ChatGptは偽のパスポートを生成しますApr 16, 2025 am 11:35 AM

Chip Giant Nvidiaは、月曜日に、AI Supercomputersの製造を開始すると述べました。これは、大量のデータを処理して複雑なアルゴリズムを実行できるマシンを初めて初めて米国内で実行します。発表は、トランプSI大統領の後に行われます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

EditPlus 中国語クラック版

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コード プロンプト機能はサポートされていません

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール