3年間で16本の記事、元Google研究員Yi Tay氏がGemini Pro、GPT-3.5に匹敵する新モデル21Bを正式発表-AI-php.cn

ホームページ

テクノロジー周辺機器

3年間で16本の記事、元Google研究員Yi Tay氏がGemini Pro、GPT-3.5に匹敵する新モデル21Bを正式発表

王林

Feb 15, 2024 pm 06:45 PM

業界rekayi tay

チームの新しいモデルは、複数のベンチマークにおいて Gemini Pro および GPT-3.5 に匹敵します。

AI の大規模モデルの方向性に関する論文をよく読む人なら、Yi Tay はよく知られた名前に違いありません。 Google Brain の元上級研究員として、Yi Tay は、PaLM、UL2、Flan-U-PaLM、LaMDA/Bard、ViT-22B、PaLI など、多くの有名な大規模言語モデルやマルチモーダルモデルに貢献してきました。、ママなど。

Yi Tay の個人情報によると、Google Brain での 3 年以上の勤務中に、合計約 45 の論文の執筆に参加し、共著者でもありました。そのうち 16 件中。執筆論文には、UL2、U-PaLM、DSI、Synthesizer、Charformer、Long Range Arenaなどが含まれます。

三年16篇一作，前谷歌研究科学家Yi Tay官宣新模型，21B媲美Gemini Pro、GPT-3.5

Google を辞めて自分のビジネスを始めたほとんどの Transformer 著者と同じように、Yi Tay は昨年 3 月に Google からの退職を発表し、Reka という会社を共同設立しました。彼は同社のチーフサイエンティストを務めており、大規模な言語モデルに重点を置いています。

時間が経ち、たった今、Yi Tay が新しいモデルをリリースしたことを発表しました:

"とても幸せです Reka Flash を共有します。言語およびビジュアルベンチマークにおいて Gemini Pro および GPT 3.5 に匹敵する SOTA パフォーマンスを備えた新しい 21B マルチモーダルモデルです。比較的限られたリソースでゼロから開始しました。このモデルをトレーニングしています...同時に同時に、当社の最大かつ最も強力なモデル Reka-Core も完成間近です。次の作品にご期待ください。」

Reka Flash: An効率的なマルチモーダル言語モデル

Reka Flash のパラメータサイズは 21B で、完全にスクラッチからトレーニングされており、そのパフォーマンスはより大きなモデルと比較できます。 Reka Flash は、数多くの言語および視覚ベンチマークにおいて Gemini Pro および GPT-3.5 と競合します。

さらに、Reka チームは、よりコンパクトなモデルバリアントである Reka Edge も提案しました。これはパラメータが少なく、わずか 7B で、より効率的であり、リソースが限られたシナリオ (デバイス上、ローカルなど) で実行することもできます。

これら 2 つのモデルは公開テスト段階にあり、興味のある読者は行って試してみることができることは言及する価値があります。

トライアルアドレス: https://chat.reka.ai/auth/login

同時に, Reka チームは、最大かつ最も強力な Reka Core モデルが今後数週間以内に一般公開されると発表しました。

オープンソースの問題に関しては、チームはまだ検討中であると述べました。

#評価: 言語

##評価ベンチマークには MMLU (知識ベースの質問応答) が含まれます、GSM8K (推論と数学)、HumanEval (コード生成)、GPQA (Google が証明する大学院レベルの質問応答)。

結果は、Reka Flash がこれらのベンチマークテストで非常に良い結果を達成したことを示しています。MMLU と GPQA では Gemini Pro よりも優れており、GSM8K と HumanEval Competitiveness の結果では優れた結果を達成しています。さらに、これらの評価では、Reka Flash は多くの大型モデル (Llama 2 70B、Grok-1、GPT-3.5 など) を大幅に上回っています。

評価: 多言語推論

Reka Flash は 32 以上の言語で利用可能ですReka Flash を含む、強力な多言語モデルとみなすことができます。研究者らは、多言語の常識推論、因果推論、質問応答などの多言語ベンチマークでさまざまなモデルのパフォーマンスを比較しました。結果は、Reka Flash がこれらすべてのタスクにおいて Llama-2 70B および Mixtral よりも優れていることを示しています。

評価: ビジュアルとビデオ

さらに、この研究は複数の分野でも行われます。モーダル Reka Flash は、ビジュアル質問応答 (MMMU、VQA-v2)、ビデオ字幕 (VATEX)、ビデオ質問応答 (Perception Test) などのベンチマークで評価されました。結果は、Reka Flash が 4 つのベンチマークすべてにおいて Gemini Pro と競合できることを示しています。

調査では、Reka Flash ベースのチャットモデルを評価するために、一連の人による評価も実施しました。研究者らは、1) テキストのみのチャットモデルと 2) マルチモーダルチャットモデルの 2 つの設定を検討しました。評価中に、Askell らの方法に従って ELO スコアと全体の勝率を計算しました。

プレーンテキストチャット: 研究者は、GPT-4、Claude 2.1、Gemini Pro (API バージョン) などの主要モデルをベンチマークしました。さらに研究者らは、Reka Edge、Mistral 7B、および Llama 2 7B チャットモデルのパフォーマンスも比較しました。

人間による評価の結果、Reka Flash は GPT-3.5 Turbo、Claude、Mixtral、Gemini Pro を上回る競争力のある結果を達成していることが示されています。 Reka Edge は他の 2 つの 7B モデルよりも優れており、Claude Instant 1.2 のパフォーマンスに近づいています。

評価: マルチモダリティ

この研究では、Reka Flash と GPT4-V も組み合わせています。 Gemini Pro、Llava-1.6、IDEFICS 80b、および Adept Fuyu-8B マルチモーダル言語モデルを比較します。結果は、Reka Flash が GPT4-V を除くすべてのモデルよりも優れていることを示しています。 Reka Edge も良好なランキングを獲得し、Mistral 7B ベースの Llava 1.6 7B を上回り、Gemini Pro のパフォーマンスに迫りました。

7B パラメータ Reka Edge モデル

Reka Edge は、よりコンパクトに設計された 7B モデルです。オンプレミス展開や遅延の影響を受けやすいアプリケーション向け。この研究では、言語評価タスクに関して、同様のサイズのモデル（つまり、Mistral 7B および Llama-2 7B）との比較を報告しています。結果は、Reka Edge が標準言語ベンチマークで Llama 2 7B および Mistral 7B よりも優れていることを示しています。

概要

Reka チームは、最先端のマルチモーダル言語モデル、Reka Flash と Reka Edge のリリースにより、AI ロードマップの最初のマイルストーンが達成されました。誰もが次の研究を楽しみにしています。

^{参考リンク：https://reka.ai/reka-flash-an-efficient-and-capable-multimodal- language-model/}

以上が3年間で16本の記事、元Google研究員Yi Tay氏がGemini Pro、GPT-3.5に匹敵する新モデル21Bを正式発表の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は机器之心で複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

10生成AIコーディング拡張機能とコードのコードを探る必要がありますApr 13, 2025 am 01:14 AM

ねえ、忍者をコーディング！その日はどのようなコーディング関連のタスクを計画していますか？このブログにさらに飛び込む前に、コーディング関連のすべての問題について考えてほしいです。終わり？ - ＆＃8217を見てみましょう

革新を調理する：人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル（VLM）の包括的なガイドApr 12, 2025 am 11:58 AM

導入鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか？あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか？

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで：Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

＃1 GoogleはAgent2Agentを起動しました物語：月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ：科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5％のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。しかし、助けが近づいています。エンジンのチーム

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

Dreamweaver Mac版

ビジュアル Web 開発ツール

WebStorm Mac版

便利なJavaScript開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。