検索
ホームページテクノロジー周辺機器AI40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された

大規模モデルの競争では、別のダークホースが登場しました。

Inflection-2.5#​​## は、DeepMind と Mustafa Suleyman の大規模モデル スタートアップによって作成されました。

コンピューティング リソースのわずか 40% をトレーニングに使用するだけで、そのパフォーマンスは GPT-4 の 90% を超え、特にコーディングと数学に優れています。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された

初期の屈折モデルは、トレーニング中にコンピューティング リソースを 4% しか消費せず、GPT-4 のパフォーマンスの 72% に達しました。

同社は、屈折モデルに基づいて、「高い心の知能」と「パーソナライゼーション」に焦点を当て、中国語もサポートするウェブベースの会話ロボット Pi も発売しました。

Pi の誕生以来、Pi の 1 日のアクティビティは最高で 100 万件に達し、合計 40 億件のメッセージが生成され、平均会話の長さは 33 分に達しました。

基本モデルのこのアップグレードにより、Pi も新しいバージョンを導入しました。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

したがって、屈折または円周率が非常に強力であるかどうかに関係なく、量子ビットはいくつかの実際の測定を実施しました。

ログインせずに使用できます

Pi のページを開くと、このようなシンプルなインターフェイスが表示され、ログインせずに直接 [次へ] をクリックできます。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

次へ数回続けて、Pi に電話をかける方法を入力します。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

その後、音声と推奨トピックを選択し、スキップして、正式なチャット インターフェイスに入ります。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

簡単なテストで、Pi が中国語の対話をサポートしていることがわかりました。この場合、まず精神薄弱者のベンチマークを配置します。

最初の質問は、病気のマウスは殺鼠剤を服用すると治りますか? Pi は見事に答えました。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

もう一つの「罠」の質問ですが、今回はまだ引っかかりませんでした。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

2つの質問の後、劇的な効果はありませんでしたが、中国語をある程度理解できたように感じました。

次に、公式が「特に得意」と主張する数学とコーディングの能力に焦点を当ててみましょう。

最初の質問は、動的プログラミングに関するプログラミングの問題です。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

Pi が提供したコードは、この問題をうまく解決しており、明確な説明が付いています。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

次に、難易度を上げて、数値の階乗の末尾にゼロがいくつあるかを分析してみましょう。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された写真

Pi によって提供されたコードは正しいだけでなく、簡潔かつ効率的であり、LeetCode のユーザーの 73.8% よりも速く実行されます。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された画像

最後に、難易度を上げて、合格率 47.5% の問題でテストのコード部分を終了しましょう。

40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定された

コードを読んだ後、Pi の数学的能力をテストし、導関数に関する質問をさせてみましょう:

関数 f(x)=x³ 2x²-1

の極点を求めます。答えは完全に正しく、非常に詳細です。

もちろん、数学が得意になるには論理的思考が不可欠です。そこで、通常の数学の問題に加えて、円周率の論理的思考をテストする古典的な問題も使用しましたが、結果は悪くありませんでした。 。


Pi のパフォーマンスを通して、その背後にある Inflection-2.5 モデルが確かに注目に値することがわかります。

公式自体が公開したテストデータから判断すると、Inflection-2.5 のパフォーマンスは、総合的な機能と個々のサブ項目の点で GPT-4 にほぼ続きます。

数学とコードを例に挙げると、Inflection-2.5 は MATH や HumanEval などのテストにおいてバージョン 1.0 よりも大幅に進歩しました。

これら従来のデータセットに加えて、Inflection はハンガリーの大学入学試験の数学テスト問題や GRE 物理テストにも挑戦し、その結果は GPT-4 とほぼ互角でした。

さらに厄介なことに、大規模なモデルでは理解するのが難しい問題を使用して BIG-Bench データ セットを構築した人々がいます。Inflection-2.5 はその Hard サブセットに挑戦しましたが、結果ははるかに遅れています。 GPT-4 1 ポイント未満。

それでは、Inflection-2.5 の背後にはどのような会社があるのでしょうか?

DeepMind Lianchuang Large Model Entrepreneurship

この会社は Inflection AI と呼ばれ、DeepMind Lianchuang Mustafa Suleyman らによって 2022 年に設立され、現在 70 名以上の従業員がいます。 。

同じく DeepMind の上級研究員、Karen Simonyan がいます。彼は現在 Inflection AI の主任科学者です。

さらに、LinkedIn の共同作成者である Reid Hoffman も Inflection AI の創設に参加しました。

Inflection AI は、設立以来、NVIDIA、Microsoft、Bill Gates などの大手企業から総額 15 億米ドルの資金提供を受けてきました。

現在、屈折ベースの Pi はまだ無料ですが、CEO のスレイマン氏はまた、愛を使って常に発電するのは非現実的であり、長期的には依然として料金が発生するだろうとも述べています。

体験したい友達は急いでください~

ポータル: https://pi.ai

以上が40%の計算能力のトレーニング効果はGPT-4に匹敵し、DeepMindが共同作成した大規模モデル起業家精神の新たな成果が測定されたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaMeta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などAVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用:チャットボットは本当に気にすることができますか?マシンと話すための人的費用:チャットボットは本当に気にすることができますか?Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics Vidhyaラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

Dagsterでデータ品質チェックを自動化しますDagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか?メインフレームはAI時代に役割を果たしていますか?Apr 11, 2025 am 11:42 AM

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール