検索
ホームページテクノロジー周辺機器AIOpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

木曜日、アメリカの AI スタートアップ Inflection AI は、新世代の大規模言語モデル Inflection-2.5 を正式にリリースしました。

レポートによると、Inflection-2.5 は、強力な LLM テクノロジーと Inflection 独自の「共感微調整」機能を組み合わせ、高い心の知能指数と高い IQ の特性を統合します。インターネットを通じて事実情報を入手でき、その性能はGPT-4やGeminiなどの主要大型機種に匹敵する。

Inflection-2.5 は、すべての Pi ユーザーが PC、iOS、Android アプリで無料で利用できるようになりました。 Heart of the Machine による簡単なテストの結果、GPT-4 と比較するとまだ一定のギャップがあることがわかりましたが、それでも試してみる価値はあります。興味のあるユーザーは実際に体験してみることができます。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

リンク: https://pi.ai/talk

語形変化に注目する価値があります。 -2.5 は GPT-4 に近いパフォーマンスを実現しますが、トレーニング プロセスでは GPT-4 の計算能力の 40% しか使用しません。

屈折 AI は、新世代の大規模モデルがインテリジェント コーディングや数学などの分野で大きな進歩を遂げたことを指摘しています。これらの進歩は、主要な業界ベンチマークの具体的な改善につながり、Pi がテクノロジーの最前線であり続けることを保証します。さらに、Pi は世界クラスのリアルタイム Web 検索機能も統合しており、ユーザーが高品質のニュース速報や最新情報に確実にアクセスできるようにします。

Inflection-2.5 と GPT-4

Inflection-1 トレーニングで使用される FLOP は、さまざまな形式で GPT-4 の約 4% です。 「IQ 指向」のタスクでは、平均パフォーマンスは GPT-4 レベルの約 72% です。現在、Inflection-2.5 は、トレーニングに GPT-4 の FLOP の 40% のみを使用しているにもかかわらず、GPT-4 の 94% 以上の平均パフォーマンスを達成しています。以下の図に示すように、Inflection-2.5 のパフォーマンスは全面的に大幅な向上を達成しており、STEM ドメインの知識が大幅に向上しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

2 つの異なる STEM 試験 (ハンガリー数学試験と物理学大学院記録試験 (GRE)) における Inflection-2.5 の結果は次のとおりです。 :

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

以下の表に示すように、この調査では、MMLU ベンチマークと GPQA Diamond ベンチマークで Inflection-2.5 も評価しました。 MMLU ベンチマークは、STEM、人文科学、社会科学などの 57 分野をカバーし、LLM の包括的な知識能力を効果的にテストします。一方、GPQA ダイヤモンド ベンチマークは、非常に難しい専門家レベルのベンチマークです。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

BIG-Bench-Hard ベンチマークでは、Inflection-2.5 は Inflection-1 よりも 10% 以上パフォーマンスが向上し、GPT と同等です。 4 比較可能。 BIG-Bench-Hard ベンチマークは、大規模な言語モデルでは解決が難しい問題を主にカバーします。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

この調査は、MT-Bench ベンチマークでも評価されました。しかし、研究チームは、このベンチマークには、推論、数学、コーディング カテゴリのサンプル例の大部分 (約 25%) に、間違った参照ソリューションや前提条件に欠陥があることに気づきました。そこで、研究ではこれらの例を修正し、再度評価実験を行った結果を次の表に示します。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

#GSM8k と MATH の評価ベンチマーク 結果は、Inflection-2.5 が数学およびコーディング機能の点で Inflection-1 に比べて大幅に改善されていることを示しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

コーディングをさらにテストするにはInflection-2.5 能力の評価に向けて、この研究では 2 つのコーディング ベンチマーク、MBPP と HumanEval で評価実験を実施しました。その結果を次の表に示します。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

#

研究チームは、HellaSwag と ARC-C で Inflection-2.5 を評価したほか、常識と科学のベンチマークに基づいてさまざまなモデルを評価しました。以下の結果から判断すると、Inflection-2.5 はこれらのベンチマークで優れたパフォーマンスを達成しています。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

さらに、上記の評価はすべて、Pi をサポートするモデルを使用して行われました。ただし、ネットワーク取得 (上記のベンチマークはネットワーク取得を使用していません)、数ショット プロンプトの構造、およびその他の運用上の側面により、ユーザー エクスペリエンスが若干異なる可能性があることに注意することも重要です。

一般的に、Inflection-2.5 は Pi の「中心的な」機能と非常に高いセキュリティ基準を維持し、より包括的で有用なモデルになります。

最近、大規模言語モデルをめぐる技術競争は熾烈な段階に入っており、数あるテクノロジー企業の中でも、Mistral AI (Mistral Large##) が注目を集めています。 #)、Anthropic (Claude 3) が際立っており、提案された新技術は GPT-4 および Gemini Ultra に近い機能を実現します。昨日登場した Inflection-2.5 が第一階層に加わるようです。

シリコンバレーのスタースタートアップとして、Inflection AI は長い歴史を持ち、2022 年に設立されました。 Linkedln の共同創設者であるリード・ホフマン氏と、元 DeepMind の主任科学者カレン・シモニアン氏です。

OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます

昨年 6 月、Inflection AI は、Microsoft、Nvidia、Reid Hoffman、Bill Gates、およびその他の企業から 13 億米ドルの資金提供を受けたと発表しました。元Google CEOのエリック・シュミット氏が投資を主導した。現在、Inflection AI は世界で 4 番目に大きな生成 AI スタートアップ企業となっています。

以上がOpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?AIインデックス2025を読む:AIはあなたの友人、敵、または副操縦士ですか?Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう:認知(何が起こっているのかを理解する)、感謝(利益を見る)、受け入れ(顔の課題)、責任(責任を見つける)。 認知:人工知能はどこにでもあり、急速に発展しています 私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaMeta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2:マルチモーダルとモバイルAIの前進 メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。 成功に基づいてo

AVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などAVバイト:Meta' s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景:進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用:チャットボットは本当に気にすることができますか?マシンと話すための人的費用:チャットボットは本当に気にすることができますか?Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想:私たちはAIとの関係において本当に繁栄していますか? この質問は、MIT Media Labの「AI(AHA)で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入 あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics Vidhyaラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2:マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。 その能力t

Dagsterでデータ品質チェックを自動化しますDagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証:ダグスターと大きな期待でチェックを自動化する データ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。 データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか?メインフレームはAI時代に役割を果たしていますか?Apr 11, 2025 am 11:42 AM

MainFrames:AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。 これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

AtomエディタMac版ダウンロード

AtomエディタMac版ダウンロード

最も人気のあるオープンソースエディター

mPDF

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

MantisBT

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティング サービスをチェックしてください。

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター