ホームページ >テクノロジー周辺機器 >AI >OpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきます
木曜日、アメリカの AI スタートアップ Inflection AI は、新世代の大規模言語モデル Inflection-2.5 を正式にリリースしました。
レポートによると、Inflection-2.5 は、強力な LLM テクノロジーと Inflection 独自の「共感微調整」機能を組み合わせ、高い心の知能指数と高い IQ の特性を統合します。インターネットを通じて事実情報を入手でき、その性能はGPT-4やGeminiなどの主要大型機種に匹敵する。
Inflection-2.5 は、すべての Pi ユーザーが PC、iOS、Android アプリで無料で利用できるようになりました。 Heart of the Machine による簡単なテストの結果、GPT-4 と比較するとまだ一定のギャップがあることがわかりましたが、それでも試してみる価値はあります。興味のあるユーザーは実際に体験してみることができます。
リンク: https://pi.ai/talk
語形変化に注目する価値があります。 -2.5 は GPT-4 に近いパフォーマンスを実現しますが、トレーニング プロセスでは GPT-4 の計算能力の 40% しか使用しません。
屈折 AI は、新世代の大規模モデルがインテリジェント コーディングや数学などの分野で大きな進歩を遂げたことを指摘しています。これらの進歩は、主要な業界ベンチマークの具体的な改善につながり、Pi がテクノロジーの最前線であり続けることを保証します。さらに、Pi は世界クラスのリアルタイム Web 検索機能も統合しており、ユーザーが高品質のニュース速報や最新情報に確実にアクセスできるようにします。
Inflection-1 トレーニングで使用される FLOP は、さまざまな形式で GPT-4 の約 4% です。 「IQ 指向」のタスクでは、平均パフォーマンスは GPT-4 レベルの約 72% です。現在、Inflection-2.5 は、トレーニングに GPT-4 の FLOP の 40% のみを使用しているにもかかわらず、GPT-4 の 94% 以上の平均パフォーマンスを達成しています。以下の図に示すように、Inflection-2.5 のパフォーマンスは全面的に大幅な向上を達成しており、STEM ドメインの知識が大幅に向上しています。
2 つの異なる STEM 試験 (ハンガリー数学試験と物理学大学院記録試験 (GRE)) における Inflection-2.5 の結果は次のとおりです。 :
以下の表に示すように、この調査では、MMLU ベンチマークと GPQA Diamond ベンチマークで Inflection-2.5 も評価しました。 MMLU ベンチマークは、STEM、人文科学、社会科学などの 57 分野をカバーし、LLM の包括的な知識能力を効果的にテストします。一方、GPQA ダイヤモンド ベンチマークは、非常に難しい専門家レベルのベンチマークです。
BIG-Bench-Hard ベンチマークでは、Inflection-2.5 は Inflection-1 よりも 10% 以上パフォーマンスが向上し、GPT と同等です。 4 比較可能。 BIG-Bench-Hard ベンチマークは、大規模な言語モデルでは解決が難しい問題を主にカバーします。
この調査は、MT-Bench ベンチマークでも評価されました。しかし、研究チームは、このベンチマークには、推論、数学、コーディング カテゴリのサンプル例の大部分 (約 25%) に、間違った参照ソリューションや前提条件に欠陥があることに気づきました。そこで、研究ではこれらの例を修正し、再度評価実験を行った結果を次の表に示します。
#GSM8k と MATH の評価ベンチマーク 結果は、Inflection-2.5 が数学およびコーディング機能の点で Inflection-1 に比べて大幅に改善されていることを示しています。
コーディングをさらにテストするにはInflection-2.5 能力の評価に向けて、この研究では 2 つのコーディング ベンチマーク、MBPP と HumanEval で評価実験を実施しました。その結果を次の表に示します。
#研究チームは、HellaSwag と ARC-C で Inflection-2.5 を評価したほか、常識と科学のベンチマークに基づいてさまざまなモデルを評価しました。以下の結果から判断すると、Inflection-2.5 はこれらのベンチマークで優れたパフォーマンスを達成しています。
さらに、上記の評価はすべて、Pi をサポートするモデルを使用して行われました。ただし、ネットワーク取得 (上記のベンチマークはネットワーク取得を使用していません)、数ショット プロンプトの構造、およびその他の運用上の側面により、ユーザー エクスペリエンスが若干異なる可能性があることに注意することも重要です。
一般的に、Inflection-2.5 は Pi の「中心的な」機能と非常に高いセキュリティ基準を維持し、より包括的で有用なモデルになります。
最近、大規模言語モデルをめぐる技術競争は熾烈な段階に入っており、数あるテクノロジー企業の中でも、Mistral AI (Mistral Large##) が注目を集めています。 #)、Anthropic (Claude 3) が際立っており、提案された新技術は GPT-4 および Gemini Ultra に近い機能を実現します。昨日登場した Inflection-2.5 が第一階層に加わるようです。
シリコンバレーのスタースタートアップとして、Inflection AI は長い歴史を持ち、2022 年に設立されました。 Linkedln の共同創設者であるリード・ホフマン氏と、元 DeepMind の主任科学者カレン・シモニアン氏です。
昨年 6 月、Inflection AI は、Microsoft、Nvidia、Reid Hoffman、Bill Gates、およびその他の企業から 13 億米ドルの資金提供を受けたと発表しました。元Google CEOのエリック・シュミット氏が投資を主導した。現在、Inflection AI は世界で 4 番目に大きな生成 AI スタートアップ企業となっています。
以上がOpenAI に挑戦する新しいモデルが無料で利用可能になり、コンピューティング能力とパフォーマンスの 40% が GPT-4 に近づきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。