Deepseek R1：Openai O1最大の競争相手がここにいます！-AI-php.cn

ホームページ

テクノロジー周辺機器

Deepseek R1：Openai O1最大の競争相手がここにいます！

William Shakespeare

Mar 09, 2025 pm 12:01 PM

Deepseek AIの画期的なDeepSeek R1推論モデルは、生成AIを再定義します。強化学習（RL）とオープンソースアプローチを活用して、DeepSeek R1は、研究者と開発者がグローバルにアクセスできる高度な推論機能を提供します。ベンチマークテストでは、ライバルが示されており、場合によってはOpenaiのO1モデルを上回り、OpenaiのLLM優位性に挑戦しています。さらに探索しましょう！

？ deepseek-r1が到着しました！

⚡パフォーマンスはOpenai-O1と一致します？完全にオープンソースモデルとテクニカルレポート？ MITライセンス：研究および商業用使用は無料！

？ウェブサイトとAPIはライブです！ https://www.php.cn/link/5d4d48d0359e45e4fdfdf997818d6407fd今日！
？ 1/n
pic.twitter.com/7blpwapu6y
- deepseek（@deepseek_ai）2025年1月20日

へのアクセス

deepseek r1？とは何ですか

Deepseek R1は、生成AIシステム内の推論を優先する大規模な言語モデル（LLM）です。高度な強化学習（RL）技術は、その機能を強化します

LLMの推論が大幅に改善され、監督された微調整（SFT）への依存度が最小限に抑えられます。

deepseek-r1トレーニング

DeepSeek R1: OpenAI o1 Biggest Competitor is HERE!

1。補強学習

deepseek-r1-zeroは、補強学習（RL）のみを使用し、SFTを上訴します。このアプローチは、モデルが自己検証、反省、考え方（COT）の推論を含む高度な推論スキルを独立して開発することを奨励しています。

報酬システム

報酬は、タスク固有のベンチマークの精度に基づいています

二次報酬は、構造化された、明確な、および一貫した推論出力を奨励します

拒絶サンプリング

RL中に、複数の推論パスが生成され、最高のパフォーマンスのパスがさらにトレーニングを導きます。

2。ヒトが解決したデータを使用したコールドスタート初期化

広範なCOT推論のヒトではなく、DeepSeek-R1トレーニングを初期化する例。これにより、ユーザーの期待と読みやすさと調整が保証されますこのステップは、純粋なRL（断片化または曖昧な出力を生成する可能性がある）と高品質の推論の間のギャップを橋渡しします。
3。マルチステージトレーニングパイプライン

ステージ1：コールドスタートデータ事前削除：

ステージ2：補強学習：モデルはRLタスクに取り組み、正確性、コヒーレンス、アライメントの報酬を獲得します。
ステージ3：拒否サンプリングを備えた微調整：システムは、最適な推論パターンを出力および強化します。
4。蒸留

大きなモデルは小さなバージョンに蒸留され、推論パフォーマンスを維持しながら計算コストを大幅に削減します。

蒸留モデルは、パフォーマンスの大幅な損失なしに、deepseek-r1のような、より大きなカウンターパートの機能を継承します。

deepseek r1モデル

コアモデル

deepseek-r1-zero：

sftなしで、ベースモデルでRLのみを介して訓練されています。自己検証や反省などの高度な推論行動を示し、AIME 2024やCodeforcesなどのベンチマークで強力な結果を達成します。課題には、コールドスタートデータの欠如と構造化された微調整による読みやすさと言語の混合が含まれます。

deepseek-r1：

は、初期化を改善するためにコールドスタートデータ（ヒトが発表した長いCOTの例）を組み込むことにより、deepseek-r1-zeroに基づいて構築されます。推論指向のRLや、より良い人間のアライメントのための拒絶サンプリングなど、マルチステージトレーニングを採用しています。

OpenaiのO1-1217と直接競合し、達成：

aime 2024：@1スコア79.8％を渡し、O1-1217をわずかに超えています

math-500

：O1-1217に匹敵する@1スコア97.3％を渡します DeepSeek R1: OpenAI o1 Biggest Competitor is HERE!

それは知識集約型およびステムのタスクとコーディングの課題に優れています。

deepseek-aiは、R1モデルの蒸留バージョンもリリースされ、小規模で計算効率の良いモデルが大規模なカウンターパートの推論能力を保持するようにします。これらには、QwenおよびLlamaシリーズモデルが含まれます。これらの小規模なモデルは、QWQ-32B-PREVIEWなどのオープンソースの競合他社よりも優れていますが、OpenaiのO1-Miniなどの独自モデルと効果的に競合しています。

deepseek r1キー機能

deepseek-r1モデルのライバル大手LLMS。 AIME 2024、Math-500、CodeForcesなどのベンチマークは、OpenaiのO1-1217およびAnthropicのClaude Sonnet 3と比較して競争力のあるパフォーマンスまたは優れたパフォーマンスを示しています。

r1 へのアクセス

Web Access：に移動します：https://www.php.cn/link/9f3ad7a14cd3d1cf5d73e8ec7205e7f1

サインアップして、deephinkを選択します。 DeepThink R1が自動的に選択されます。

APIアクセス： DeepSeek R1: OpenAI o1 Biggest Competitor is HERE!

でAPIにアクセスします。入力コストが低いと、DeepSeek-R1は多くの独自モデルよりもはるかに手頃な価格です。

DeepSeek R1: OpenAI o1 Biggest Competitor is HERE!

STEM Education：数学ベンチマークでのその強力なパフォーマンスは、教育者と学生を支援するのに理想的です。

一般的な知識タスク：GPQAダイヤモンドのようなベンチマークでの成功は、事実に基づく推論の強力なツールとして位置付けています。
結論

以上がDeepseek R1：Openai O1最大の競争相手がここにいます！の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

サム・アルトマンなどが現在、AIの最新の進捗のための新しいゲージとしてバイブを使用している理由

AIフィールドの評価メトリックとしての「バイブ」の使用の増加について説明しましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AI開発の複雑な側面を調査します（こちらのリンクを参照）。 AI評価のバイブ TRADI

Robotaxiの未来を建設するWaymo工場内May 06, 2025 am 11:11 AM

Waymo's Arizona Factory：大量生産する自動運転ジャガー以上アリゾナ州フェニックスの近くに位置するWaymoは、自律的なジャガーIペースの電気SUVの艦隊を生産する最先端の施設を運営しています。この239,000平方フィートの工場がオープンしました

内部S＆PグローバルのコアでAIを使用したデータ駆動型変換May 06, 2025 am 11:10 AM

S＆PグローバルのチーフデジタルソリューションオフィサーであるJigar Kocherlakotaは、同社のAIの旅、戦略的買収、将来に焦点を当てたデジタル変革について議論しています。変革的なリーダーシップの役割と将来の準備ができていますコチェルラコタの役割

スーパーアプリの台頭：デジタルエコシステムで繁栄する4つのステップMay 06, 2025 am 11:09 AM

アプリからエコシステムまで：デジタル景観のナビゲートデジタル革命は、ソーシャルメディアとAIをはるかに超えています。私たちは、「すべてのアプリ」の台頭を目撃しています。サムa

MasterCardとVisaはAIエージェントを解き放ち、あなたのために買い物をしますMay 06, 2025 am 11:08 AM

MasterCardのエージェント給与：AI搭載の支払いは、コマースに革命をもたらします VisaのAIを搭載したトランザクション機能は見出しになりましたが、MasterCardはトークン化、信頼、およびエージェントに基づいて構築されたより高度なAI-Native支払いシステムであるエージェントペイを発表しました。

Bocking the Bold：Future VenturesのTransformative Innovation PlaybookMay 06, 2025 am 11:07 AM

Future Ventures Fund IV：新しいテクノロジーに200万ドルの賭け Future Venturesは最近、過度にサブスクライブされたファンドIVを閉鎖し、合計2億ドルです。 Steve Jurvetson、Maryanna Saenko、およびNico Enriquezが管理するこの新しい基金は、重要なInvを表しています

AIが急上昇すると、企業はSEOからGEOに移行しますMay 05, 2025 am 11:09 AM

AIアプリケーションの爆発により、企業は従来の検索エンジン最適化（SEO）から生成エンジン最適化（GEO）に移行しています。 Googleがシフトをリードしています。その「AIの概要」機能は、10億人以上のユーザーにサービスを提供しており、ユーザーがリンクをクリックする前に完全な回答を提供しています。 [^2] 他の参加者も急速に上昇しています。 ChatGpt、Microsoft Copilot、Perplexityは、従来の検索結果を完全にバイパスする新しい「Answer Engine」カテゴリを作成しています。これらのAIに生成された回答にビジネスが表示されない場合、従来の検索結果で高くランク付けされていても、潜在的な顧客は決してあなたを見つけることはありません。 SEOからGeoまで - これは正確に何を意味しますか？何十年もの間

これらの経路のどれが今日のAIをプッシュして賞賛されるAGIになることについての大きな賭けMay 05, 2025 am 11:08 AM

人工一般情報（AGI）への潜在的なパスを探りましょう。この分析は、AIの進歩に関する私の進行中のフォーブスコラムの一部であり、AGIと人工的な緊急事態（ASI）を達成する複雑さを掘り下げています。（関連するアートを参照してください

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

WebStorm Mac版

便利なJavaScript開発ツール

Safe Exam Browser

Safe Exam Browser は、オンライン試験を安全に受験するための安全なブラウザ環境です。このソフトウェアは、あらゆるコンピュータを安全なワークステーションに変えます。あらゆるユーティリティへのアクセスを制御し、学生が無許可のリソースを使用するのを防ぎます。

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター

ドリームウィーバー CS6

ビジュアル Web 開発ツール

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、