ChatGptの進化を理解する：パート3- Codexとinstantgptからの洞察-AI-php.cn

ホームページ

テクノロジー周辺機器

ChatGptの進化を理解する：パート3- Codexとinstantgptからの洞察

王林

Feb 26, 2025 am 02:58 AM

この記事では、大規模な言語モデル（LLMS）の微調整の実用的な側面を掘り下げ、CodexとInstructgptに焦点を当てて主要な例として焦点を当てています。 GPTモデルを探索するシリーズの3番目であり、トレーニング前とスケーリングの以前の議論に基づいて構築されています。

Understanding the Evolution of ChatGPT: Part 3- Insights from Codex and InstructGPT 微調整は重要です。なぜなら、事前に訓練されたLLMは多用途であるが、特定のタスクに合わせた特殊なモデルに達していないことが多いからです。さらに、GPT-3のような強力なモデルでさえ、複雑な指示と安全性と倫理基準の維持に苦労する可能性があります。これには、微調整戦略が必要です

この記事では、2つの重要な微調整の課題を強調しています。新しいモダリティ（Codexのコード生成への適応など）に適応し、モデルを人間の好みに合わせます（instructgptで示すように）。どちらも、データ収集、モデルアーキテクチャ、目的機能、および評価メトリックを慎重に検討する必要があります。

コーデックス：コード生成のための微調整

この記事は、コード生成を評価するためのBLEUスコアのような伝統的な指標の不十分さを強調しています。「機能的正しさ」とパス@k メトリックを導入し、より堅牢な評価方法を提供します。ユニットテストで手書きのプログラミング問題を含むHumaneval Datasetの作成も強調されています。コードに固有のデータクリーニング戦略については、プログラミング言語のユニークな特性を処理するためにトークンザーを適応させることの重要性（たとえば、Whitespace Encoding）について説明します。この記事では、HumanevalのGPT-3と比較してCodexの優れたパフォーマンスを示す結果を示し、パフォーマンスに対するモデルのサイズと温度の影響を調査します。

Understanding the Evolution of ChatGPT: Part 3- Insights from Codex and InstructGPT

instructgpt and chatgpt：人間の好みに合わせます

Understanding the Evolution of ChatGPT: Part 3- Insights from Codex and InstructGPT

この記事では、アラインメントをモデルとして、有用性、誠実さ、無害性を示すものとして定義しています。これらの品質が、次の命令、幻覚率、バイアス/毒性などの測定可能な側面にどのように変換されるかを説明します。人間のフィードバック（RLHF）からの補強学習の使用は、人間のフィードバックの収集、報酬モデルのトレーニング、近位ポリシー最適化（PPO）を使用してポリシーを最適化するという3つの段階の概要を説明しています。この記事は、人間のフィードバック収集プロセスにおけるデータ品質制御の重要性を強調しています。結果InstandGPTの改善されたアライメント、幻覚の減少、およびパフォーマンス回帰の緩和を示す結果が示されています。

Understanding the Evolution of ChatGPT: Part 3- Insights from Codex and InstructGPT

概要とベストプラクティス

この記事は、希望の行動の定義、パフォーマンスの評価、データの収集とクリーニング、モデルアーキテクチャの適応、潜在的な負の結果の緩和など、微調整LLMの重要な考慮事項を要約することで締めくくります。これは、ハイパーパラメーターの調整を慎重に検討することを奨励し、微調整プロセスの反復性を強調しています。

以上がChatGptの進化を理解する：パート3- Codexとinstantgptからの洞察の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

摩擦から流れへ：AIがどのように法的作業を変えているかMay 09, 2025 am 11:29 AM

法的技術革命は勢いを増し、法律専門家にAIソリューションを積極的に受け入れるように促しています。受動的抵抗は、競争力を維持することを目指している人にとってはもはや実行可能な選択肢ではありません。なぜテクノロジーの採用が重要なのですか？法律専門家

これはAIがあなたのことを考えており、あなたについて知っていることですMay 09, 2025 am 11:24 AM

多くの人は、AIとの相互作用が匿名であると仮定しており、人間のコミュニケーションとはまったく対照的です。ただし、AIはすべてのチャット中にユーザーを積極的にプロファイルします。すべてのプロンプト、すべての単語が分析および分類されます。 AI Revoのこの重要な側面を探りましょう

繁栄した、AIの準備ができている企業文化を構築するための7つのステップMay 09, 2025 am 11:23 AM

成功した人工知能戦略は、強力な企業文化サポートから分離することはできません。 Peter Druckerが言ったように、事業運営は人々に依存しており、人工知能の成功も依存しています。人工知能を積極的に受け入れる組織の場合、AIに適応する企業文化を構築することが重要であり、AI戦略の成功または失敗さえ決定します。ウェストモンローは最近、繁栄するAIに優しい企業文化を構築するための実用的なガイドをリリースしました。ここにいくつかの重要なポイントがあります。 1. AIの成功モデルを明確にする：まず第一に、AIがどのようにビジネスに力を与えることができるかについての明確なビジョンが必要です。理想的なAI操作文化は、人間とAIシステム間の作業プロセスの自然統合を実現できます。 AIは特定のタスクが得意であり、人間は創造性と判断が得意です

Netflix New Scroll、Meta AI＆＃x27;のゲームチェンジャー、Neuralinkは85億ドルで評価されていますMay 09, 2025 am 11:22 AM

メタはAIアシスタントアプリケーションをアップグレードし、ウェアラブルAIの時代が来ています！ ChatGPTと競合するように設計されたこのアプリは、テキスト、音声インタラクション、画像生成、Web検索などの標準的なAI機能を提供しますが、初めてジオロケーション機能を追加しました。これは、メタAIがあなたがどこにいるのか、あなたがあなたの質問に答えるときにあなたが何を見ているのかを知っていることを意味します。興味、場所、プロファイル、アクティビティ情報を使用して、これまで不可能な最新の状況情報を提供します。このアプリはリアルタイム翻訳もサポートしており、レイバンメガネのAIエクスペリエンスを完全に変更し、その有用性を大幅に改善しました。外国映画への関税の賦課は、メディアや文化に対する裸の力の行使です。実装された場合、これはAIと仮想生産に向かって加速します

AIサイバー犯罪から身を守るために、今日これらの手順を踏んでくださいMay 09, 2025 am 11:19 AM

人工知能は、サイバー犯罪の分野に革命をもたらし、新しい防御スキルを学ぶことを強いています。サイバー犯罪者は、ディープフォーファリーやインテリジェントなサイバー攻撃などの強力な人工知能技術を、前例のない規模で詐欺と破壊に使用しています。過去1年間、グローバルビジネスの87％がAIサイバー犯罪の標的を絞っていると報告されています。それでは、どうすればこの賢い犯罪の波の犠牲者になることを避けることができますか？リスクを特定し、個人および組織レベルで保護対策を講じる方法を探りましょう。サイバー犯罪者が人工知能をどのように使用するか技術が進むにつれて、犯罪者は、個人、企業、政府を攻撃する新しい方法を常に探しています。人工知能の広範な使用は最新の側面かもしれませんが、その潜在的な害は前例のないものです。特に、人工知能

共生ダンス：人工的および自然な知覚のナビゲートループMay 09, 2025 am 11:13 AM

人工知能（AI）と人間の知能（NI）の複雑な関係は、フィードバックループとして最もよく理解されています。人間はAIを作成し、人間の活動によって生成されたデータでそれをトレーニングして、人間の能力を強化または複製します。このai

AIの最大の秘密 - クリエイターはそれを理解していません、専門家は分裂しますMay 09, 2025 am 11:09 AM

人類の最近の声明は、最先端のAIモデルを取り巻く理解の欠如を強調しており、専門家の間で激しい議論を引き起こしました。この不透明度は本物の技術的危機ですか、それとも単により多くのソフへの道の一時的なハードルですか

Sarvam AIによるBulbul-V2：インドの最高のTTSモデルMay 09, 2025 am 10:52 AM

インドは、言語の豊かなタペストリーを備えた多様な国であり、地域間のシームレスなコミュニケーションを持続的な課題にしています。ただし、SarvamのBulbul-V2は、高度なテキストからスピーチ（TTS）Tでこのギャップを埋めるのに役立ちます。

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

mPDF

mPDF は、UTF-8 でエンコードされた HTML から PDF ファイルを生成できる PHP ライブラリです。オリジナルの作者である Ian Back は、Web サイトから「オンザフライ」で PDF ファイルを出力し、さまざまな言語を処理するために mPDF を作成しました。 HTML2FPDF などのオリジナルのスクリプトよりも遅く、Unicode フォントを使用すると生成されるファイルが大きくなりますが、CSS スタイルなどをサポートし、多くの機能強化が施されています。 RTL (アラビア語とヘブライ語) や CJK (中国語、日本語、韓国語) を含むほぼすべての言語をサポートします。ネストされたブロックレベル要素 (P、DIV など) をサポートします。

SecLists

SecLists は、セキュリティテスターの究極の相棒です。これは、セキュリティ評価中に頻繁に使用されるさまざまな種類のリストを 1 か所にまとめたものです。 SecLists は、セキュリティテスターが必要とする可能性のあるすべてのリストを便利に提供することで、セキュリティテストをより効率的かつ生産的にするのに役立ちます。リストの種類には、ユーザー名、パスワード、URL、ファジングペイロード、機密データパターン、Web シェルなどが含まれます。テスターはこのリポジトリを新しいテストマシンにプルするだけで、必要なあらゆる種類のリストにアクセスできるようになります。

EditPlus 中国語クラック版

サイズが小さく、構文の強調表示、コードプロンプト機能はサポートされていません

DVWA

Damn Vulnerable Web App (DVWA) は、非常に脆弱な PHP/MySQL Web アプリケーションです。その主な目的は、セキュリティ専門家が法的環境でスキルとツールをテストするのに役立ち、Web 開発者が Web アプリケーションを保護するプロセスをより深く理解できるようにし、教師/生徒が教室環境で Web アプリケーションを教え/学習できるようにすることです。安全。 DVWA の目標は、シンプルでわかりやすいインターフェイスを通じて、さまざまな難易度で最も一般的な Web 脆弱性のいくつかを実践することです。このソフトウェアは、