検索
ホームページテクノロジー周辺機器AIOpenAI、言語モデルの動作を説明するための新しいツールを開発

言語モデルは、与えられたテキストに基づいて自然言語を生成できる人工知能テクノロジーです。 OpenAI の GPT シリーズ言語モデルは、現在最も先進的な代表的な言語モデルの 1 つですが、IT House は、これらの言語モデルにも問題があることに気付きました。それは、その動作を理解し、予測することが難しいということです。言語モデルの透明性と信頼性を高めるために、OpenAI は、言語モデルのどの部分がその動作に関与しているかを自動的に特定し、それを自然言語で説明できる新しいツールを開発しています。

OpenAI、言語モデルの動作を説明するための新しいツールを開発

このツールの原理は、別の言語モデル (OpenAI の最新 GPT-4) を使用して、他の言語モデル (OpenAI 独自の GPT-2 など) を分析することです。内部構造。言語モデルは多くの「ニューロン」で構成されており、それぞれがテキスト内の特定のパターンを観察し、モデルの次の出力に影響を与えることができます。たとえば、スーパーヒーローに関する質問 (「どのスーパーヒーローが最も有用なスーパーパワーを持っていますか?」など) がある場合、「マーベル スーパーヒーロー ニューロン」により、モデルがマーベル映画の特定のスーパーヒーローに言及する可能性が高まる可能性があります。

OpenAI のツールは、このメカニズムを使用してモデルのさまざまな部分を分解します。まず、評価対象のモデルにテキスト シーケンスを入力し、特定のニューロンが頻繁に「起動」するのを待ちます。次に、これらの非常に活動的なニューロンを GPT-4 に「示し」、GPT-4 に説明を生成させます。解釈の精度を判断するために、GPT-4 にいくつかのテキスト シーケンスを供給し、ニューロンの動作を予測またはシミュレートするように依頼します。次に、シミュレートされたニューロンの動作を実際のニューロンの動作と比較します。

「このアプローチでは、基本的に各ニューロンに対していくつかの予備的な自然言語説明を生成することができ、それらの説明が実際の動作とどの程度一致しているかを測定するスコアも取得できます。」 OpenAI スケーラブル アライメント 「私たちは GPT-4 を次のように使用します。」これは、ニューロンが探しているものの解釈を生成し、その解釈が実際の動作とどの程度一致しているかを評価するプロセスの一部です」とチーム リーダーの Jeff Wu 氏は述べています。 GPT-2 でそれらをコンパイルし、ツール コードとともに GitHub でオープン ソースとしてリリースされるデータセットにコンパイルします。このようなツールは、偏見や有害なスピーチの削減など、言語モデルのパフォーマンスを向上させるために使用される日が来るかもしれません。しかし彼らは、それが本当に役立つようになるまでには、まだ長い道のりがあることも認めています。このツールは、全体のほんの一部である約 1,000 個のニューロンの解釈に自信を持っています。

このツールを実行するには GPT-4 が必要なため、実際には GPT-4 の宣伝であると主張する人もいるかもしれません。しかしウー氏は、それがこのツールの目的ではなく、GPT-4の使用は「偶然」であり、むしろこの分野におけるGPT-4の弱点を示していると述べた。同氏はまた、これは商用アプリケーション向けに作成されたものではなく、理論的にはGPT-4以外の他の言語モデルにも適応できると述べた。

「説明のほとんどは非常に低いスコアを獲得したか、実際のニューロンの動作についてあまり説明していませんでした。」とウー氏は言いました。または 6 つの異なる方法。何かでアクティブ化されますが、明らかなパターンはありません。場合によっては、明らかなパターンがあっても、GPT-4 がそれを見つけることができません。」

より複雑で、より新しい、より大きなモデルは言うまでもなく、または、Web を参照してモデルから情報を取得できます。しかし、後者の場合、Web を閲覧してもツールの基本的な仕組みはそれほど変わらないとウー氏は考えています。彼によると、ニューロンが特定の検索エンジン クエリを実行したり、特定の Web サイトにアクセスしたりする理由を理解するには、少し調整するだけで十分です。

「これにより、他の人が構築して貢献できる自動化された方法で説明可能性の問題を解決する有望な道が開かれることを願っています」とウー氏は述べました。これらのモデル。」

以上がOpenAI、言語モデルの動作を説明するための新しいツールを開発の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
革新を調理する:人工知能がフードサービスを変革する方法革新を調理する:人工知能がフードサービスを変革する方法Apr 12, 2025 pm 12:09 PM

食品の準備を強化するAI まだ初期の使用中ですが、AIシステムは食品の準備にますます使用されています。 AI駆動型のロボットは、ハンバーガーの製造、SAの組み立てなど、食品の準備タスクを自動化するためにキッチンで使用されています

Pythonネームスペースと可変スコープに関する包括的なガイドPythonネームスペースと可変スコープに関する包括的なガイドApr 12, 2025 pm 12:00 PM

導入 Python関数における変数の名前空間、スコープ、および動作を理解することは、効率的に記述し、ランタイムエラーや例外を回避するために重要です。この記事では、さまざまなASPを掘り下げます

ビジョン言語モデル(VLM)の包括的なガイドビジョン言語モデル(VLM)の包括的なガイドApr 12, 2025 am 11:58 AM

導入 鮮やかな絵画や彫刻に囲まれたアートギャラリーを歩くことを想像してください。さて、各ピースに質問をして意味のある答えを得ることができたらどうでしょうか?あなたは尋ねるかもしれません、「あなたはどんな話を言っていますか?

MediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますMediaTekは、Kompanio UltraとDimenity 9400でプレミアムラインナップをブーストしますApr 12, 2025 am 11:52 AM

製品のケイデンスを継続して、今月MediaTekは、新しいKompanio UltraやDimenity 9400を含む一連の発表を行いました。これらの製品は、スマートフォン用のチップを含むMediaTekのビジネスのより伝統的な部分を埋めます

今週のAIで:Walmartがファッションのトレンドを設定する前に設定します今週のAIで:Walmartがファッションのトレンドを設定する前に設定しますApr 12, 2025 am 11:51 AM

#1 GoogleはAgent2Agentを起動しました 物語:月曜日の朝です。 AI駆動のリクルーターとして、あなたはより賢く、難しくありません。携帯電話の会社のダッシュボードにログインします。それはあなたに3つの重要な役割が調達され、吟味され、予定されていることを伝えます

生成AIは精神障害に会います生成AIは精神障害に会いますApr 12, 2025 am 11:50 AM

私はあなたがそうであるに違いないと思います。 私たちは皆、精神障害がさまざまな心理学の用語を混ぜ合わせ、しばしば理解できないか完全に無意味であることが多い、さまざまなおしゃべりで構成されていることを知っているようです。 FOを吐き出すために必要なことはすべてです

プロトタイプ:科学者は紙をプラスチックに変えますプロトタイプ:科学者は紙をプラスチックに変えますApr 12, 2025 am 11:49 AM

今週公開された新しい研究によると、2022年に製造されたプラスチックの9.5%のみがリサイクル材料から作られていました。一方、プラスチックは埋め立て地や生態系に積み上げられ続けています。 しかし、助けが近づいています。エンジンのチーム

AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由AIアナリストの台頭:これがAI革命で最も重要な仕事になる理由Apr 12, 2025 am 11:41 AM

主要なエンタープライズ分析プラットフォームAlteryxのCEOであるAndy Macmillanとの私の最近の会話は、AI革命におけるこの重要でありながら過小評価されている役割を強調しました。 MacMillanが説明するように、生のビジネスデータとAI-Ready情報のギャップ

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

Dreamweaver Mac版

Dreamweaver Mac版

ビジュアル Web 開発ツール

SublimeText3 Linux 新バージョン

SublimeText3 Linux 新バージョン

SublimeText3 Linux 最新バージョン