検索
ホームページテクノロジー周辺機器AIなんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょう

#機械がこの質問について考えることができるかどうかは、潜水艦が泳げるかどうかを尋ねるようなものです。 ——Dijkstra

ChatGPT がリリースされるずっと前から、業界は大規模モデルによってもたらされる変化の匂いをすでに感じていました。

昨年 10 月 14 日、サンタフェ研究所のメラニー・ミッチェル教授とデビッド・C・クラカウアー教授は、arXiv 上で大規模な事前研究が行われるかどうかに関する議論を包括的に調査したレビューを発表しました。訓練された言語モデルは言語を理解できるため、この記事では賛成派と反対派の議論、およびこれらの議論から導き出される広範な知能科学における重要な問題について説明しています。

なんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょう

論文リンク: https://arxiv.org/pdf/2210.13966.pdf

出版ジャーナル: 「Academy of the米国科学アカデミー新聞」 (PNAS)

長すぎて読むことができません:

「理解」を裏付ける主な議論は次のとおりです。言語モデルは、完了する前に理解を必要とする多くの一見タスクを完了できます。

「理解」に対する主な議論は、人間の観点からすると、プロンプト間の微妙な変化を理解できないなど、大規模な言語モデルの理解は非常に脆弱であり、言語モデルには現実世界が存在しないということです。人生経験 彼らの知識を検証するために、マルチモーダル言語モデルはこの問題を軽減する可能性があります。

最も重大な問題は、「理解とは何か」の信頼できる定義をまだ誰も持っておらず、人間の言語モデルの理解能力をテストする方法がわからないことです。このテストは、大規模な言語モデルの理解をテストするのには必ずしも適しているわけではありません。

つまり、大規模な言語モデルは言語を理解できますが、その方法はおそらく人間とは異なるでしょう。

研究者らは、さまざまな種類の理解を深く研究し、さまざまな理解モードの利点と限界を見つけ出し、同時にその結果を統合する新しい知能科学を開発できると信じています。さまざまな理解形式、認知の違いによって生み出されます。

なんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょう

# この論文の筆頭著者であるメラニー ミッチェルは、サンタフェ研究所の教授です。彼女は 1990 年に博士号を取得しました ミシガン大学を卒業し、彼女の指導者はホフスタッター (『ゲーデル、エッシャー、バッハ: さまざまな巨匠のコレクション』の著者) とジョン ホランドでした 彼女の主な研究方向は類推推論、複雑なものですシステム、遺伝的アルゴリズム、セル。

「理解」とは一体何でしょうか?

「理解とは何か」は、哲学者、認知科学者、教育者を常に悩ませてきました。研究者は、「理解力」の基準として人間や他の動物をよく使用します。

最近まで、大規模な人工知能システム、特に大規模言語モデル (LLM) の出現に伴い、人工知能コミュニティでは激しい議論が巻き起こりました。つまり、機械は自然言語を理解し、言語によって記述される物理的および社会的状況を理解できるようになったと言えるでしょうか。

これは純粋に学術的な議論ではありません。機械が世界を理解する程度と方法は、車の運転、病気の診断、介護などのタスクを人間が AI にどの程度信頼できるかに影響します。高齢者や子供の教育など、人間が関連するタスクに対して強力かつ透明性のある行動を取れるようにするためです。

現在の議論は、インテリジェントシステム、特に「統計的相関」と「因果メカニズム」に依存するメンタルモデルにおける理解について、学術コミュニティがどのように考えているかにいくつかの違いがあることを示しています。メンタル モデル)、違いはより明らかです。

しかし、人工知能研究コミュニティでは、機械理解について依然として一般的なコンセンサスが存在します。つまり、人工知能システムは、多くの特定のタスクにおいて一見知的な動作を示しますが、理解できるわけではありません。人間と同じようにデータを処理します。

たとえば、顔認識ソフトウェアは、顔が体の一部であることを理解しておらず、社会的相互作用における顔の表情の役割も理解しておらず、人間がどのように行動するかを理解していません。ほぼ無限の方法で、顔の概念を使用します。

同様に、音声テキスト変換プログラムや機械翻訳プログラムは、処理する言語を理解できません。また、自動運転システムは、ドライバーや歩行者が事故を避けるために使用する微妙なアイコンタクトやボディランゲージを理解できません。 。

実際、これらの AI システムの脆弱性 (予測不可能なエラーや堅牢な一般化の欠如) がよく引用されるのは、AI の理解を評価する際の重要な指標です。

過去数年にわたって、人工知能の分野における大規模言語モデル (LLM) の聴衆と影響力は急増しており、また、人工知能の見通しについて一部の人々の見方を変えてきました。機械による言語の理解。

大規模な事前トレーニング モデルは、基礎モデルとも呼ばれ、数十億から数兆のパラメータ (重み) を持つディープ ニューラル ネットワークであり、大規模な自然言語コーパス (オンライン テキスト、オンライン ブックなどを含む) で使用されます。 「事前トレーニング」を実行した後。

トレーニング中のモデルのタスクは、入力文の欠落部分を予測することであるため、この方法は「自己教師あり学習」とも呼ばれ、結果として得られるネットワークは複雑になります。統計モデル を使用すると、トレーニング データ内の単語やフレーズが互いにどのように関連しているかを取得できます。

このモデルは、自然言語を生成するために使用でき、特定の自然言語タスクに合わせて微調整したり、「ユーザーの意図」によりよく一致するようにさらにトレーニングしたりできますが、専門家以外の人にとっては言語がどのように正確であるかモデルがこれらのタスクを達成できるかどうかは、科学者にとって謎のままです。

ニューラル ネットワークの内部動作はほとんど不透明であり、ニューラル ネットワークを構築する研究者でさえ、この規模のシステムに対する直感には限界があります。

なんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょう

神経科学者の Terrence Sejnowski は、LLM の出現を次のように説明しています。

##あるしきい値を超えると、まるで宇宙人が突然現れて、恐ろしいほど人間的な方法で私たちとコミュニケーションをとることができるようです。現時点で明らかなことが 1 つだけあります。大きな言語モデルは人間ではなく、その行動のいくつかの側面は知性があるように見えますが、もし人間の知性ではないとしたら、その知性の性質は何でしょうか?

理解陣営を支持する VS 理解陣営に反対する

#大規模な言語モデルのパフォーマンスは衝撃的ですが、最先端の LLM は脆弱性や人的ミス以外のミスが依然として発生しやすいです。

ただし、パラメータの数とトレーニング コーパスのサイズが拡大することで、ネットワークのパフォーマンスが大幅に向上していることがわかり、この分野の一部の研究者もこれによって導かれています。十分な大きさのネットワークとトレーニング データセット、言語モデル (マルチモーダル バージョン)、そしておそらくマルチモーダル バージョンが存在する限り、人間レベルの知性と理解につながると主張することはできません。

人工知能の新しいスローガンが登場しました: 必要なのはスケールだけです!

この声明は、人工知能研究コミュニティにおける大規模な言語モデルに関する議論も反映しています:

あるグループは、言語モデルが真に理解できると信じています。言語 を習得しており、一般的な方法で推論することができます(ただし、まだ人間のレベルには達していません)。

たとえば、Google の LaMDA システムはテキストで事前トレーニングされ、その後会話タスクで微調整されるため、非常に幅広いドメインのユーザーと会話できるようになります。

もう一方の学派は、GPT-3 や LaMDA などの大規模な事前トレーニング済みモデルは、言語出力がどれほど流暢であっても、これらのモデルには実践的な経験がなく、世界のメンタルモデルがないため、理解することはできません。 なんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょう

言語モデルは、言語の背後にある意味を学習するのではなく、言語の形式を学習するために、大規模なテキスト コレクション内の単語を予測するようにのみトレーニングされます。

言語のみで訓練されたシステムは、たとえこれから宇宙が滅亡するまで訓練されたとしても、人間の知性に近づくことは決してありません。これらのシステムは浅いレベルの理解にのみ運命づけられており、人間に見られる全身的な思考には決して近づけないことは明らかです。

別の学者は、これらのシステムについて話すとき、知能、エージェント、ひいては拡張についての理解は間違っており、言語モデルは実際には人間の知識の圧縮されたライブラリであると信じています。エージェントよりも図書館や百科事典。

たとえば、人間は身体を持っているので、笑わせるための「かゆみ」が何を意味するかを知っています。言語モデルは「かゆみ」という言葉を使用できますが、明らかにこの感覚を経験したことがありません。 「かゆみ」を理解すると、ある単語が別の単語ではなく感情にマッピングされます。

「LLM は理解できない」側の人々は、大規模な言語モデルの流暢さは驚くべきことですが、その驚きはこれらのモデルの統計的相関に対する自信の欠如を反映していると主張します。それは、スケール上で何が生成できるかについての直観の欠如です。

自然言語処理コミュニティの現役研究者を対象とした 2022 年の調査報告書では、この議論における明確な意見の相違が示されています。

480 人の回答者に、LLM は原則として言語を理解できる、つまり「十分な量の言語が存在する限り、テキストのみで訓練された生成言語モデル」という声明に同意するかどうかを尋ねたところ、

調査結果は半数 (51%) が同意し、残りの半分 (49%) が同意しませんでした。」 。

機械の理解は人間とは異なります

「LLM の理解」議論の双方がそれぞれの見解を裏付ける十分な直観を持っていますが、現在利用可能な認知科学に基づいた理解に関する洞察があります。 LLM に関するこのような質問に答えます。

実際、一部の研究者は心理テスト (もともと人間の理解と推論メカニズムを評価するために設計された) を LLM に適用し、場合によっては、LLM が実際に理論的に人間のように思考していることを発見しました。テストの反応や推論評価における人間のような能力とバイアス。

これらのテストは人間の汎化能力を評価するための信頼できる手段と考えられていますが、人工知能システムの場合はそうではない可能性があります。

大規模な言語モデルには、トレーニング データと入力内のトークンの間の相関関係を学習する特別な機能があり、この相関関係を使用して問題を解決できます。これとは対照的に、人間は、次のような凝縮された概念を使用します。彼らの実世界での経験。

人間向けに設計されたテストを LLM に適用する場合、結果の解釈は、これらのモデルには当てはまらない可能性のある人間の認知に関する仮定に依存する可能性があります。

進歩するには、科学者は、私たちが作り出した新しい形の「奇妙な」知能を含む、さまざまな種類の知能と理解のメカニズムを理解するための新しいベンチマークと検出方法を開発する必要があります。 、心のような存在」、そしていくつかの関連作業がすでに行われています。

モデルが大きくなり、より高機能なシステムが開発されるにつれて、LLM の理解をめぐる議論は、「理解」が意味のあるものになるように、「知能の科学を拡張する」必要性を浮き彫りにしています。人間にとっても機械にとっても。

神経科学者のテレンス・セジノウスキー氏は、LLMの知能に関する専門家のさまざまな意見は、自然知能に基づく古い考え方では十分ではないことを示していると指摘しています。

LLM と関連モデルが、前例のない規模で統計的相関を利用することで成功することができれば、おそらくそれらは、並外れた形式の超人的予測を達成できる「新しい理解の形式」とみなされる可能性があります。 DeepMind の AlphaZero および AlphaFold システムなどの機能は、それぞれチェスとタンパク質構造予測の分野に「エキゾチックな」形式の直観をもたらします。

したがって、近年、人工知能の分野では、とらえどころのない目標を追求する中で、新しい理解モード、おそらくまったく新しい概念を備えたマシンが作成されてきたと言えます。本質的な側面で進歩が見られるにつれて、これらの新しい概念はさらに充実していくでしょう。

広範なコーディング知識を必要とし、高いパフォーマンス要件を必要とする問題では、引き続き大規模な統計モデルの開発が促進される一方、限られた知識と強力な因果メカニズムを持つ問題では、理解が容易になります。人間の知性。

将来の課題は、さまざまな形の知能の詳細な理解を明らかにし、その長所と限界を識別し、これらの真に異なる認知モデルを統合する方法を学ぶための新しい科学的手法を開発することです。 。

参考文献:

https://www.pnas.org/doi/10.1073/pnas.2215907120

以上がなんという騒音でしょう! ChatGPT は言語を理解できますか? PNAS:まず「理解」とは何かを勉強しましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明
この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。
AIのスキルギャップは、サプライチェーンのダウンを遅くしていますAIのスキルギャップは、サプライチェーンのダウンを遅くしていますApr 26, 2025 am 11:13 AM

「AI-Ready労働力」という用語は頻繁に使用されますが、サプライチェーン業界ではどういう意味ですか? サプライチェーン管理協会(ASCM)のCEOであるAbe Eshkenaziによると、批評家ができる専門家を意味します

1つの会社がAIを永遠に変えるために静かに取り組んでいる方法1つの会社がAIを永遠に変えるために静かに取り組んでいる方法Apr 26, 2025 am 11:12 AM

分散型AI革命は静かに勢いを増しています。 今週の金曜日、テキサス州オースティンでは、ビテンサーのエンドゲームサミットは極めて重要な瞬間を示し、理論から実用的な応用に分散したAI(DEAI)を移行します。 派手なコマーシャルとは異なり

Nvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますNvidiaは、AIエージェント開発を合理化するためにNEMOマイクロサービスをリリースしますApr 26, 2025 am 11:11 AM

エンタープライズAIはデータ統合の課題に直面しています エンタープライズAIの適用は、ビジネスデータを継続的に学習することで正確性と実用性を維持できるシステムを構築する大きな課題に直面しています。 NEMOマイクロサービスは、NVIDIAが「データフライホイール」と呼んでいるものを作成することにより、この問題を解決し、AIシステムがエンタープライズ情報とユーザーインタラクションへの継続的な露出を通じて関連性を維持できるようにします。 この新しく発売されたツールキットには、5つの重要なマイクロサービスが含まれています。 NEMOカスタマイザーは、より高いトレーニングスループットを備えた大規模な言語モデルの微調整を処理します。 NEMO評価者は、カスタムベンチマークのAIモデルの簡素化された評価を提供します。 Nemo Guardrailsは、コンプライアンスと適切性を維持するためにセキュリティ管理を実装しています

aiは芸術とデザインの未来のために新しい絵を描きますaiは芸術とデザインの未来のために新しい絵を描きますApr 26, 2025 am 11:10 AM

AI:芸術とデザインの未来 人工知能(AI)は、前例のない方法で芸術とデザインの分野を変えており、その影響はもはやアマチュアに限定されませんが、より深く影響を与えています。 AIによって生成されたアートワークとデザインスキームは、広告、ソーシャルメディアの画像生成、Webデザインなど、多くのトランザクションデザインアクティビティで従来の素材画像とデザイナーに迅速に置き換えられています。 ただし、プロのアーティストやデザイナーもAIの実用的な価値を見つけています。 AIを補助ツールとして使用して、新しい美的可能性を探求し、さまざまなスタイルをブレンドし、新しい視覚効果を作成します。 AIは、アーティストやデザイナーが繰り返しタスクを自動化し、さまざまなデザイン要素を提案し、創造的な入力を提供するのを支援します。 AIはスタイル転送をサポートします。これは、画像のスタイルを適用することです

エージェントAIとのズームがどのように革命を起こしているか:会議からマイルストーンまでエージェントAIとのズームがどのように革命を起こしているか:会議からマイルストーンまでApr 26, 2025 am 11:09 AM

最初はビデオ会議プラットフォームで知られていたZoomは、エージェントAIの革新的な使用で職場革命をリードしています。 ZoomのCTOであるXD Huangとの最近の会話は、同社の野心的なビジョンを明らかにしました。 エージェントAIの定義 huang d

大学に対する実存的な脅威大学に対する実存的な脅威Apr 26, 2025 am 11:08 AM

AIは教育に革命をもたらしますか? この質問は、教育者と利害関係者の間で深刻な反省を促しています。 AIの教育への統合は、機会と課題の両方をもたらします。 Tech Edvocate NotesのMatthew Lynch、Universitとして

プロトタイプ:アメリカの科学者は海外の仕事を探していますプロトタイプ:アメリカの科学者は海外の仕事を探していますApr 26, 2025 am 11:07 AM

米国における科学的研究と技術の開発は、おそらく予算削減のために課題に直面する可能性があります。 Natureによると、海外の雇用を申請するアメリカの科学者の数は、2024年の同じ期間と比較して、2025年1月から3月まで32%増加しました。以前の世論調査では、調査した研究者の75%がヨーロッパとカナダでの仕事の検索を検討していることが示されました。 NIHとNSFの助成金は過去数か月で終了し、NIHの新しい助成金は今年約23億ドル減少し、3分の1近く減少しました。リークされた予算の提案は、トランプ政権が科学機関の予算を急激に削減していることを検討しており、最大50%の削減の可能性があることを示しています。 基礎研究の分野での混乱は、米国の主要な利点の1つである海外の才能を引き付けることにも影響を与えています。 35

オープンAIの最新のGPT 4.1ファミリ - 分析VidhyaオープンAIの最新のGPT 4.1ファミリ - 分析VidhyaApr 26, 2025 am 10:19 AM

Openaiは、強力なGPT-4.1シリーズを発表しました。実際のアプリケーション向けに設計された3つの高度な言語モデルのファミリー。 この大幅な飛躍は、より速い応答時間、理解の強化、およびTと比較した大幅に削減されたコストを提供します

See all articles

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

PhpStorm Mac バージョン

PhpStorm Mac バージョン

最新(2018.2.1)のプロフェッショナル向けPHP統合開発ツール

SAP NetWeaver Server Adapter for Eclipse

SAP NetWeaver Server Adapter for Eclipse

Eclipse を SAP NetWeaver アプリケーション サーバーと統合します。

MinGW - Minimalist GNU for Windows

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポート ライブラリとヘッダー ファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。

VSCode Windows 64 ビットのダウンロード

VSCode Windows 64 ビットのダウンロード

Microsoft によって発売された無料で強力な IDE エディター