Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました-AI-php.cn

ホームページ

テクノロジー周辺機器

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

王林

Jun 03, 2023 pm 09:27 PM

aitoken

ChatGPT が今でも愚かな間違いを犯すとは思いませんでしたか?

マスター Andrew Ng は最新のクラスでこのことを指摘しました:

ChatGPT は単語を反転させません。

たとえば、lollipop という単語を逆にすると、出力は pilollol となり、完全に混乱を招きます。

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

#ああ、これは確かに少しショックです。

授業を聞いたネチズンが Reddit に投稿すると、すぐに多くの見物人が集まり、投稿はすぐに 6,000 回の再生回数に達しました。

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

これは偶然のバグではなく、ChatGPT が実際にこのタスクを完了できないことがネチズンにわかり、私たちの個人的なテストの結果も同様です。同じ。

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

△実際の ChatGPT (GPT-3.5)

偶数Bard、Bing、Wen Xinyiyan などの製品は動作しません。

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました #△実測値バード

Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました △実測値ウェンXinyi Yan

フォローアップして、ChatGPT はこれらの単純な単語タスクの処理がひどいと不満を言う人もいます。

たとえば、人気の単語ゲーム Wordle をプレイするのは大失敗で、決してうまくいきませんでした。

#え？どうしてこれなの？ Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

鍵はトークンにあります

この現象の鍵はトークンにあります。トークンはテキスト内で最も一般的な文字シーケンスであるため、大規模なモデルではテキストの処理にトークンが使用されることがよくあります。

単語全体または単語の断片を指定できます。大規模なモデルは、これらのトークン間の統計的関係を熟知しており、次のトークンを巧みに生成できます。

したがって、単語を反転するという小さなタスクを扱うときは、文字の代わりに各トークンをひっくり返すだけかもしれません。

これは中国語の文脈ではさらに明らかです。単語はトークンであるか、単語はトークンです。 Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

冒頭の例に関しては、誰かが ChatGPT の推論プロセスを理解しようとしました。 Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

より直感的に理解できるように、OpenAI は GPT-3 Tokenizer もリリースしました。 Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

たとえば、lollipop という単語は、GPT-3 では I、oll、ipop の 3 つの部分として理解されます。 Andrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しました

経験の要約に基づいて、いくつかの暗黙のルールが生まれました。

1 トークン ≈ 4 つの英語文字 ≈ 単語の 4 分の 3;

100 トークン ≈ 75 単語;

1-2 文 ≈ 30 トークン;
段落 ≈ 100 トークン、1500 単語 ≈ 2048 トークン;
単語の分割方法も言語によって異なります。以前に誰かが、中国語で使用されるトークンの数は英語の 1.2 ～ 2.7 倍であると計算しました。
トークン対文字 (トークン対単語) の比率が高くなるほど、処理コストも高くなります。したがって、中国語のトークン化の処理は英語よりもコストが高くなります。

トークンは、大規模なモデルが人間の現実世界を理解するための手段であることが理解できます。これは非常にシンプルで、メモリと時間の複雑さが大幅に軽減されます。

しかし、単語のトークン化には問題があり、モデルが意味のある入力表現を学習することが困難になります。最も直感的な表現は、単語の意味を理解できないことです。

当時、Transformers は対応する最適化を行っていました。たとえば、複雑で一般的ではない単語は、意味のあるトークンと独立したトークンに分割されました。

「迷惑」が「迷惑」と「嘘」の 2 つの部分に分かれているのと同じように、前者は独自の意味を保持し、後者はより一般的です。

これは、人間の言語を非常によく理解できる、今日の ChatGPT やその他の大型モデル製品の驚くべき効果にもつながりました。

単語の反転などの小さなタスクを処理できないことについては、当然解決策があります。

最も簡単で直接的な方法は、自分で単語を分割することです~

または、ChatGPT に段階的に実行させることもできます, まず各文字をトークン化します。

あるいは、文字を反転するプログラムを作成させれば、プログラムの結果は正しくなります。 (犬頭)

# ただし、GPT-4 も使用できますし、実際のテストではそのような問題はありません。

△実測 GPT-4
つまり、トークンは AI による自然言語理解の基礎となります。
AI が人間の自然言語を理解するための橋渡しとして、トークンの重要性がますます明らかになってきています。
これは、AI モデルのパフォーマンスと大規模モデルの課金基準の重要な決定要因となっています。
トークンに関する文献もあります
前述のように、トークンを使用すると、モデルが単語の意味、語順、文法構造など、より詳細な意味情報を取得しやすくなります。シーケンスモデリングタスク (言語モデリング、機械翻訳、テキスト生成など) では、位置と順序がモデルの構築に非常に重要です。
モデルがシーケンス内の各トークンの位置とコンテキストを正確に理解した場合にのみ、コンテンツをより適切かつ正確に予測し、適切な出力を提供できます。
したがって、トークンの質と量はモデルの効果に直接影響します。
今年から大規模なモデルが続々とリリースされるため、トークンの数が重視されるようになり、例えばGoogle PaLM 2の暴露の詳細では、トレーニングに3.6兆トークンを使用したと記載されています。
そして、業界の多くの著名人も、トークンは非常に重要であると述べています。
今年 Tesla から OpenAI に乗り換えた AI 科学者の Andrej Karpathy 氏は、スピーチの中で次のように述べています:

トークンを増やすことでモデルの思考を改善できるようになります。

そして、モデルのパフォーマンスはパラメーターのサイズだけによって決まるわけではないことを強調しました。
たとえば、LLaMA のパラメータサイズは GPT-3 よりもはるかに小さいですが (65B 対 175B)、トレーニングにより多くのトークンを使用するため (1.4T 対 300B)、LLaMA の方が強力です。

モデルのパフォーマンスに直接影響するため、トークンは依然として AI モデルの課金標準です。
OpenAI の価格基準を例に挙げると、1,000 トークン単位で請求され、モデルやトークンの種類によって価格も異なります。

つまり、AI の大規模モデルの分野に足を踏み入れると、トークンが避けられない知識ポイントであることがわかります。

まあ、トークン文献さえ派生しています...

しかし、トークンがどのような役割を果たしているかについては言及する価値があります。中国語圏では何と訳すべきかはまだ完全に決まっていません。

「トークン」の直訳はいつも少し奇妙です。

GPT-4 では、「単語要素」または「タグ」と呼ぶ方がよいと考えていますが、どう思いますか?

参考リンク:
[1]https://www.reddit.com/r/ChatGPT/comments/13xxehx/chatgpt_is_unable_to_reverse_words/
[2]https://help.openai.com/en/articles/4936856-what-are-tokens-and-how-to-count-them
[3]https://openai.com /価格

以上がAndrew Ng の ChatGPT クラスが話題になりました: AI は単語を逆から書くことをやめましたが、世界全体を理解しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明

この記事は51CTO.COMで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

AIインデックス2025を読む：AIはあなたの友人、敵、または副操縦士ですか？Apr 11, 2025 pm 12:13 PM

スタンフォード大学ヒト指向の人工知能研究所によってリリースされた2025年の人工知能インデックスレポートは、進行中の人工知能革命の良い概要を提供します。 4つの単純な概念で解釈しましょう：認知（何が起こっているのかを理解する）、感謝（利益を見る）、受け入れ（顔の課題）、責任（責任を見つける）。認知：人工知能はどこにでもあり、急速に発展しています私たちは、人工知能がどれほど速く発展し、広がっているかを強く認識する必要があります。人工知能システムは絶えず改善されており、数学と複雑な思考テストで優れた結果を達成しており、わずか1年前にこれらのテストで惨めに失敗しました。 2023年以来、複雑なコーディングの問題や大学院レベルの科学的問題を解決することを想像してみてください

Meta Llama 3.2を始めましょう - 分析VidhyaApr 11, 2025 pm 12:04 PM

メタのラマ3.2：マルチモーダルとモバイルAIの前進メタは最近、ラマ3.2を発表しました。これは、モバイルデバイス向けに最適化された強力なビジョン機能と軽量テキストモデルを特徴とするAIの大幅な進歩です。成功に基づいてo

AVバイト：Meta＆＃039; s llama 3.2、GoogleのGemini 1.5などApr 11, 2025 pm 12:01 PM

今週のAIの風景：進歩、倫理的考慮、規制の議論の旋風。 Openai、Google、Meta、Microsoftのような主要なプレーヤーは、画期的な新しいモデルからLEの重要な変化まで、アップデートの急流を解き放ちました

マシンと話すための人的費用：チャットボットは本当に気にすることができますか？Apr 11, 2025 pm 12:00 PM

つながりの慰めの幻想：私たちはAIとの関係において本当に繁栄していますか？この質問は、MIT Media Labの「AI（AHA）で人間を進める」シンポジウムの楽観的なトーンに挑戦しました。イベントではCondedgを紹介している間

PythonのScipy Libraryの理解Apr 11, 2025 am 11:57 AM

導入あなたが科学者またはエンジニアで複雑な問題に取り組んでいると想像してください - 微分方程式、最適化の課題、またはフーリエ分析。 Pythonの使いやすさとグラフィックスの機能は魅力的ですが、これらのタスクは強力なツールを必要とします

ラマ3.2を実行する3つの方法-Analytics VidhyaApr 11, 2025 am 11:56 AM

メタのラマ3.2：マルチモーダルAIパワーハウス Metaの最新のマルチモーダルモデルであるLlama 3.2は、AIの大幅な進歩を表しており、言語理解の向上、精度の向上、および優れたテキスト生成機能を誇っています。その能力t

Dagsterでデータ品質チェックを自動化しますApr 11, 2025 am 11:44 AM

データ品質保証：ダグスターと大きな期待でチェックを自動化するデータ駆動型のビジネスにとって、高いデータ品質を維持することが重要です。データの量とソースが増加するにつれて、手動の品質管理は非効率的でエラーが発生しやすくなります。

メインフレームはAI時代に役割を果たしていますか？Apr 11, 2025 am 11:42 AM

MainFrames：AI革命のUnsung Heroes サーバーは汎用アプリケーションで優れており、複数のクライアントの処理を行いますが、メインフレームは大量のミッションクリティカルなタスク用に構築されています。これらの強力なシステムは、頻繁にヘビルで見られます

See all articles

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

AI Hentai Generator

AIヘンタイを無料で生成します。

ホットツール

MantisBT

Mantis は、製品の欠陥追跡を支援するために設計された、導入が簡単な Web ベースの欠陥追跡ツールです。 PHP、MySQL、Web サーバーが必要です。デモおよびホスティングサービスをチェックしてください。

Dreamweaver Mac版

ビジュアル Web 開発ツール

ZendStudio 13.5.1 Mac

強力な PHP 統合開発環境

MinGW - Minimalist GNU for Windows

このプロジェクトは osdn.net/projects/mingw に移行中です。引き続きそこでフォローしていただけます。 MinGW: GNU Compiler Collection (GCC) のネイティブ Windows ポートであり、ネイティブ Windows アプリケーションを構築するための自由に配布可能なインポートライブラリとヘッダーファイルであり、C99 機能をサポートする MSVC ランタイムの拡張機能が含まれています。すべての MinGW ソフトウェアは 64 ビット Windows プラットフォームで実行できます。