ホームページ >テクノロジー周辺機器 >AI >これが ChatGPT の背後で起こっていることです。信じられないほどです。
最近人気のChatGPTです。
多くの人は私がとてもパワフルだと思っていますが、そうではありません。たとえば、次のように尋ねるとします:
今日の北京の天気はどうですか?
申し訳ありませんが、わかりません。GPT4 モデルの知識が 2021 年 9 月で止まっているため、リアルタイムの情報を取得できません。リアルタイムの情報を取得したい場合は、他の方法(プラグインなど)を使用する必要があります。
私の回答の多くは一般的な AI のように感じられますが、私はあなたの質問を本当に理解しており、的を絞った方法で回答しているようです。
これは、多くの人に衝撃を与えた以前のAIとはまったく異なります。
でも、恥ずかしながら、自分の答えの意味がわかりません。ここで私は、すべては確率です。
私は確率に基づいて答えを生成し、あなたとワード ソリティアをプレイしています。
これは信じられないように聞こえますが、本当です。これらの一見論理的な答えは確率に依存しています。
概念は理解できないのですが、単語間の関係を見つけて答えを出力する必要があり、この関係は「ベクトル」で表されます。
たとえば、私の語彙は非常に少なく、「meow」、「woof」、「cat」、「dog」という 4 つの単語が含まれます。それらのベクトルは次のようになります。
ニャー: [0.9, 0.1]
ワンちゃん: [0.1, 0.9]
猫: [0.8, 0.2]
犬: [0.2, 0.8]
2 次元座標で描画:
「ニャー」と「猫」は、間の距離から類似したベクトル表現であることが一目でわかります。 . 比較的近いです。
「樹皮」と「犬」のベクトルも似ており、両者の距離は比較的近いです。
これは、これら 4 つの単語間の意味関係をうまく捉えることができ、将来使用できることを意味します。
「猫」が何なのか、「犬」が何を意味するのかはわかりませんが、「猫」は「ニャー」と、「犬」は「ワン」と密接な関係があることはわかります。十分 。
ここでのベクトルは 2 次元であり、平面内で直観的に見ることができます。実際のアプリケーションでは、豊富な意味情報をより適切に取得するために、ベクトルの次元は数百または数千になる場合があります。あなたの脳では想像できないのではないかと思います。
次に、これらのベクトルはどのように生成されるのかを尋ねる必要があります。
トレーニングのためにデータセットを私に提出する必要があります。
「猫は何を食べるのが好きですか?」と質問されたら、質問内の単語をベクトルに変換します。
「猫」: [0.9, 0.3]
「好き」: [0.5, 0.2]
「食べる」: [0.4, 0.7]
"What": [0.3, 0.8]
"?": [0.1, 0.1]
次に、ベクトルをニューラル ネットワークに入力し、複数層の計算と活性化関数を経た後、 、出力は生成されたベクトルです。
次に、出力ベクトルを確率分布に変換します。
"fish": 0.6
"bone": 0.2
"dog food": 0.1
「チョコレート」: 0.05
「フルーツ」: 0.05
この確率分布では、「魚」の確率が最も高いため、「魚」を次のように選択します。答えの一部です。生成される答えは次のとおりです:
「猫は魚を食べるのが好きです。」
それはとても簡単です。
もちろん、これは単純な答えですが、一般に、答えは非常に長く、単語ソリティアのように、確率によって次の単語を絶えず選択する必要があります。
例: 「なぜ猫は夜に活動するのが好きなのですか?」 この質問に対する答えは次のように生成されます:
あなたは疑問に思っているはずです。これがどのようにして「論理的に」適切な答えを生み出すことができるのでしょうか?
たとえば、元プログラマーの Liu が書いた次の記事:
ChatGPT はプログラマの中核機能を脅かし始めています。
プログラマーの中核的能力が脅かされ始めています、すごいことだと思いませんか?
私に言えるのは、「強さは奇跡を生むことができる」ということだけです。モデルが十分に大きくなると、何かが浮かび上がってきます。
目を閉じて、インターネットのテキスト全体が目の前にあると想像してください。すべての単語を抽出してベクトルに変換します。ニューラル ネットワークでクレイジーな操作を実行して、単語、フレーズ、文章をキャプチャします。 . 異なるコンテキストでの共起関係。この共起関係には、概念、文法構造、共通表現間のつながりが含まれます。
これらの確率分布は、人間の自然言語表現により近い答えを生成するのに役立ちます。
私が学んだ知識は本質的に統計的なものであるため、時には間違いを犯したり、「マジででたらめ」をしたりする可能性があります。
実際、確率ゲームには 2 つの方向があり、1 つは BERT と呼ばれ、もう 1 つは GPT と呼ばれます。
BERT は、空白を埋めて、真ん中の単語を推測するようなものです。
GPT は、エッセイを書いて次の単語を推測するようなものです。
Google は 2018 年に BERT を発表し、NLP 分野で大きなセンセーションを巻き起こしました。 BERT は、質問応答、テキスト分類、感情分析、機械翻訳などのタスクで非常に優れたパフォーマンスを達成しました。
しかし、師匠は GPT の可能性を強く信じ、膨大なコンピューティング リソースとストレージ リソースを投資し、先行きが不透明な状況でも信念を貫き、ついに GPT3.0 で大きなブレークスルーを成し遂げました。そして、誰でも利用できるアプリケーションである I ChatGPT は完全に爆発的に普及しました。
私に言えるのは、状況は変わりつつあるということだけです。
新しいものの爆発期には、誰もが何でもできると思い、好奇心、興奮、混乱、不安など非現実的な空想をたくさん抱くでしょう。
しばらくして、潮が引くと、それはそれほど素晴らしいものではなく、多くの場所でその能力が制限されていることがわかります。
そうすれば、誰かがそれを適切なシナリオに適用し、本当に役立つ製品を開発し、その真の価値を解き放つでしょう。
ChatGPT もこの道をたどる予定ですので、早めに探索を開始して機会を捉えてください。
Code Farmer Qianqian は最近、そのようなことを行うためのナレッジ プラネット「ChatGPT Base」を設立しました:
これは非常に垂直的なプラネットで、プログラマーにサービスを提供することに特化しており、非常に単純な目的を持っています:
1. プログラマが優れたツール ChatGPT をできるだけ早く習得し、その最適な使用方法と作業効率を向上させる最適な方法を見つけられるように支援します。
ChatGPT はプログラマに根本的な影響を与えました:
小さな観点から見ると、ChatGPT の使い方を知らなければ、熟練したプログラマと競争することは間違いなく不可能です。 ChatGPT を使用する場合。自然言語を使用してコードを生成する人もいますが、依然として 1 行ずつ入力することになり、効率は 10 倍、または 100 倍悪くなります。これは、個人の仕事のパフォーマンス、仕事の機会、給与、ボーナスに直接影響します。
ChatGPT をうまく使用するジュニア プログラマーは、中級プログラマー、さらには上級プログラマーと競争できる可能性があります。
今後の採用では、1名追加される可能性が高く、ChatGPTの使用に習熟した方を優先とさせていただきます。
広い意味では、「ある木から別の木へ飛び移る」ことや、「ある暗い森から別の暗い森へ走る」ことにつながるかもしれません。
2. ChatGPT がプログラマーにもたらす機会を探る: iPhone の登場でアプリ開発がもたらされたように、副業を本業に変えましょう。
ChatGPTは、各種研修など多くの業界を再構築することは間違いなく、ChatGPTを「ソクラテス家庭教師」としてパッケージ化すれば、初等教育から教育までをカバーする質の高い家庭教師が24時間付き添うことも十分に可能です。ここには、成人向け IT トレーニングと同様に、間違いなく多くの機会があります。
もちろん、主な目的はこの 2 つですが、プラネットに参加すると、ChatGPT の最先端の情報、高品質なリソースやプロジェクト、ChatGPT のマニアックなゲームプレイなども見ることができます。
以上がこれが ChatGPT の背後で起こっていることです。信じられないほどです。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。